L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 48

 
Dr.Trader:

Ho sperimentato con RNeat per un po', e ho concluso che non può essere gestito allo stesso modo delle reti neurali convenzionali.

Grazie per aver condiviso le tue scoperte, è molto interessante...

Ho preso il tuo esempio con gli iris e l'ho riscritto per adattarlo ai miei dati e ho ottenuto un errore, cosa c'è di sbagliato che non capisco. Voglio sapere se hai provato a usare i tuoi dati oltre all'iride, qual è stato il risultato rispetto alla griglia regolare?

 
Articolo interessante sulla valutazione dei modelli di classificazione.
 
Dr.Trader:

Ho sperimentato un po' di più con RNeat e sono arrivato alla conclusione che non può essere gestito allo stesso modo delle reti neurali convenzionali.

1) A differenza dei modelli convenzionali, l'addestramento RNeat non utilizza dati grezzi. Il modello viene generato in modo casuale, migliorato e solo alla fine viene testato sui dati grezzi. Tipicamente, i modelli usano dati grezzi, costruiscono la loro logica su di essi, e poi usano il campionamento di convalida per vedere se la logica del modello è corretta, o se ha semplicemente imparato gli esempi grezzi. A differenza degli altri, RNeat non è affatto capace di memorizzare i dati grezzi, perché non li conosce, tutto ciò che il modello conosce sono i risultati richiesti e quanto si avvicina ad essi.

2) La validazione incrociata non aiuterà a migliorare i risultati del fronttest. Sembriamo tutti d'accordo sul fatto che è possibile addestrare un modello regolare, eseguire un paio di crossvalidazioni, e in qualche modo gestire gli errori su tutti i campioni per il punteggio finale di fitness del modello. Poiché RNeat non conosce i dati grezzi, non gli importa se i dati sono in un campione di allenamento o di prova, adeguerà la sua logica al risultato desiderato in ogni caso. Teoricamente "imparerà" (più precisamente muterà :) ) da tutti i campioni che sono usati nella funzione di fitness. Tutto quello che si può fare è addestrare il modello alla giusta precisione e sperare che non si sovralleni, un approccio piuttosto rischioso per il forex. La validazione incrociata può essere usata solo dopo l'addestramento come stima finale del possibile risultato nel fronttest, e in nessun modo usare questo campione di validazione all'interno della funzione di fitness.

Sulla crossvalidazione, i parametri di allenamento sono raccolti. Ci sono dei parametri in questo NS? Dovrebbe esserci.
 
mytarmailS:

Per favore ditemi, avete sicuramente provato a sostituire i vostri dati oltre all'iride, quali sono stati i risultati rispetto alla rete normale?

Ho usato i dati del forex (eurusd d1 per un anno), il modello sta imparando già da un giorno, mostra la propria migliore stima = 0,017 (più è, meglio è, per iris era 0,7). Finora nessun risultato reale, il modello mostra un errore del 50% anche sui dati di allenamento e devo lasciarlo imparare ancora per un paio di giorni.

Alexey Burnakov:
Su crossvalidazione i parametri di allenamento sono raccolti. Ci sono dei parametri in questo NS? Ci devono essere.

Il modello diventa sempre più complicato e aggiunge sempre più neuroni. C'è un parametro che definisce il numero massimo di neuroni per limitare la loro crescita. E un secondo parametro che definisce il numero di individui nella genetica. Di solito entrambi più sono meglio è, un limite è introdotto piuttosto per risparmiare memoria e tempo, è meglio usare il valore massimo consentito per se stessi invece di raccogliere.

Il modello, a giudicare dalle descrizioni, ha un prezzo per ogni neurone e le connessioni tra di loro, quindi cerca di utilizzare il minor numero possibile di neuroni. Se l'addestramento ha successo, il modello raggiungerà l'accuratezza richiesta prima di raggiungere il numero massimo di neuroni.

 
Dr.Trader:

Ho aggiunto i dati del forex (eurusd d1 per un anno), il modello sta imparando già da un giorno e mostra la propria migliore stima = 0,017 (più sono meglio è, per Iris era 0,7). Il modello mostra un errore del 50% anche sui dati di allenamento e devo lasciarlo imparare ancora per qualche giorno.

ci sono molti predittori?
 
SanSanych Fomenko:
Articolo interessante sulla stima dei modelli di classificazione.

Ho provato 3 diverse metriche per stimare il modello su un sottoinsieme di predittori: Accuratezza come in questo articolo; modello R^2; e solo errore medio del modello mean(abs(y-x)/(max(y)-min(y)), dove X è il vettore dei risultati di predizione e Y sono i risultati richiesti).

La precisione per le funzioni di fitness era ok, ma ho avuto un problema con non molti esempi nel campione, la precisione esce molto sfalsata. Due modelli, simili per qualità, hanno dato lo stesso risultato. Ma se ci sono molti campioni di allenamento e di convalida, sarebbe una buona metrica. Non posso dire nulla sulle altre metriche descritte nell'articolo.

R^2 si comportava in modo strano, poteva anche essere negativo anche se più del 50% dei risultati erano corretti, in generale non mi piaceva.

L'errore medio mi è piaciuto di più. Stepwise come nella precisione non è presente, perché sostituisco nella formula il risultato della regressione, anche prima di arrotondare alle classi 0 o 1. Anche se due modelli danno lo stesso risultato per le classi, posso ancora determinare il migliore, in termini di quanto il risultato della regressione è "più vicino" ai risultati desiderati.

mytarmailS:
Ci sono molti predittori?

Circa 400

 
Qualcuno di voi sa qualcosa sull'analisi spettrale di Fourier? Ho bisogno di aiuto.
 
mytarmailS:
Ragazzi qui che conoscono almeno un po' l'analisi spettrale di Fourier. Ho bisogno di aiuto.
Cosa non è così chiaro? Decomporre una funzione periodica in armoniche e ottenere uno spettro.
 
Yury Reshetov:
Perché non è chiaro? Decomponiamo una funzione periodica in armoniche e otteniamo uno spettro.

È vero, ma il mio compito è diverso...

Ho bisogno di trovare somiglianze in BP quelle aree che sono vicine l'una all'altra, la vicinanza può essere misurata dalla correlazione, dalla metrica euclidea, ecc... Secondo i miei esperimenti ho capito che tali metriche non sono adatte al mio compito, penso che si adattino molto bene alla ricerca di prossimità attraverso l'ampiezza, la fase, la frequenza... Ma come tale è fatto nessuna idea, quindi chiedo chi sa come e cosa, cosa è corretto, cosa non è, come dovrebbe essere in generale.

P.S. è possibile in privato, non per off-point, in linea di principio, la conversazione non è sul tema di questo ramo ed è improbabile che qualcuno interessante

 
Yury Reshetov:
Cosa non è chiaro lì? Decomponiamo una funzione periodica in armoniche e otteniamo uno spettro.
Perché periodico?
Possiamo anche decomporre un singolo impulso, che non è affatto periodico)
Motivazione: