L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 419

 
Va bene, butterò qui qualche informazione. Ilfatto è che ho un'idea di quali dati dovrebbero essere utilizzati per prevedere il mercato, ma purtroppo non posso raccogliere in pieno e nella forma giusta, se qualcuno ha aiutato nell'organizzazione della raccolta, vorrei condividere il suo ottimizzatore, bene, e la strategia nel suo complesso. I dati sono già abbastanza buoni, ma per essere super, dobbiamo aggiungere qualcosa. Chi è forte nella programmazione e nella capacità di ottenere dati online da più siti nel file csv?
 
Mihail Marchukajtes:
Va bene, metto qui le informazioni. Ho una certa idea di quali dati dovrebbero essere utilizzati per fare previsioni di mercato, ma purtroppo non posso raccoglierli per intero e nella forma richiesta. Mi piacerebbe condividere il mio ottimizzatore e la strategia in generale con coloro che mi hanno aiutato nell'organizzazione di questa raccolta. I dati sono già abbastanza buoni, ma per essere super, dobbiamo aggiungere qualcosa. Chi è forte nella programmazione e nella capacità di ottenere i dati online da più siti nel file csv?
Il mio modello si basa su dati multifilari e diversificati. Ho esperienza nel parsing dei dati. Sarei felice di partecipare.
 

Ho scritto nel mio blog sulla scelta dei parametri della rete neurale - SELECTING NEUROSET CONFIGURATION.

Almeno nella fase iniziale è meglio farlo, cioè più tardi, se necessario, si può semplificare il NS.

L'esempio di scelta nel blog è astratto, ma è da considerazioni simili che ho scelto i parametri della mia NS. I risultati dell'apprendimento non sono generalmente male.

Un po' spaventoso è il volume del NS - nell'esempio già per 3 MA, è già più di 100 neuroni, e non è ancora un TS, ma solo un modello per esso.

 
Yuriy Asaulenko:

Ho scritto nel mio blog sulla scelta dei parametri della rete neurale - SELECTING NEUROSET CONFIGURATION.

Almeno nella fase iniziale è meglio farlo, cioè più tardi, se necessario, si può semplificare il NS.

L'esempio di scelta nel blog è astratto, ma è da considerazioni simili che ho scelto i parametri della mia NS. I risultati dell'apprendimento non sono generalmente male.

Un po' paura del volume di NS - nell'esempio per 3 MA, è già più di 100 neuroni, e non è ancora un TS, ma solo un modello per esso.

Proviamo in questo modo - nel fine settimana o la prossima settimana lancerò qui dei predittori interessanti, e voi mi direte la vostra opinione su di loro. Solo i predittori sotto forma di indicatori in MT5, 4 di loro

Cercherò di usarli come predittori nel trading, e avrò l'opportunità di organizzare una sfida - che sarà in grado di insegnare a NS a guadagnare con questi predittori :) Non li ho ancora imparati, ma non ho sperimentato finora.

 
Maxim Dmitrievsky:

Proviamo in questo modo - nel fine settimana o la prossima settimana posterò qui dei predittori interessanti e voi darete la vostra opinione su di essi...? Solo i predittori sotto forma di indicatori in mt5, 4 di loro

Sarà possibile organizzare una sfida - chi sarà in grado di insegnare a NS a guadagnare con questi predittori :) Ma per ora non posso insegnare a MP a fare trading con profitto usandoli.

(Beh, ho ancora molta strada da fare prima di iniziare il vero trading). L'ho fatto per più di un mese.

Se voglio usare i vostri indicatori, sarà interessante, ma non userò i miei. Tuttavia, la base (la versione iniziale del 2008) può essere trovata qui -ButterworthMoving Average - indicatore per MetaTrader 4. Naturalmente, ora tutto è stato fatto in modo diverso.

 
Yuriy Asaulenko:

Beh, ho ancora molta strada da fare prima di poter davvero commerciare). Lo sto facendo da più di un mese ormai.

Se avete un buon Expert Advisor, mi sarà utile. Tuttavia, la base (la versione iniziale del 2008) può essere trovata qui -ButterworthMoving Average - indicatore per MetaTrader 4. Naturalmente, ora è tutto diverso.


Sì, lo farò, solo perché a volte il mio cervello diventa un tubo e ho bisogno dell'opinione degli altri :)
 

Non voglio far arrabbiare nessuno, ma ahimè la maggior parte di voi non sa come preparare correttamente gli obiettivi. Tutti quei risultati ispiratori (75-80% di precisione) su chip da candele lente (>10min) sono in realtà puramente sudici. La precisione del 55% è sufficiente per rendere Sharpe Ratio superiore a 2, e la precisione del 60% su dati lenti è lo stesso graal, che è la leggenda, Sharpe Ratio 3-4, nessuno commercia così sul reale, solo i ragazzi HFT, ma hanno una scala diversa di costi di trading, c'è meno SR <2 non è redditizio.

In breve...

Non puoi vedere il bersaglio (oi bersagli)!

In altre parole, quando si calcola l'obiettivo, non si possono usare i dati che sono MAI stati usati nel calcolo delle caratteristiche, altrimenti il risultato sarà un poky. Per ovvi motivi, un tale "gioco di prestigio" come ZZ va all'inferno, interpola tra gli estremi molto in zona dove sono calcolate le caratteristiche, il risultato è esorbitante, almeno il 90% di precisione senza problemi, ma è un falso. Questa è la base per le discussioni oscurantiste di "la previsione non è la cosa principale", dovremmo ancora sviluppare TS, ecc. Quindi, di fatto questi "90%" sono ancora lo stesso "amato" 50%.


Sii ragionevole :)

 
Aliosha:


In breve...

NON VEDERE il bersaglio(caratteristiche)!

In altre parole, quando si calcola l'obiettivo, non si possono usare dati che sono MAI usati nel calcolo delle caratteristiche, altrimenti il risultato sarà uno sweep. Per ovvi motivi, un tale "gioco di prestigio" come ZZ va all'inferno, interpola tra gli estremi molto in zona dove sono calcolate le caratteristiche, il risultato è esorbitante, almeno il 90% di precisione senza problemi, ma è un falso. Questa è la base delle discussioni oscurantiste su "la previsione non è importante", si dovrebbe comunque sviluppare il TS, ecc. Quindi, di fatto questi "90%" sono ancora lo stesso "amato" 50%.


Sii ragionevole :)

Non posso essere d'accordo con le tue conclusioni su ZZ, così come le tue conclusioni in generale.

RSI per esempio. Che interpola ZZ o viceversa in questo particolare predittore. Nel frattempo posso mostrare che l'RSI come predittore per ZZ non ha una cattiva capacità predittiva. E, per esempio, l'ondulazione non ha alcuna capacità predittiva per ZZ ed è 100% rumore per ZZ - completamente inutile come predittore. È possibile ottenere un modello basato su mashka con meno del 10% di errore, ma se si esegue questo modello addestrato su un nuovo file non associato a un file di allenamento, si otterrà un errore arbitrario.

Oltre al problema che hai menzionato che ci sono predittori tra i predittori per una RZ da cui questa stessa RZ è derivata, c'è un altro problema che è fondamentale e indipendente dalla variabile target: è il problema che il predittatore NON è legato alla variabile target è il rumore per una particolare (la RZ non fa eccezione) variabile target. Il rumore è un predittore molto conveniente. È sempre possibile trovare valori tra i valori di rumore che riducono l'errore di predizione. Quando non ho capito questo, ho avuto molto spesso un errore di previsione intorno al 5%.

Ma se si è in grado di pulire il set iniziale di predittori dal rumore per una particolare variabile target, allora è estremamente difficile ridurre l'errore sotto il 30%, almeno per me.

In conclusione: i predittori di rumore che sono rumore per una particolare variabile target portano a un sovrallenamento e ZZ non fa eccezione.

 
SanSanych Fomenko:

Non posso essere d'accordo con le sue conclusioni su ZZ, né con le sue conclusioni in generale.

RSI per esempio. Che interpola ZZ o viceversa in questo particolare predittore. Nel frattempo posso mostrare che l'RSI come predittore per ZZ non ha una cattiva capacità predittiva. E, per esempio, l'ondulazione non ha alcuna capacità predittiva per ZZ ed è 100% rumore per ZZ - completamente inutile come predittore. È possibile ottenere un modello basato su mashka con meno del 10% di errore, ma se si esegue questo modello addestrato su un nuovo file non associato a un file di allenamento, si otterrà un errore arbitrario.

Oltre al problema che hai menzionato che ci sono predittori tra i predittori per una RZ da cui questa stessa RZ è derivata, c'è un altro problema che è fondamentale e indipendente dalla variabile target: è il problema che il predittatore NON è legato alla variabile target è il rumore per una particolare (la RZ non fa eccezione) variabile target. Il rumore è un predittore molto conveniente. È sempre possibile trovare valori tra i valori di rumore che riducono l'errore di predizione. Quando non ho capito questo, ho avuto molto spesso un errore di previsione intorno al 5%.

Ma se si è in grado di pulire il set iniziale di predittori dal rumore per una particolare variabile target, allora è estremamente difficile ridurre l'errore sotto il 30%, almeno per me.

In conclusione: il sovrallenamento è causato da predittori che sono rumore per una particolare variabile target e ZZ non fa eccezione.


Bene! Facciamo un dibattito su questo argomento estremamente importante. Suggerisco di condurre una serie di esperimenti per andare a fondo della questione.

Quindi, io sostengo:

1) Corretta, sintesi delle caratteristiche e classificazione da un fascio casuale di serie temporali, in 2 classi, dà il 50% di precisione (come una moneta), con abbastanza campioni (da 5-10k). Se c'è una distorsione statisticamente significativa nell'accuratezza (>51%), allora ci sono errori nel processo di sintesi e/o classificazione delle caratteristiche.

2) Quando si usano obiettivi che utilizzano dati usati nel calcolo delle caratteristiche, si ottengono distorsioni significative nella precisione (55, 60, 90%) SU TEMPI CASUALI che a priori non possono essere previsti (50%). Il che significa che questo dolore è falso.

 
Aliosha:


2) Quando usiamo i dati di targeting utilizzati nel calcolo dei tratti, otteniamo una distorsione significativa nella precisione (55, 60, 90%) SU TEMPI CASUALI che non possono essere previsti a priori (50%). Il che significa che questo misuratore è falso.

E perché controllare qualcosa? Per me è ovvio.

Ho dato un esempio di RSI-ZZ - niente in comune, e si può costruire un modello con meno del 50% di errore.

Un altro esempio: mashka-ZZ - facilmente meno del 10% di errore. Quando viene testato su un nuovo file un risultato completamente arbitrario.

Motivazione: