L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1290

 
Aleksey Vyazmikin:

Questo si adatta facilmente alla mia teoria sul mercato. Semplicemente, qualcuno con molti soldi ha acceso il suo algoritmo per la selezione delle posizioni/operazioni, qualche grande banca, forse la Banca Centrale, naturalmente questo non viene fatto rapidamente, ma siccome questo partecipante era dominante e la situazione del mercato ha contribuito a questo, è stato possibile trovare segni del suo algoritmo. Naturalmente, dopo che il partecipante ha smesso di influenzare il mercato, i segnali hanno smesso di funzionare. Ci sono molti di questi partecipanti (forse 100), i loro algoritmi possono sovrapporsi, ma c'è un presupposto che sono simili (ricordate l'analisi tecnica e i requisiti per le banche di giustificare le loro operazioni di trading basate su tale analisi (almeno in Russia)), e per questo motivo ha senso analizzare un grande campione, dove uno stesso algoritmo viene eseguito più volte, poi c'è la possibilità di capire come funziona, descrivere i suoi segni indiretti, ma il modello deve imparare a identificarlo e non lavorare sul rumore in questo momento, in attesa che l'algoritmo si accenda, sotto il quale Penso che questo funzionerebbe ancora meglio su azioni e derivati, non faccio MO sul forex.

Ma la linea di fondo è che abbiamo bisogno di trovare modelli di 10 che descrivano l'algoritmo per i grandi individui di denaro, e imparare a determinare quale algoritmo è preferibile. Poiché il ciclo dell'algoritmo può essere di un paio di giorni e probabilmente sarà ripetuto per un breve periodo di tempo, va bene se entriamo con un piccolo ritardo, la cosa principale è scegliere il modello giusto per questo algoritmo.

Non so come trovare 10 modelli. Ma il fatto che l'informazione che entra nel mercato è strutturata in un ciclo che ha un inizio, una continuazione e una fine è certo

Il punto di biforcazione è esattamente il momento dell'impatto di una nuova porzione esplosiva di informazione, che viene poi strutturata nel tempo. Un disturbo che si disperde in cerchi (onde) per un certo tempo.

Questo è il motivo per cui, per esempio, i modelli all'interno dei contratti futures sono più forti che all'interno di diversi contratti futures.

 
Maxim Dmitrievsky:

sulla storia esiste, non so come algoritmarlo

Può anche esistere nella storia. È possibile rilevarlo in tempo reale e in tempo? Se è sconosciuto, allora non è nemmeno certo che la soluzione esista.

Di solito controllo queste cose con le statistiche. Per la maggior parte, i risultati non sono nulla). Si può vedere con gli occhi, ma le statistiche dicono che non c'è niente - un riflesso apparente della luna apparente).

 
Yuriy Asaulenko:

Sulla storia, può anche esistere. È possibile rilevare in tempo reale, e in tempo, anche questo? Se è sconosciuto, non è affatto certo che esista una soluzione.

Di solito controllo queste cose con le statistiche. Per la maggior parte, i risultati non sono nulla). Si vede con gli occhi, ma le statistiche dicono che non c'è niente - un riflesso apparente della luna apparente).

Se guardate il grafico, potete farlo con i vostri occhi, io non posso farlo programmaticamente.

 
Maxim Dmitrievsky:

Non so come trovare 10 modelli. Ma il fatto che le informazioni che entrano nel mercato siano strutturate in un ciclo che ha un inizio, una continuazione e una fine è certo.

Per questo è necessario abbandonare gli algoritmi di flip e insegnare al modello a non essere sempre sul mercato. La mia strategia permette di farlo e ora sto sperimentando in questa direzione con i modelli di catbust. Purtroppo le foglie dell'albero che ho conservato per mezzo anno non possono più essere applicate, poiché ho apportato alcune modifiche ai predittori (c'erano errori nella logica e ritardi livellati all'apertura delle barre - cioè il problema del calcolo era nei ritardi in tempo reale), ma lavorare con loro conferma che c'è la possibilità di rilevare modelli che sono più accurati individualmente del potere predittivo dell'albero/foresta, e quindi la loro combinazione dà buoni risultati.

Maxim Dmitrievsky:

E il punto di biforcazione è proprio quando viene esposta una nuova porzione esplosiva di informazione, che viene poi strutturata nel tempo. Un disturbo che si disperde in cerchi (onde) per un certo tempo.

Questo è il motivo per cui, per esempio, i modelli all'interno dei contratti futures sono più forti che in diversi contratti futures, è stato notato.

Quindi è necessario identificare questi punti, forse dovrebbero essere resi obiettivi. E un modello li identifica, e a seconda dell'obiettivo si seleziona un modello di trading appropriato. Un'altra cosa è che dovremmo di nuovo pensare ai predittori e alla convoluzione dei dati, per esprimere il periodo di inizio del ciclo in una linea, quando il periodo stesso può essere fissato in (tutto), diciamo, 10 barre.

 
Maxim Dmitrievsky:

Se lo metti nel grafico, puoi farlo con gli occhi, non posso farlo programmaticamente.

Programmaticamente, è una storia molto lunga.

Il sistema precedente aveva >30 condizioni (parametri) per l'ingresso Long, lo stesso per i corti, e un po' meno per le uscite. C'è stato molto lavoro, compresa la costruzione di molti set, e la loro separazione, l'eliminazione di qualsiasi accordo con condizioni aggiuntive incluse nei set, ecc.

 
Aleksey Vyazmikin:
Yuriy Asaulenko:

Programmaticamente, è una storia molto lunga.

Il sistema precedente aveva >30 condizioni (parametri) per l'ingresso Long, lo stesso per i corti, e un po' meno per le uscite. C'è stato molto lavoro, compresa la costruzione di molti set, e la loro separazione, l'eliminazione di qualsiasi mestiere che cade fuori dai set con condizioni aggiuntive, ecc.

Quindi dobbiamo identificare questi punti, forse dovrebbero essere resi obiettivi. E un modello identifica questi punti e l'altro seleziona il modello di trading corrispondente a seconda di quello di destinazione. Un'altra cosa è che dovremmo ripensare ai predittori e alla convoluzione dei dati, per esprimere il periodo di inizio del ciclo in una linea, quando il periodo stesso può essere impostato in (tutto), diciamo, 10 barre.

Beh, è chiaro che si tratta di una fregatura, nessuno discute ))

 
A proposito del catbucht, si è scoperto che è possibile eseguire più di un'elaborazione su GPU tramite batch, cioè eseguire due batch in una volta sola, chiamando l'applicazione console. E in questo caso, almeno sui miei modelli, la velocità della GPU per produrre modelli non cambia, il che significa che è possibile parallelizzare i calcoli. Il limite e le limitazioni non sono ancora pienamente compresi. Butta il tuo alglib, e andiamo a torturare catbust ;)
 
Aleksey Vyazmikin:
A proposito di catbucht, si è scoperto che su GPU è possibile eseguire più di un'elaborazione via batch, cioè eseguire due batch contemporaneamente, chiamando l'applicazione console. E in questo caso, almeno sui miei modelli, la velocità della GPU per produrre modelli non cambia, il che significa che è possibile parallelizzare i calcoli. Il limite e le limitazioni non sono ancora pienamente compresi. Butta il tuo alglib, e andiamo a torturare catbust ;)

il software è sorprendentemente buono (a differenza di tutto il resto di Yandex), utilizza persino il CERN per elaborare i dati del collisore

non c'è ancora tempo, forse più tardi

 
Aleksey Vyazmikin:

C'è anche un bel software KNIME per tutti i tipi di potenziamento, analisi dei dati e visualizzazione

è possibile segare xgboost senza programmazione, catboost sembra essere anche possibile da aggiungere

KNIME - Open for Innovation
KNIME - Open for Innovation
  • 2019.01.28
  • www.knime.com
KNIME, the open platform for your data.
 
Maxim Dmitrievsky:

il software è sorprendentemente buono (a differenza di tutto il resto di Yandex), utilizza persino il CERN per elaborare i dati del collisore

Non ho ancora tempo, forse più tardi.

Penso che ci sia un contributo importante dal codice open source, che viene periodicamente corretto e vengono aggiunte nuove versioni. Eh, se potessi leggere quel codice... mi sembra che ci sia una serie di idee che puoi prendere in prestito e sviluppare tu stesso, inventando la tua spinta.


MaximDmitrievsky:

C'è anche un bel software KNIME che potenzia, analizza e visualizza i dati

si può scrivere xgboost senza programmare, anche catboost sembra essere in grado di aggiungerlo!

Grazie! Per ora il catboost mi basta perché ho debuggato l'intero ciclo dalla creazione del campione all'implementazione in Expert Advisor. E a differenza del bridging via python, posso usare l'ottimizzazione per testare diversi modelli, le loro combinazioni e solo le interpretazioni delle "probabilità" che producono.

Anche se non posso lavorare esattamente con segni categorici (funzione CatBoost) - non ho tale interprete di modelli, ma la mia ricerca preliminare ha dimostrato che l'uso di tali modelli dà più stabilità sugli intervalli di tempo, cioè i modelli sono migliori, anche se l'addestramento è 5 volte più lento.

Motivazione: