L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3012

 
Maxim Dmitrievsky #:

quello che stai dicendo non lo capisce ancora nessuno, secondo me )

Ha chiarito tutto senza parole e in modo semplice, secondo il principio del rasoio di Occam.

No, è solo che quando sono arrivato nel thread e ho iniziato a parlare di eliminare le regole dagli alberi e valutarle, avete riso all'idea.

Ora ho fatto il passo successivo - la creazione di condizioni per la creazione di regole potenzialmente di alta qualità attraverso la valutazione dei segmenti quantistici del predittore, e ancora una volta mi trovo di fronte a un totale fraintendimento.

 
СанСаныч Фоменко #:

Ho scritto alcune volte.

Qui bisogna dire la stessa cosa cento volte per essere ascoltati.

 
Aleksey Vyazmikin #:

No, è solo che quando sono arrivato nel thread e ho iniziato a parlare di eliminare le regole dagli alberi e valutarle, hai riso all'idea.

Ora ho fatto il passo successivo - la creazione di condizioni per la creazione di regole potenzialmente di alta qualità attraverso la stima delle sezioni quantistiche del predittore, e ancora una volta mi trovo di fronte a un totale fraintendimento.

Quindi estrarre semplicemente le regole dall'albero non ti rende felice? In teoria, anche lì è una questione di fortuna, ma a spese del loro numero (di regole) si potrebbe trovare qualcosa.

È più o meno come cercare i parametri di una strategia in un ottimizzatore, ma in modo più elegante.
 
Maxim Dmitrievsky #:

Quindi tirare fuori le regole dall'albero non ti ha reso felice?

Il metodo si è rivelato abbastanza buono, tranne per il fatto che non c'è certezza sull'ulteriore vita delle regole con la loro successiva reincarnazione. A lunghi intervalli più del 50% delle regole selezionate ha mostrato risultati positivi.

Ho utilizzato un albero genetico, che però è molto lento se il campione contiene molti predittori.

Ho quindi deciso di cercare un modo per ridurre la quantità di informazioni da fornire all'albero per l'addestramento. Ho iniziato a cercare modi per evidenziare i dati potenzialmente utili.

Un altro problema è che le foglie/regole sono molto simili in termini di punti di attivazione. E man mano che la base di foglie cresceva, era difficile trovare l'unicità.

Di conseguenza, il design è interessante, c'è qualcosa da migliorare, ma nel mio caso era estremamente lento. In generale, non è adatto per gli esperimenti, ma è interessante per l'implementazione, se l'intero concetto del dispositivo di costruzione TC è pronto.

E naturalmente - non conosco R, ho chiesto ai guru locali e nessuno mi ha aiutato a risolvere i miei compiti.

Ora vorrei aggiungere il campionamento e la selezione forzata del predittore principale (per lista) e il blocco di quello già utilizzato.

 
Aleksey Vyazmikin #:

Il metodo si è rivelato abbastanza valido, tranne per il fatto che non c'è alcuna certezza sull'ulteriore vita delle regole con la loro successiva reincarnazione. A intervalli lunghi, più del 50% delle regole selezionate ha mostrato risultati positivi.

Ho utilizzato un albero genetico, molto lento se il campione contiene molti predittori.

Ho quindi deciso di cercare un modo per ridurre la quantità di informazioni da fornire all'albero per l'addestramento. Ho iniziato a cercare modi per selezionare i dati potenzialmente utili.

Un altro problema è che le foglie/regole sono molto simili in termini di punti di attivazione. E man mano che la base di foglie cresceva, era difficile trovare l'unicità.

Di conseguenza, il progetto è interessante, c'è qualcosa da migliorare, ma nel mio caso era estremamente lento. In generale, non è adatto per gli esperimenti, ma è interessante per l'implementazione, se l'intero concetto del dispositivo di costruzione TC è pronto.

E naturalmente - non conosco la R, ho chiesto ai guru locali e nessuno mi ha aiutato a risolvere i miei problemi.

Ora vorrei aggiungere il campionamento e la selezione forzata del predittore radice (per lista) e il blocco di quello già utilizzato.

Cosa c'entra il catbust, perché ne hai bisogno, ne estrai anche le regole?

Perché non prendere un albero semplice e andare dalla radice ai vertici per regole, dando meno peso alle regole complesse (penalità per la complessità delle regole)?

eseguire ogni regola in un tester su nuovi dati, scartando prima quelle che presentano un grosso errore.

ZY, questo approccio non mi piace ancora intuitivamente, non ho ancora capito perché.
 
Aleksey Vyazmikin #:

E naturalmente - non conosco R,

Lo sento dire da più di un anno.

Si può imparare R in una settimana.

 
Maxim Dmitrievsky #:

Che cosa c'entra il catbust? Perché ne avete bisogno, ne ricavate anche le regole?

CatBoost è una grande velocità per verificare se la direzione delle idee è corretta.

Posso estrarre le regole dal primo albero, ma ovviamente si rivelano in media molto più deboli (ce ne sono di buone, ma molto raramente), quindi per ora ho abbandonato questa idea. Ora c'è un modo alternativo di costruire gli alberi, forse le regole sono più forti, ma non c'è la possibilità di lavorare in MQL5 con un tale modello senza python.

In generale, ho le mie idee su come costruire un modello lento da creare, ma con gli stessi controlli utilizzati per selezionare le foglie. Forse un giorno arriverò alla sua implementazione in codice.

 
Maxim Dmitrievsky #:

perché non prendere un albero semplice e andare dalla radice ai vertici per regola, dando meno peso alle regole complesse (penalità per la complessità delle regole)?

eseguire ogni regola in un tester su nuovi dati, scartando in anticipo quelle che presentano un grosso errore.

ZY, questo approccio non mi piace ancora intuitivamente, non ho ancora capito perché.

La differenza è essenzialmente solo nella quantità di dati e nel carico della CPU quando si applica il modello.

Inoltre, le foglie sono più facili da assemblare raggruppando e distribuendo i pesi (l'ho chiamato erbario :) ).

Per creare le regole si utilizzano molti alberi, il che significa che i segnali si sovrappongono, cosa che non accade con un solo albero.

 
mytarmailS #:

È da più di un anno che lo sento dire.

R si impara in una settimana

A quanto pare non tutti hanno questo talento.

E il codice non è semplice: ho provato a rifarlo, ma su Internet non c'erano abbastanza informazioni per risolvere il problema.

Un altro svantaggio di R è che non esiste una soluzione semplice per la parallelizzazione dei calcoli tra computer.

 
Aleksey Vyazmikin #:

La differenza è essenzialmente solo nella quantità di dati e nel carico della CPU durante l'applicazione del modello.

Inoltre, le foglie sono più facili da assemblare, riunendole in gruppi e distribuendo i pesi (l'ho chiamato erbario :) ).

Per creare le regole si utilizzano molti alberi, il che significa che i segnali si sovrappongono, cosa che non avviene con un solo albero.

Mi rendo conto del perché non mi piace questa idea, perché associazione (regole, ad esempio) = causalità :)