Aleksey Vyazmikin:

Non ho cancellato la data - semplicemente non l'ho salvata per occupare meno spazio nel file - perché ne avresti bisogno?

Bene, il tempo è un segno indiretto della volatilità, che è stagionale nel tempo, ci sono ore di trading attivo e ci sono quelle passive

Aleksey Vyazmikin:

Non puoi salvare i predittori in sequenza in un file e poi semplicemente scaricarli per l'allenamento?

Beh, puoi farlo, ma per addestrare il modello, dovrai caricare la matrice nell'ambiente, e quella sarà la fine )) o meglio prima, nella fase di formazione della matrice con i predicati

Aleksey Vyazmikin:

Il mio campione di allenamento è circa un gigabyte ora - CatBoost può facilmente gestirlo, ma non rischierei di costruire un albero genetico in R...

Wow un concerto non è piccolo, mi chiedo quanti tratti hai?

Che tipo di albero genetico?


Aleksey Vyazmikin:

1)Stai usando il volume, o è solo così comodo con il volume?

2) Non avete bisogno dei parametri ZZ per regolare i predittori?

3) Non capisco la distorsione dei dati - è necessario spostare i dati in modo che alla barra zero si conoscano tutti i dati della barra? Se è così, non hai un'occhiata alla barra dello zero?

1) solo )

2) com'è? E come si regolano i predittori per la ZZ?

3) La candela si sta solo aprendo o qualcosa del genere, è già distorta, dovrebbe essere chiusa, e ci sono un sacco di domande, come fare l'obiettivo e così via (non c'è bisogno di preoccuparsi), se si cambia qualcosa per te, dovresti sempre lasciare l'originale per gli altri.

[Eliminato]  

Ora sto ultimando il MOS sul clustering. Puramente su cluster non sta imparando bene, aggiungerò incrementi alle caratteristiche

un altro esempio


 
Cosa c'è nei grafici?

Avete un bilancio dei grafici con e senza incrementi?

[Eliminato]  
mytarmailS:

Cosa c'è nei grafici?

come con e senza incrementi? sui grafici l'equilibrio?

Traccia e prova, bilanciamento in pip.

Nessun incremento, tutti i cluster.

gli incrementi non danno nulla

 
Cerca di "sfoltire" i grappoli, cioè, puoi far cadere i grappoli lunghi...

Per esempio, avete un vettore di cluster che si basa sul prezzo, il prezzo è "P" cluster "C"


il prezzo è R R R R R R R R R R R R R R R R R R R R

cluster number 11111111122222222221111111111111112222222222222

lasciare solo le transizioni da cluster a cluster

prezzo - R R R R R R R R R R R R R R R R R R R R

cluster number 1111111112222222222111111111111111222222222222222


R R

2 1 2

Se togliamo tutti questi punti critici, potremmo sbarazzarci del rumore e ridurre drasticamente il campionamento.

Prova, l'ho fatto una volta con hmm

[Eliminato]  
Se l'hai già fatto, non ha senso

 
Maxim Dmitrievsky:

Se l'hai già fatto, non ha senso.

Non trarre conclusioni dal nulla.

Prima di tutto era hmm , e in secondo luogo ho fatto un grande miglioramento, ma il problema era diverso...

[Eliminato]  
Troppo una spina nel fianco)

 
Maxim Dmitrievsky:

troppa rottura di palle con un risultato incomprensibile)

R è mezza linea e il tuo lodato python è penoso?

Già...

 
Maxim Dmitrievsky:

Ora sto ultimando il MOS sul clustering. Puramente su cluster non sta imparando bene, aggiungerò incrementi alle caratteristiche

un altro esempio


E cosa c'è di male negli incrementi? Ti danno essenzialmente una velocità basata sul tempo. Ma non posso farlo senza fare una media. Ma se si comincia a prendere in considerazione le medie, diventa rapidamente un labirinto. Ci deve essere una via di mezzo da qualche parte. Non è sufficiente all'ultima spunta e un po' di più.

