Aleksey Vyazmikin:

Il sovracampionamento non dà nulla finora, ma il "tomo" ha migliorato un po' il risultato - significa che c'è qualcosa nei dati, l'importante è scavare bene.

Istogramma dei modelli con diverse impostazioni di quantizzazione sul campione.


Crea un confine migliore tra le classi. Anche i dati dovrebbero esserlo, in modo che la separazione in classi sia chiara e gli esempi non si sovrappongano.

e so anche come farlo... un po' intelligente, ma non l'ho ancora fatto
 
Maxim Dmitrievsky:

Mi chiedo come? Nel nostro campo, di solito le classi possono essere descritte come uniformemente miste.

 
Maxim Dmitrievsky:

Maxim Dmitrievsky:
Aggiungere il clustering al campionamento delle etichette. Clustering per gli stessi attributi, poi campionamento con i cluster. Le classi saranno separate, ma non è chiaro cosa succederà con i nuovi dati. Dovrebbe migliorare, in teoria.

Così ho coperto questa idea qui questa settimana :)

Suggerisco solo di diminuire il numero di classi principali.

Aleksey Vyazmikin:

Non ho visto
 
Maxim Dmitrievsky:
Ci sono metodi/strumenti che possono farlo automaticamente?

Aleksey Vyazmikin:

Non so, devo vedere. Forse questo fine settimana darò un'occhiata.
 
Maxim Dmitrievsky:
Fammi sapere se lo trovi, altrimenti inizierò a costruire la mia moto :)

Elibrarius ha suggerito un'idea: basta costruire un albero ramificato e usarlo al posto del clustering, prendendo informazioni dalle foglie per ridurre la classe di maggioranza.

 

Futuri attuali - formazione completata nel 2018. Troppo bello.

Ed ecco lo stesso schema negli ultimi futures. Qui è più triste, ma sopportabile.

Ancora più vicino alla fine dell'allenamento vediamo i futuri. Ed è qui che sta il problema.

E non capisco cosa stia succedendo - sembrerebbe che più ci si avvicina alla fine dell'allenamento, migliori dovrebbero essere i risultati, ma è il contrario - un'anomalia!

 

La risposta sembra risiedere nella tendenza stessa - futures attuali senza MO

Ultimo

e anche

Oh, questo è MO!?

 
No, in percentuale c'è un tipo di curva di apprendimento - senza MO, il 40%-45% è redditizio, e con MO il 60%-65%. Ma per il trading non è un indicatore a meno che il profitto non sia uguale alla perdita.
