C'è uno schema nel caos? Proviamo a trovarlo! Apprendimento automatico sull'esempio di un campione specifico. - pagina 3

 
Aleksey Vyazmikin #:

È possibile verificare il modello esattamente sul file exam.csv?

Hai provato a fare qualche manipolazione con il campionamento?

Ecco il bilancio del campione d'esame dopo aver eliminato alcuni predittori.

Naturalmente, i grafici della distribuzione delle risposte del modello mostrano che è stato fatto solo un po' di addestramento: il richiamo è molto basso, ma è già un buon risultato.

treno.csv


esame.csv

Ci sono 9046 righe nell'esame. Io ne ho 9000. La differenza sarà quasi nulla.

La tua curva è molto migliore. Proverò a modificare ancora un po' i parametri.
 
elibrarius #:

Qual è il miglior equilibrio che avete?

Ora ho cercato in diverse varianti, è venuto fuori che questo risultato - c'è anche sul giro della commissione 3 punti sono presi sull'idea.


 
elibrarius #:
Ci sono 9.046 linee. Io ne ho 9000. Non farà molta differenza.

Hai una curva molto migliore. Proverò a modificare ancora un po' i parametri.

Se si tratta dei dati del file d'esame, allora sì, non c'è molta differenza, ma ho pensato che forse si tratta del file del treno. Hai unito i tre file originariamente?

Provare.

 
Aleksey Vyazmikin #:

Beh, se si tratta dei dati del file d'esame, allora sì - non fa molta differenza, ho solo pensato che potesse essere il file del treno. Hai unito i tre file originariamente?

Provi.

Sì, li ho uniti tutti e tre, poi ho solo specificato la lunghezza delle sezioni.
 
elibrarius #:
Sì, li combino tutti e tre, poi inserisco solo le lunghezze delle sezioni.

Capisco, allora va bene.

Penso che ci sia la possibilità di migliorare l'addestramento riducendo il campione, diciamo per addestrare su 1/10 - questo permetterà di addestrare alcune fasi/strutture del mercato - non l'ho ancora richiesto.

 

Solo modificando il tasso di apprendimento è stato possibile ottenere due modelli su 100 che soddisfano il criterio.

Il primo.

Il secondo.

È emerso che sì, CatBoost è in grado di fare molto, ma è necessario regolare le impostazioni in modo più aggressivo.

 
Aleksey Vyazmikin #:

Bene, allora va bene.

Penso che ci sia la possibilità di migliorare l'addestramento riducendo il campione, diciamo per addestrarlo su 1/10 - questo permetterà di addestrare alcune fasi/strutture del mercato - non ancora richiesto.

Ho provato ad allenarmi con valking forward a 1000 e a 20000 - tutto fallisce.
 
Wo insegnare un'unica classe commercio/non commercio?
O separare acquisto e vendita?
 
elibrarius #:
Wo insegnare a un'unica classe a commerciare/non commerciare?
O separare acquisto e vendita?

I risultati sono mostrati da campioni senza trasformazione dell'obiettivo, cioè sì - commercio e non commercio.

Ma in realtà, creare campioni separati di acquisto e vendita sarebbe più facile da addestrare.

elibrarius #:
ha provato ad apprendere valutando in avanti a 1000 e a 20000 - tutto si svuota.

Strano. Che metodo usi per l'addestramento - foresta casuale?

 
Aleksey Vyazmikin #:

Strano. Quale metodo utilizzate per l'addestramento, la foresta casuale?

Riprogettato da Alglibow.
Ora sto eseguendo più alberi. Entro domattina credo che calcolerà una nuova versione.

O forse ho sbagliato qualcosa, se il risultato è molto peggiore del tuo.

Motivazione: