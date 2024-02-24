L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2114

Aleksey Vyazmikin:

Maxim, come si imposta questa cosa?

Cos'è id_tl?

Non lo so, ho bisogno di un link.

forse l'id_tl degli esempi trasformati semplicemente

Aleksey Vyazmikin:

Grazie! Tutto ha funzionato.

Penso che sia la cosa giusta da fare - solo allenare la conversione, perché sul test va solo al controllo - così ho fatto, ma il risultato è molto strano - l'errore logloss va oltre 1 sul campione di test e cresce - come può essere questo - sono scioccato.

si possono provare diverse cose, solo per vedere

ecco un buon notebook https://www.kaggle.com/rafjaa/resampling-strategies-for-imbalanced-datasets

è possibile copiare e testare

Maxim Dmitrievsky:

Non lo so, ho bisogno di un link.

Probabilmente le idiosincrasie degli esempi trasformati appena

È lo stesso articolo - niente è chiaro lì.

Aleksey Vyazmikin:

È sempre lo stesso articolo - non c'è niente di chiaro lì.

è copiato, ti ho dato un link all'originale.

 
Maxim Dmitrievsky:

si possono provare diverse cose, solo per vedere

ecco un buon notebook https://www.kaggle.com/rafjaa/resampling-strategies-for-imbalanced-datasets

potete copiare e controllare.

Quindi questo è l'originale dell'articolo che stavo guardando in russo.

 
Maxim Dmitrievsky:

è copyedit, ti ho dato un link all'originale.

Ma a che serve - non ci sono comunque informazioni - il codice è stato strappato.

Aleksey Vyazmikin:

A che serve - non c'è ancora nessuna informazione - il codice è strappato.

Tutto è perfettamente scritto lì. Non ho classi di squilibrio, ma le creavo artificialmente, solo per guardare

 
Maxim Dmitrievsky:

Tutto è perfettamente scritto lì. Non ho classi di squilibrio, ma le ho create artificialmente, solo per mostrare


Si è scoperto che il metodo "Tomek links" non pareggia il campione - ha ridotto il numero di linee nulle da 4005 a 3402, quindi ho pensato che non funzionasse.
Aleksey Vyazmikin:


Si è scoperto che il metodo "Tomek links" semplicemente non equalizza il campione - ha ridotto il numero di linee nulle da 4005 a 3402, ecco perché ho pensato che non funzionasse.
Devi fare prima il sovracampionamento, poi il tomo
 
Maxim Dmitrievsky:
Uh-huh. Prima si dovrebbe sovracampionare poi il volume

Finora il sovracampionamento non dà nulla, ma "tome" ha migliorato un po' i risultati - significa che c'è qualcosa nei dati, la cosa principale è scavare correttamente.

Istogramma dei modelli con diverse impostazioni di quantizzazione sul campione.


