L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1304

 
Maxim Dmitrievsky:

10% di errore per test e traccia per ~10k esempi, aumenta dolcemente con l'aumento

a questo errore, i modelli hanno iniziato a lavorare su nuovi dati

sulla convalida in modo diverso, si deve correre attraverso le varianti.

Gli algoritmi non vengono più divulgati, ma solo comunicati

Qualcosa di sospettosamente piccolo. Nei suoi articoli anche sugli zigzag Perervenko non ha raggiunto tali risultati.

Ed è anche sospetto che il test e l'apprendista abbiano il 10% ciascuno, ma la validazione è "diversa". Cioè più o meno? Il peggio dovrebbe essere il test, non la convalida.

 
elibrario:

C'è qualcosa di sospettosamente piccolo. Pererwenko non ha raggiunto questo risultato nemmeno sugli zigzag nei suoi articoli.

Ed è anche sospetto che il 10% ciascuno su test e traine, e la convalida sia "diverso". Cioè è più di questo? Il peggio dovrebbe essere il test, non la convalida.

"Anche su zigzag" )))

il peggiore dovrebbe essere solo una convalida che non è stato coinvolto in alcun modo, anche indirettamente, nell'apprendimento
 
Maxim Dmitrievsky:

"Anche su zigzag" ))))

il peggiore può essere solo la convalida che non è stato coinvolto nell'apprendimento in alcun modo, anche indirettamente
E perché non la sezione dei test? Perché "non ha partecipato alla formazione in nessun modo, nemmeno indirettamente"?
 
elibrario:
Perché non il sito del test? Dopo tutto, è anche "non coinvolto nell'apprendimento in alcun modo, nemmeno indirettamente".

il test uno è sempre indirettamente coinvolto nell'apprendimento, prendere lo stesso catbusto... andiamo

 

А... o chiamiamo le trame in modo diverso.

Io chiamo

1 sezione del treno
2 valido - questo è quello che viene usato in molti pacchetti per il controllo nel processo di apprendimento e per l'arresto anticipato. E si chiama Valid.
3 test - per valutare il sistema con nuovi dati

Potresti aver chiamato la 2a sezione una sezione di test.

 
Maxim Dmitrievsky:

il test uno è sempre indirettamente coinvolto nell'apprendimento, prendere catbust... andiamo

Catbust non lo so. Ecco una citazione di XGBoost

giri di arresto anticipato
Se NULL, la funzione di arresto anticipato non viene attivata. Se impostato su un k intero, l'addestramento
con un set di convalida si ferma se le prestazioni non migliorano per k
giri.

 
elibrario:

А... o chiamiamo le trame in modo diverso.

Io chiamo

1 set di dati di allenamento
2 valido - questo è quello che molti pacchetti usano per il monitoraggio durante l'allenamento e per l'arresto anticipato. Si chiama Valid.
3 test - per valutare il sistema con nuovi dati

Vedo che chiami la seconda parte una parte di test.

Penso che sia il contrario, la convalida è il nuovo

Sì, beh, avete capito bene.

https://tech.yandex.com/catboost/doc/dg/concepts/cli-reference_train-model-docpage/

-t

--test-set

Una lista separata da virgole di file di input che contengono la descrizione del dataset di convalida (il formato deve essere lo stesso usato per il dataset di allenamento).

Omesso. Se questo parametro è omesso, il set di dati di convalida non viene utilizzato.


)))) potete scriverlo come volete, si chiama

 
Maxim Dmitrievsky:

Penso che sia il contrario, la convalida è quella nuova, dove è scritto

Sì, beh, avete capito bene.

All'inizio non lo capivo.
Perché usiamo termini diversi.

Dovremmo limitarci a una sola terminologia.

 
elibrario:

All'inizio non lo capivo.
Perché usiamo termini diversi.

Dovremmo attenerci alla stessa terminologia.

Mostratemi la documentazione di qualsiasi pacchetto, dove la seconda sezione (che è usata per il controllo dell'apprendimento e/o l'arresto anticipato) è chiamata test, non validazione.

Vi ho mostrato sopra, qui c'è di più

https://tech.yandex.com/catboost/doc/dg/concepts/output-data_training-log-docpage/

CatBoost — Metrics and time information — Yandex Technologies
  • tech.yandex.com
The table below lists the names of parameters that define the metric values to output. The values of all functions defined by these parameters are output. Information about the number of seconds of training: The resulting JSON file consists of the following arrays: meta Contains basic information about the training. Format of the array with...
 
sega)
In generale, confusione sulla terminologia
Motivazione: