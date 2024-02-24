L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 2381
il catbusto ha una regolarizzazione piuttosto forte, soprattutto se i segni sono categorici, dovrebbero essere così dichiarati nel boost
Nessun miglioramento è stato fatto riducendo la regolarizzazione L2. Quindi Lasso funziona meglio.
Forse è solo un buon pezzo di campionamento per l'esame. E si fa un adattamento ad esso, selezionando il modello con i migliori parametri per esso.
Ora controllo sempre con la convalida incrociata (o valving in avanti), non c'è un adattamento a una piccola sezione, ma a tutti i dati in una volta, penso che sia il modo migliore per imparare.
Anche Doc lo consigliava prima di scomparire dal forum.
Prima di tutto, non posso regolare Lasso, quindi non c'è nessuna regolazione, è solo il modo in cui sono i parametri.
In secondo luogo, è la stessa trama con CatBoostom - e ci sono 800 modelli tra cui scegliere e ho preso praticamente le migliori opzioni.
Ho allegato il file - prova tu stesso diversi modelli, Lasso raccomandato solo per i campioni binari - questo è un trucco.
Prova così com'è per la convalida incrociata. Ciclo di 10 volte con diverse trame sconosciute di 1/10 dei dati totali. Sarà la stima migliore per selezionare catbust con alcuni parametri o lasso con parametri predefiniti.
Prova allo stesso modo. Ha funzionato bene nel tester personalizzato, c'è un problema quando si esporta il modello, cercherò un errore più tardi.
Se il MA è coinvolto nell'addestramento, non dovrebbe essere presente quando si applica il modello?
L'essenza di MAShka è il tipo di partizionamento - sopra solo una classe, e sotto solo l'altra?
La binarizzazione avviene con un particolare metodo di stima del campionamento, quindi la convalida incrociata mostrerà risultati migliori sulle trame del campione principale.
La convalida incrociata non è del tutto rilevante per i campioni che sono legati al tempo, ma nel caso del trading lo è - il mercato cambia gradualmente e il modello deve trovare modelli stabili nel tempo, e nel caso della convalida incrociata l'intervallo di tempo dell'addestramento e del controllo può essere vicino o fratto dal campione addestrato.
In questo momento ho CatBoost addestrato sul 60% di tutti i dati - il 20% va a fermare il controllo e l'ultimo 20% a valutare il modello.Se parliamo del 10% per l'allenamento, è un campione troppo piccolo.
Stai parlando di una specie di convalida incrociata standard/antica.
In primo luogo, non è necessario mescolare le linee, e prendere blocchi come ci sono 0-90 formazione 90-100 test, poi 10-100 formazione, 0-10 test, poi 20-100-10 formazione 10-20 test, ecc.
In secondo luogo, seguendo il consiglio di Prado devi lasciare un po' di spazio (pruning) tra il treno e il test, per evitare che esempi adiacenti dal treno e dal test entrino nel tuo lavoro. Un esempio dal treno adiacente a 10-100 esempi dal test sarà il loro suggerimento/ricerca. Leggi di più qui https://dou.ua/lenta/articles/ml-vs-financial-math/
O qui c'è una foto:
In questo momento il mio CatBoost è effettivamente addestrato sul 60% di tutti i dati - il 20% è il controllo dello stop e l'ultimo 20% è la valutazione del modello.Se parliamo del 10% per la formazione è troppo poco per il campionamento.
E infine, invece della convalida incrociata, si può usare un rolling forward. Che non prende la sezione del test in un cerchio, ma solo davanti.
Cosa fa il parametro shuffle?Di solito se è False, i risultati sono molto peggiori di quando è True.
Un'immagine che spiega il valedetto in avanti.
Mescola gli esempi per il test e il treno, in modo che non siano sequenziali.
a caso? come indicato qui? il test su un campione casuale del 50%