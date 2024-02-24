L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 936
Capisco. L'albero non poteva imparare a filtrare bene, quindi il risultato non era sensibilmente migliore con il filtraggio, solo meno accordi. Fondamentalmente ha filtrato a caso alcune delle buone offerte e alcune delle cattive offerte,
Ho allenato l'albero sul 2015 solo per malovhodov.
Filter_02 e mnogovhodov_02 sono stati addestrati per il 2016, è meglio confrontare il 2016 e il 2017 in tester (il 2017 è in generale dati nuovi che non erano in archivio, che è il più interessante da vedere).
Aha, e pensavo che il 2015 fosse una curva di apprendimento, poi le cose sono così - blu senza filtro e verde con filtro
Devo dire che il 2015 è più una tendenza al rialzo, il 2016 una tendenza al ribasso e il 2017 è quasi laterale sulle agende. Cioè le entità dei tre sono leggermente diverse, e credo che le tendenze globali giochino la loro parte.
Inoltre, la mia voce di acquisto è generata da 5 a 9 dal predittore arr_DonProc - quindi una parte dell'albero viene automaticamente tagliata.
Ma nel complesso il risultato non è male, non credi?
Un'ulteriore ramificazione, per me, ha portato a un overfit. Per una migliore precisione dovremmo passare a modelli più complessi - forestali o neuronici.
È possibile ramificare al 100% di accuratezza sui dati di allenamento, ma qual è il punto se tale albero fallirà solo su nuovi dati. Abbiamo bisogno di insegnare un tale modello che sarebbe in grado di mostrare quasi lo stesso risultato sui nuovi dati come sui dati di allenamento.
Fino al 100% è possibile e con diversi set di predittori, ma ovviamente non abbiamo usato tutto il potenziale qui.
A proposito, penso che dovremmo fornire più informazioni sul passato - ora possiamo ottenerle da Regressor e iDelta, e un paio di altri predittori, ma non c'è una cosa così banale come il numero di candele rialziste e ribassiste in una fila - la loro relazione tra loro - potrebbe essere utile, anche.
Cosa c'entra questo con una questione di fede? Vedo dei ghirigori sul grafico - e non capisco come interpretarli - tutto qui.
La foresta casuale è calcolata su ogni tick. Se i risultati sono raccolti da barre, come un normale flusso di prezzi, allora si ottiene un tale grafico. L'interpretazione è necessaria quando c'è una formula, e qui è solo il risultato della foresta per chiarezza.
Allora posso solo rispondere allo screenshot "Immagine interessante! Perché non è ancora chiaro cosa volevano mostrare, a tutti, se il punto è chiaro solo a te...
La percentuale di errore della foresta è calcolata su un certo periodo di tempo. E sul grafico si può vedere la discrepanza tra la realtà e i dati della foresta a un minuto particolare (ho un M5 lì).
Naturalmente, un grafico di un'altra foresta sarà completamente diverso dal mio.
Ora è più chiaro, ma non è chiaro cosa è previsto ad ogni tick - il prossimo tick?
Come in realtà si calcolerà ad ogni tick - solo OpenCL con una scheda video di alta classe probabilmente aiuterà qui.
Ho solo dato un esempio della mia foresta. E non ho chiesto di trattare i risultati del mio modello.
Se vuoi una raccomandazione su cosa esattamente non va nel tuo modello, allora invece di strane tabelle, mostra i risultati su un vero grafico dei prezzi.
E il risultato complessivo non è male, non credi?
Il 2017 è in positivo, il che è un po' piacevole.
Proverò un'altra volta. Ho preso il file mnogovhodov_02 e ho fatto un nuovo targeting:
classe "1" dove arr_Buy = 1
"-1" dove arr_Sell = -1
"0" per gli altri casi
Per la vostra strategia, questo target sembra più adatto.
Finora, non c'è nessun modello, in quanto tale, alla ricerca di uno. La tabella mostra un cambiamento nei risultati, non c'è bisogno di altro ancora - si sta muovendo, quindi è vivo.
Significa che si possono costruire più di 3 uscite dell'albero di destinazione?