L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1537

 
Maxim Dmitrievsky:

argomenti?

Quali argomenti sono necessari - il parametro 6 è quello predefinito, segue dalla tabella delle impostazioni.

È strano, perché la profondità dell'albero dipende più dai collegamenti completi tra i predittori, ecco perché sono sorpreso che da questi due collegamenti indipendenti, complessità totale nel quartiere di 200 si ottiene un buon modello, a giudicare dai grafici.

[Eliminato]  
Aleksey Vyazmikin:

Quali argomenti sono necessari - parametro 6 di default, segue dalla tabella delle impostazioni.

È strano, perché la profondità dell'albero dipende più dai collegamenti completi tra i predittori, quindi è sorprendente che questi due collegamenti indipendenti, con una complessità totale di circa 200, fanno un buon modello, a giudicare dai grafici.

Per questo dico che i dati sono fuori. Foresta riqualificata su di loro (forse arrivare a fissare questa caratteristica della foresta, categorizzando le caratteristiche). Ora metti 6 - la riqualificazione su trayn va alla grande, acurasi sotto 0,9.

6 per il mio troppo, 2-4 è normale

L'analogia con la foresta è semplice, non c'è limite alla profondità degli alberi
 
Maxim Dmitrievsky:

Per questo dico che i dati sono stati tolti. Foresta ri-addestrata su di loro (potrebbe essere in grado di fissare questa caratteristica della foresta, categorizzando le caratteristiche). Ora mettere 6 - ri-allenamento sul sentiero va sostanziale, acurasi sotto 0,9.

6 per il mio troppo, 2-4 normale va

L'analogia con la foresta è diretta, lì la profondità degli alberi non è limitata

Non capisco, hai detto prima che hai predittori sotto forma di incrementi, allora come vuoi trasformarli in predittori categorici?

Molto non cambia essenzialmente dalla rappresentazione ad albero - ho sezionato alberi, ci sono molte singole foglie dell'albero appena combinate in una lunga foglia essenzialmente, e una percentuale molto grande di quelle foglie sono duplicate o hanno valori/link intermedi senza senso che possono essere potati. In generale ho visto sul mio campione che la profondità dell'albero influenza il numero di alberi, e si può ottenere lo stesso risultato su un albero di 4 spaccature.

[Eliminato]  
Aleksey Vyazmikin:

Non capisco, prima hai detto che hai dei predittori sotto forma di incrementi, allora come vuoi farne dei predittori categorici?

Molto non cambia essenzialmente dalla rappresentazione ad albero - ho sezionato alberi, ci sono molte singole foglie dell'albero appena combinate in una lunga foglia essenzialmente, e una percentuale molto grande di quelle foglie sono duplicate o hanno valori/link intermedi senza senso che possono essere potati. Generalmente ho visto sul mio campione che la profondità dell'albero influenza il numero di alberi, e si può ottenere lo stesso risultato su un albero di 4 spaccature.

Prima dividere in categorie, per esempio 20 gamme-categorie. Poi la codifica vanchot (tramite attributi fittizi) o altro, non ancora deciso. Alla fine, ogni caratteristica sarà binaria o qualcosa del genere.

più valori diversi ci sono per la foresta, più sovrallenamento. Man mano che il campione di allenamento aumenta, il sovrallenamento aumenta. Per il catbusto, non è così. Quindi per la foresta cerca di ridurre il numero di scelte per le caratteristiche continue categorizzandole. Non sono sicuro che aiuterà, vedremo.

Non sono sicuro che ti salverà, vediamo.

 
Maxim Dmitrievsky:

Per prima cosa suddividilo in categorie, ad esempio 20 ranghi. Poi la codifica vanchot (tramite attributi fittizi) o qualcos'altro, non ho ancora deciso. Alla fine ogni caratteristica sarà binaria o qualcosa del genere.

Non so, si tratta più che altro di accelerare l'elaborazione dei dati, di non frammentare tali predittori, di non confrontarli tra loro in una catena di foglie, non ho visto nessun effetto utile, purtroppo. E la logica è che non si tratta di valori comparabili, ma di vanchoring combinati in un gruppo per equalizzare la selezione casuale.

Maxim Dmitrievsky:
più valori diversi per una foresta più sovrallenamento. Man mano che il campione di allenamento aumenta, il sovrallenamento cresce. Il catbusto non lo fa.

Anche la dipendenza del campione dalla formazione non è univoca - ho fatto metà anno o prima studi simili. Più probabilmente c'è una dipendenza dai dati, che dovrebbero essere comparabili.

 
Maxim Dmitrievsky:

Un approccio semplice e interessante su come descrivere i modelli per MoD

https://www.quanttrader.com/index.php/a-simple-algorithm-to-detect-complex-chart-patterns/KahlerPhilipp2019

mega-primitivo, ci sono modi molto più accurati per descrivere un modello

[Eliminato]  
mytarmailS:

mega-primitivo, ci sono modi per descrivere il modello molto più accuratamente

Tipo?

 
Alexander_K:
Mi unisco alle suppliche di coloro che soffrono. Chiedo, chinando il capo, un collegamento con il Graal.
Alexander_K:

Sono disposto a pagare un importo ragionevole per il Graal, confermato sul reale (i rapporti di prova non mi interessano) per almeno 3 mesi di lavoro.

Credo che il valore reale del Graal = la somma del patrimonio netto attuale del trader. Cioè 1000 dollari di equity sul conto, quindi il TS vale lo stesso importo. Se il mio uso del Graal è basato su tecnologie di reti neurali e/o modelli fisici e matematici, le statistiche reali e la volontà di venderlo, non esitate a contattarmi e ne discuteremo.

Chi guadagna davvero sul mercato non venderà la sua tecnologia per milioni di verde, forse per centinaia di milioni... Cioè, se qualcuno dà loro una "scatola nera" di software che fa buone previsioni o segnali già pronti, hanno bisogno di 10-30$ al mese per i dati e la qualità dell'esecuzione è ancora più costosa dei dati, è come paragonare un bambino in una scatola di sabbia e una società di estrazione dell'oro, il bambino vuole scavare l'oro con la sua paletta ma non può farlo... Forse una cazzuola diversa? Chiedere agli altri bambini dell'asilo che hanno una tale pala? Molto probabilmente qualcuno ne avrà uno, i bambini sono spesso dei sognatori:)

[Eliminato]  
Aleksey Vyazmikin:

Non so, si tratta più che altro di accelerare l'elaborazione dei dati, di non dividere tali predittori, di non confrontarli tra loro nella stessa catena di foglie, non ho visto nessun effetto utile, purtroppo. E la logica è che questi non sono valori comparabili, sono codifiche di vanchot combinate per equalizzare la selezione casuale.

Anche la dipendenza del campione dall'apprendimento non è univoca - ho fatto studi simili a metà anno o prima. Più probabilmente c'è una dipendenza dai dati, che dovrebbero essere comparabili.

Quell'articolo inglese è proprio su questo, sì, non confrontare i valori di una variabile con l'altra quando ce ne sono molte - questo porta solo al sovrallenamento

Forse non è la lunghezza, è qualcos'altro, vi dico quello che vedo. Aumento il campionamento - diventa più bello su Trayne, peggiore sul test. Anche se la generalizzazione dovrebbe salire con l'aumento delle dimensioni del vassoio, ma è il contrario nella foresta.

 
Maxim Dmitrievsky:

come?

dtw, analisi dello spettro... un mucchio...

Sono riuscito a creare un algoritmo che sa vedere gli stessi pattern indipendentemente dalla loro grandezza, quindi l'algoritmo guarda un grafico e vede il pattern su entrambi i grafici di un minuto e di una settimana, guardando solo un grafico, e può fare previsioni reali, ma ho ancora molto lavoro