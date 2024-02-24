L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3190
Rapportarlo in qualche modo al profitto, almeno approssimativamente, e confrontare il profitto reale con un campione di profitti casuali. La verifica dell'assenza di errori è che il profitto medio del campione sia uguale a zero. Verificare la significatività della positività del profitto reale rispetto al campione - la regola dei tre sigma.
Non sono pronto a entrare nei dettagli del vostro compito, poiché i miei compiti sono troppo impegnativi.
Cosa c'entra il profitto, quando si parla di preelaborazione dei dati per un'ulteriore classificazione?
I vostri quanti sono progettati per l'estrazione del profitto? Esiste uno schema per questo? Si tratta di una semplificazione estrema per calcolare anche solo approssimativamente ma rapidamente un campione e verificare se il risultato reale cade nella coda di questo campione.
La tua volontà di richiedere alle persone di approfondire la tua mentalità, accompagnata dalla tua completa indisponibilità ad approfondire idee semplici e ampiamente conosciute come Monte Carlo, è stancante.
Credo di averne avuto abbastanza.
Ognuno ha il diritto di gestire il proprio tempo.
Ma, a quanto pare, non ha capito la domanda per la quale ha dato un consiglio.
Grazie per aver cercato di aiutare.
Capisco.
Ho un altro suggerimento da darvi, e se per rendere più maneggevole il processo di costruzione della foresta, e prendere come radice per ogni albero un sottocampione concreto del segmento quantistico selezionato?
La profondità dovrebbe essere di 2-3 spaccature, in modo che gli esempi di classe classificabile per foglia non siano inferiori all'1%.
Penso che il modello sarà più stabile.
Cioè, se si selezionano 10 quanti/split, si addestrano 10 alberi su esempi provenienti da questi split? Sembra semplice da fare.
Riguardo alla stabilità su OOS - l'esperimento lo dimostrerà. La mia stabilità viene violata quando si cambia la dimensione della finestra di dati (2 mesi e 4) e quando la si sposta anche del 2% (addestramento il martedì invece del sabato). Gli alberi risultano diversi.
Ho condotto un esperimento con il campione su cui ho pubblicato le gif, ci sono già il 47% di unità nel campione, i dati sono stati riassunti nella tabella....
è risultato che la qualità (utilità) di questi segmenti quantistici è peggiore (inferiore) rispetto a quelli originali di 10 volte.
In generale, penso che con una differenza così forte di 10 volte, è possibile non fare 10000 test. Troppo evidente la differenza nei primi 10 test (tutti peggiori) per supporre che altri 10000 aumenteranno il risultato fino a renderlo uguale all'originale. Se i risultati sono stati 3 peggiori, 3 migliori, 4 più o meno uguali, allora sì - continuate ad accumulare statistiche.
Se i dati sono serializzati, il problema è che una serie di 20 1 da qualche parte nella storia troverà una serie di 20 0 con un passato simile. Qui si tratta di randomizzazione del mercato. Non nel trasformare 111111111 in 010101010.
UPD Quindi penso che Monte Carlo nella forma di 01010101 per i dati di mercato non funzionerà per i dati di mercato (se vanno in serie). È come dividere un rettangolo e un quadrato in quadrati uguali e poi cercare di determinare a quale figura primaria appartenesse il quadrato)).
Ho scritto della sequenza rigorosa solo come esempio per chiarezza. E ho scritto che la soluzione di questo problema può migliorare la stabilità del modello. Ma la soluzione può essere diversa.
Anche senza risolvere il problema di cui sopra, la selezione della tabella quantistica corretta migliora l'apprendimento, come ho avuto modo di verificare su decine di campioni.
Poi ho mostrato come è possibile eseguire rapidamente la preelaborazione per l'addestramento, ripulendo il campione dai dati incoerenti. Nelle immagini si può vedere che con questo metodo è possibile ottenere un modello redditizio anche su nuovi dati.
Alla fine, l'approccio funziona e il suo sviluppo è il mio obiettivo.
Pertanto, dire che non funziona significa negare la realtà.
Non credo che il prezzo sia un puro SB, la cui natura non può essere almeno parzialmente smontata. Se si tratta di puro SB, allora l'intero thread è un errore.
Cosa c'entra il profitto con la preelaborazione dei dati per un'ulteriore classificazione?
Qual era il senso delle tue numerose gif con bilanci in costante aumento? Forse non hai capito la risposta alla tua domanda?
L'idea dei soldi di Saber per familiarizzare con le sue strategie mi sembra ottima e ben pensata. Non so nemmeno cosa potrebbe andare storto 🤔
Sì, è tutto così - l'approccio può essere reso più complicato, naturalmente, ma solo se lo si vuole.
Al momento, se ricordo bene, il predittore nell'albero colpisce solo la metà dell'intervallo, senza cercare il posto migliore per dividere?
Per quanto riguarda il successo dell'idea - sono assolutamente d'accordo, ma l'acqua non scorre nemmeno sotto una pietra sdraiata.
Sfortunatamente, ho commesso un errore durante l'elaborazione dei dati (stavo riprogettando velocemente lo script per questi test e una sfumatura non è stata presa in considerazione), e il risultato è una tabella come questa
La conclusione è che i dati possono rientrare casualmente negli intervalli delle tabelle quantistiche e superare il test di stabilità disponibile. Sono state utilizzate impostazioni/criteri predefiniti - ora proverò a stringerli e a vedere il risultato.
Tuttavia, ho scritto in precedenza che solo il 30% circa dei cutoff quantistici mostra la propria efficienza sugli altri due campioni, quindi il risultato era generalmente prevedibile. È stata solo la sua stranezza a farmi ricontrollare tutto. Come migliorare il risultato della selezione è la sfida.
Tuttavia, lo scopo della quantizzazione è quello di selezionare un gruppo con uno spostamento di probabilità. È possibile che attraverso la suddivisione si possa trovare una foglia stabile al suo interno, nonostante il gruppo stesso si sposti verso un altro obiettivo in base ai nuovi dati.
Nel campione su cui ho fatto l'esperimento - c'è una media di 1 segnale al giorno, credo, quindi le barre sono molto distanti.
Credo che sarebbe più interessante esaminare i risultati dell'esperimento che ho suggerito in precedenza: dovrebbe mostrare la frequenza con cui le risposte al target generate casualmente rientrano nei segmenti quantici campionati. Proprio questo sarà il "forziere" a distanza fissa, come suggerito da Aleksey Nikolayev nella sua astrazione.
Potete inviare il vostro campione, io selezionerò i segmenti quantici e su questi dati potrete sperimentare la creazione di una foresta modificata, oppure posso darvi il mio campione.
Fourchette - non sembra male, ma il bisogno di violenza - beh, non l'ho notato personalmente. Mi rattrista il fatto di non essere compreso, ma questo non provoca di per sé una forte aggressività.
Volevo leggere qualcosa sull'apprendimento automatico, e qui gli umoristi stanno affinando le loro capacità.
Mi piacerebbe vedere battute umoristiche e altre cose non attinenti all'argomento altrove.
Passiamo ora all'argomento.
Lei scrive che pensa che il mercato sia casuale, su quali basi si basa questa affermazione?
Ha qualche base solida per dimostrare la casualità del movimento dei prezzi di mercato?