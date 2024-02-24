L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1144
Non direi "esattamente così", la formula in sé è corretta, ma non dovrebbe essere calcolata in base ai rendimenti degli scambi, ma ai rendimenti giornalieri (orari, ecc.). Non credo proprio, la formula stessa è corretta, ma dovremmo calcolare non i rendimenti dei trades ma i rendimenti giornalieri (orari, ecc.), passo uguale per tutte le strategie, poi le strategie possono essere confrontate nelle prestazioni a seconda di questo valore del coefficiente, altrimenti se questo numero è calcolato usando i trades e il loro importo significativamente diverso, non è importante, ad esempio per una strategia sharp 0.01 e 5 per un'altra, non è chiaro, quale di loro è meglio o peggio, solo il segno è importante (sopra o sotto zero sharp).
Quindi, anche se Pantural non sta esattamente parlando del classico rapporto di Sharpe, ma ha comunque sollevato una questione importante su di esso. Anche se personalmente non preferisco usare il Rapporto di Sharpe, preferisco il Rapporto tra il Profitto e il Drawdown massimo come misura della performance della strategia.
Direi che dipende dall'EA. Se genera un ordine distinto di trade, cioè quando una posizione viene aperta o chiusa e il suo volume non cambia tra l'apertura e la chiusura - è meglio contare per trade. Se il volume della posizione cambia dolcemente nel tempo, allora identificare i momenti di un trade è meno significativo e può essere calcolato con il proprio metodo.
Il metodo panturale è migliore per vendere i TC e trovare investitori), quindi con il tempo immagino che passeranno ad esso)
in ogni caso, pantural non ha già modo di opporsi :))Che fai ora, vai a zonzo? Non vuoi discutere di cose normali nel campo del MO? :) Ho bisogno di una persona che sappia molto di formule. L'argomento è diventato vuoto, non c'è nessuno con cui discuterne.
Cosa fai ora, vai in giro a caso? Non vuoi discutere di cose normali nel campo del Ministero della Difesa? :) Ho bisogno di qualcuno con una buona conoscenza delle formule. L'argomento è stato svuotato e non c'è nessuno con cui discuterne.
In linea di principio, sono pronto a dare la mia opinione su qualsiasi argomento. Ma la disponibilità di senso per voi nelle mie dichiarazioni non posso garantire)
Ti ho lanciato le informazioni sul bandito? Argomento molto interessante, ma un sacco di formule.
Sì, penso di sì. Ma aggiornate il link e scrivete ciò che approssimativamente interessa.
il link qui sopra, interessato a banditi avversari per processi non stazionari, con algoritmi combinatori (apparentemente, qualcosa come mgua). io stesso nel processo di conoscere le informazioni ancora
più tardi su questo
Nel loro libro ho trovato subito questo:
Tutto ciò che l'allievo sa è che il vero ambiente si trova in qualche insieme E chiamato classe di ambiente.
Come vede questo E impostato per il trading?
Beh, è un ambiente impostato arbitrariamente per un bandito, per esempio un insieme di indicatoriper esempio un indicatore rsi, per semplicità, un insieme di incrementi di prezzo multipli
Tuttavia, non capisco come il loro modello sia collegato al trading. Dalla loro definizione di strategia (politica) risulta che guardano solo le azioni intraprese e i loro risultati. Sull'ambiente (secondo voi - un insieme di indicatori) non lo vedono o non possono nemmeno vederlo.
At dovrebbe dipendere solo dalla storia Ht-1 = (A1 , X1 , . . . , At-1 , Xt-1 ). Una politica è una mappatura da storie ad azioni.
Inoltre, il loro ambiente sembra addirittura essere in grado di tracciare il nostro comportamento, e quindi la ricompensa non dipenderà solo dall'azione stessa, ma anche da tutta la sua preistoria.
Un ambiente è una mappatura da sequenze di storia che terminano in azioni a ricompense.
Se la politica è approssimata da qualche modello (diciamo lineare) allora otteniamo semplicemente una soluzione sui nuovi dati e basta, sostituendola al modello
quello che stai descrivendo è un processo di ricerca delle ricompense più alte
Il problema principale della non stazionarietà è quando smette di funzionare sui nuovi dati. I banditi instabili sono descritti lì, ma non ci sono ancora arrivato. Bisogna ammettere che non c'è niente che non sappia già, come risulta :) Ma ho bisogno di alcune idee{soluzioni su come dare ricompense in modo appropriato
A proposito, ieri ho implementato esattamente il bandito lineare, il risultato è qualcosa come questo:
Infatti, l'esempio è ancora descritto nel mio articolo, ma utilizza una foresta casuale invece di una lineare. Linear dovrebbe essere meno sovrallenato
Insegnare sul futuro e testare sul passato è qualcosa che si vede solo su questo forum)))