L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1272
![MQL5 - Linguaggio delle strategie di trading integrato nel client terminal MetaTrader 5](https://c.mql5.com/i/registerlandings/logo-2.png)
Ti stai perdendo delle opportunità di trading:
- App di trading gratuite
- Oltre 8.000 segnali per il copy trading
- Notizie economiche per esplorare i mercati finanziari
Registrazione
Accedi
Accetti la politica del sito e le condizioni d’uso
Se non hai un account, registrati
Sono stanco di discutere di cose ovvie, hanno tutto scritto nell'articolo. Che ognuno lo capisca come vuole.
Se un po' più di astrazione, sarà chiaro perché giocare contro il mercato è lo stesso.
E suggerisco di discuterne almeno nei termini che loro stessi usano, non in quelli intelligentemente inventati. Altrimenti l'argomento non è niente.Qui si cerca di trovare analogie per il trading e il gioco, anche tenendo conto della stessa dinamica del loro equilibrio di probabilità, che è influenzato da entrambi i lati del processo. Esaminiamo il problema nei dettagli invece di usare la terminologia.
Prova a trovare analogie per il trading e il gioco d'azzardo, anche con la stessa dinamica del loro equilibrio di probabilità, che è influenzato da entrambi i lati del processo. Guardiamo il problema in modo oggettivo, piuttosto che usare la terminologia come copertura.
Per l'ultima volta, non scriverò più.
All'agente di RL non importa contro cosa sta giocando - il mercato o un altro avversario nella SC, non lo capisce perché è un programma. Il resto è puramente il tuo "know-how"
non importa se l'avversario è statico o dinamico, in entrambi i casi l'agente imparerà la politica ottimale
Ti rimetterai in sesto e lo capirai. Un giorno.
Per l'ultima volta, non dirò altro.
All'agente di RL non importa contro cosa sta giocando - il mercato o un altro avversario nella SC, non lo capisce perché è un programma. Il resto è puramente il tuo "know-how"
non importa se l'avversario è statico o dinamico, in entrambi i casi l'agente imparerà la politica ottimale
Ti rimetterai in sesto e lo capirai. Un giorno.
Il nome del metodo di formazione è secondario. È da molto tempo che cerco di parlarvi dei predittori.
E come non capire che NS può imparare a influenzare la situazione, e a seconda dell'efficacia dell'influenza, influenzare la probabilità del risultato dell'evento. E questo è proprio il vantaggio di una tale rete: la capacità di influenzare la situazione. Ad ogni fotogramma viene presa una decisione su cosa fare per migliorare le prestazioni dell'obiettivo (proprio quel grafico), il processo di attività è multistep, la probabilità finale di vittoria o sconfitta non è determinata al momento dell'inizio del gioco, ma cambia costantemente, anche a causa delle azioni dei giocatori, e qui è esattamente la più grande differenza dal trading.
Non sto dicendo che è impossibile creare un metodo RL per insegnare il trading, sto parlando dell'efficacia di una rete che influenza la situazione per raggiungere il suo obiettivo, piuttosto che indovinare passivamente cosa farà l'avversario (dove andrà il prezzo).
Perché mostrare l'emozione, faresti meglio a scrivere una confutazione ragionata ai miei argomenti.
Questa si chiama POLITICA OTTIMALE o STRATEGIA, che tiene conto di tutti i possibili comportamenti del nemico
Leggete un libro, non mettetevi in imbarazzo. Ti ho già scritto 100 volte, quello che stai cercando di esprimere sta in un paio di parole.
Non fare lo spiritoso.
Questa si chiama POLITICA OTTIMALE o STRATEGIA, che tiene conto di tutti i possibili comportamenti del nemico.
Leggi un libro, non metterti in imbarazzo. Ti ho già scritto 100 volte, quello che stai cercando di esprimere sta in un paio di parole.
Non prendermi in giro così.
Non conosco il termine, Internet è altrettanto riluttante a dire qualcosa - dammi un link, fammi vedere se si chiama davvero così.
E se la mia descrizione si adatta a un certo termine, non capisco le vostre obiezioni sostanziali. Non si tratta dei termini, ma dell'influenza sulla situazione per raggiungere l'obiettivo a lungo termine - vincere la partita attraverso una catena di azioni, che può variare a seconda delle azioni del nemico.
Si tratta del diverso ambiente in cui avviene il processo decisionale - in uno si può interagire con l'ambiente e nell'altro no - solo osservare attraverso il vetro.http://incompleteideas.net/book/bookdraft2018jan1.pdf
buona fortuna
http://incompleteideas.net/book/bookdraft2018jan1.pdf
buona fortuna
Lei non sa che non leggo libri stranieri... Li ho sfogliati, sì, sono più avanzati di quelli su Internet in lingua russa.
se si toglie più della metà delle parole extra e si lascia la catena di azioni (catene di Markov) con transizioni probabilistiche, allora è meglio
il resto delle sciocchezze può essere lasciato fuori
La scissione agente/ambiente è sempre presente, non ci sono osservazioni attraverso il vetro. Di nuovo, un livello astratto che non è disponibile per tutti. E qui di nuovo stai sbattendo la fronte contro il muro perché te lo stai inventando invece di studiarlo.
Per l'ultima volta scrivo e fermo questo baccanale: non c'è influenza, ci sono probabilità di transizioni e approssimazioni di politiche.Non so come pensi, ma i termini distorcono solo l'essenza del pensiero, se non è un assioma che è stato stabilito da tempo e non può essere verificato.
Non può fornire un'analogia, fare riferimento alla terminologia è improduttivo.
Perché non sai che non leggo libri stranieri... Li ho sfogliati, sì, c'è roba più avanzata lì che su internet in lingua russa.
Beh, non c'è altro posto dove leggere. Sutton, Barto"training with reinforcement" è tradotto online, solo un vecchio libro, ma anche utile.