L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 1272

 
Maxim Dmitrievsky:

Sono stanco di discutere di cose ovvie, hanno tutto scritto nell'articolo. Che ognuno lo capisca come vuole.

Se un po' più di astrazione, sarà chiaro perché giocare contro il mercato è lo stesso.

E suggerisco di discuterne almeno nei termini che loro stessi usano, non in quelli intelligentemente inventati. Altrimenti l'argomento non è niente.

Qui si cerca di trovare analogie per il trading e il gioco, anche tenendo conto della stessa dinamica del loro equilibrio di probabilità, che è influenzato da entrambi i lati del processo. Esaminiamo il problema nei dettagli invece di usare la terminologia.

 
Aleksey Vyazmikin:

Prova a trovare analogie per il trading e il gioco d'azzardo, anche con la stessa dinamica del loro equilibrio di probabilità, che è influenzato da entrambi i lati del processo. Guardiamo il problema in modo oggettivo, piuttosto che usare la terminologia come copertura.

Per l'ultima volta, non scriverò più.

All'agente di RL non importa contro cosa sta giocando - il mercato o un altro avversario nella SC, non lo capisce perché è un programma. Il resto è puramente il tuo "know-how"

non importa se l'avversario è statico o dinamico, in entrambi i casi l'agente imparerà la politica ottimale

Ti rimetterai in sesto e lo capirai. Un giorno.

 
Maxim Dmitrievsky:

Per l'ultima volta, non dirò altro.

All'agente di RL non importa contro cosa sta giocando - il mercato o un altro avversario nella SC, non lo capisce perché è un programma. Il resto è puramente il tuo "know-how"

non importa se l'avversario è statico o dinamico, in entrambi i casi l'agente imparerà la politica ottimale

Ti rimetterai in sesto e lo capirai. Un giorno.

Il nome del metodo di formazione è secondario. È da molto tempo che cerco di parlarvi dei predittori.

E come non capire che NS può imparare a influenzare la situazione, e a seconda dell'efficacia dell'influenza, influenzare la probabilità del risultato dell'evento. E questo è proprio il vantaggio di una tale rete: la capacità di influenzare la situazione. Ad ogni fotogramma viene presa una decisione su cosa fare per migliorare le prestazioni dell'obiettivo (proprio quel grafico), il processo di attività è multistep, la probabilità finale di vittoria o sconfitta non è determinata al momento dell'inizio del gioco, ma cambia costantemente, anche a causa delle azioni dei giocatori, e qui è esattamente la più grande differenza dal trading.

Non sto dicendo che è impossibile creare un metodo RL per insegnare il trading, sto parlando dell'efficacia di una rete che influenza la situazione per raggiungere il suo obiettivo, piuttosto che indovinare passivamente cosa farà l'avversario (dove andrà il prezzo).

 
Maxim Dmitrievsky:

Perché mostrare l'emozione, faresti meglio a scrivere una confutazione ragionata ai miei argomenti.

 
Aleksey Vyazmikin:

Questa si chiama POLITICA OTTIMALE o STRATEGIA, che tiene conto di tutti i possibili comportamenti del nemico

Leggete un libro, non mettetevi in imbarazzo. Ti ho già scritto 100 volte, quello che stai cercando di esprimere sta in un paio di parole.

Non fare lo spiritoso.

 
Maxim Dmitrievsky:

Questa si chiama POLITICA OTTIMALE o STRATEGIA, che tiene conto di tutti i possibili comportamenti del nemico.

Leggi un libro, non metterti in imbarazzo. Ti ho già scritto 100 volte, quello che stai cercando di esprimere sta in un paio di parole.

Non prendermi in giro così.

Non conosco il termine, Internet è altrettanto riluttante a dire qualcosa - dammi un link, fammi vedere se si chiama davvero così.

E se la mia descrizione si adatta a un certo termine, non capisco le vostre obiezioni sostanziali. Non si tratta dei termini, ma dell'influenza sulla situazione per raggiungere l'obiettivo a lungo termine - vincere la partita attraverso una catena di azioni, che può variare a seconda delle azioni del nemico.

Si tratta del diverso ambiente in cui avviene il processo decisionale - in uno si può interagire con l'ambiente e nell'altro no - solo osservare attraverso il vetro.
 
 

Lei non sa che non leggo libri stranieri... Li ho sfogliati, sì, sono più avanzati di quelli su Internet in lingua russa.

 
Maxim Dmitrievsky:

se si toglie più della metà delle parole extra e si lascia la catena di azioni (catene di Markov) con transizioni probabilistiche, allora è meglio

il resto delle sciocchezze può essere lasciato fuori

La scissione agente/ambiente è sempre presente, non ci sono osservazioni attraverso il vetro. Di nuovo, un livello astratto che non è disponibile per tutti. E qui di nuovo stai sbattendo la fronte contro il muro perché te lo stai inventando invece di studiarlo.

Per l'ultima volta scrivo e fermo questo baccanale: non c'è influenza, ci sono probabilità di transizioni e approssimazioni di politiche.

Non so come pensi, ma i termini distorcono solo l'essenza del pensiero, se non è un assioma che è stato stabilito da tempo e non può essere verificato.

Non può fornire un'analogia, fare riferimento alla terminologia è improduttivo.

 
Aleksey Vyazmikin:

Perché non sai che non leggo libri stranieri... Li ho sfogliati, sì, c'è roba più avanzata lì che su internet in lingua russa.

Beh, non c'è altro posto dove leggere. Sutton, Barto"training with reinforcement" è tradotto online, solo un vecchio libro, ma anche utile.