L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1146

 
Aleksey Nikolayev:

Vous me surestimez) Je n'ai pas progressé au-delà des présentations.)

Comme ils l'écrivent eux-mêmes, il s'agit d'une sorte de sous-classe des jeux de nature (environnement). Je suis sûr que presque tous nos modèles se situent dans le jeu de la nature, mais je ne sais pas si ces "bandits" sont adaptés.

Je préfère les processus de Markov latents. Dans ce cas, la non-stationnarité peut être une conséquence du fait que nous n'observons pas toutes les variables. En gros, un processus qui n'est pas stationnaire pour nous sera dérivé d'un processus qui est stationnaire mais connu seulement du teneur de marché.

Je peux vous envoyer le code, mais je ne suis pas sûr que quelqu'un le comprendra et proposera quelque chose de nouveau :)

 
Graal:

J'ai compris, les conneries sont des conneries)).

Il ne s'agit pas de voyeurisme, bien que cela puisse aussi être le cas dans certaines conditions, mais l'OOS doit être aussi proche du réel que possible, car vous voulez que le résultat de l'OOS se répète + - sur le réel, et si vous le testez sur un passé plus lointain, il sera proche du passé, et le marché pendant cette période peut changer plus ou moins. Votre méthode peut même conduire à l'absurdité lorsque vous séparez les OOS et les réels pendant des années))).

Vous écrivez vous-même que c'est absurde, car le marché peut changer aussi bien dans le passé que dans le futur par rapport au lern. En outre, plus le lern est proche du présent, moins le marché est susceptible de changer demain. Et je cherche juste à savoir dans quelle mesure l'algorithme est capable de généraliser sur n'importe quel OOS.

Quelqu'un vient de vous dire qu'il devrait en être ainsi et vous ne savez pas vraiment pourquoi, c'est juste une spéculation.

 
Maxim Dmitrievsky:

il n'y a absolument aucune différence

le drapeau dans votre main, le monde réel mettra tout à sa place

 
Maxim Dmitrievsky:

Je peux vous envoyer le code, mais je ne suis pas sûr que quelqu'un le comprendra et proposera quelque chose de nouveau :)

Il est parfois difficile de comprendre son propre code avec lequel je n'ai pas travaillé depuis un mois).

 
LeXpert:

Vous êtes dans les mains du monde réel, c'est partout.

Bon sang, on parle de gangsters là.

 
Maxim Dmitrievsky:

Il ne s'agit pas de faire du voyeurisme, bien que cela puisse aussi être le cas dans certaines conditions, mais l'OOS doit être aussi proche du réel que possible, car vous voulez que le résultat de l'OOS se répète + ou - sur le réel, mais si vous le testez sur un passé plus lointain, il sera proche du passé, et le marché pendant cette période peut changer plus ou moins. Votre méthode peut même conduire à l'absurdité lorsque vous séparez les OOS et les réels pendant des années))).

Vous écrivez vous-même que c'est absurde, car le marché peut changer aussi bien dans le passé que dans le futur par rapport au lern. En outre, plus le lern est proche du présent, moins le marché est susceptible de changer demain. Et je cherche juste à savoir si l'algorithme est capable de généraliser sur n'importe quel OOS.

En général, l'essence de l'algotrading est que le marché change au moins partiellement de façon continue, il y a une sorte d'"inertie" due à la diffusion de l'information. Ce qui était hier est plus susceptible d'être aujourd'hui qu'il y a un mois (un an). Vous optimisez les données OOS pour qu'elles soient plus proches du marché réel, puis vous réentraînez simplement les données OOS, quel est le problème ? En général, tout le monde le fait, en divisant d'abord Lerne et Train ; apprendre sur Lerne ; vérifier sur Train ; puis réapprendre sur Lerne + tester sur la configuration optimisée des paramètres.


Bien sûr je ne contesterai pas et j'insisterai, mon collègue ci-dessus a dit à juste titre "la vie réelle met tout à sa place", les leçons du marché sont mieux retenues que la démagogie du forum)).

 
Graal:

En général, l'essence de l'algotrading est que le marché évolue au moins partiellement de façon continue, c'est-à-dire par une sorte d'inertie, en raison de la diffusion de l'information. Ainsi, ce qui était hier est plus susceptible d'être aujourd'hui qu'il y a un mois (un an). Vous vous optimisez pour que les données OOS soient plus proches du marché réel, puis vous réentraînez simplement les données OOS, quel est le problème ? Habituellement, c'est ce que tout le monde fait, d'abord diviser en lurn et treyn apprendre sur lurn vérifier sur treyn et ensuite se recycler sur lurn + treyn sur la configuration optimisée.

Alors quelle différence cela fait-il de savoir de quel côté se trouve l'OOS ? ))

Surtout quand on sait que lurn et traine sont la même chose (j'ai compris ce que voulait dire le Test, mais le surligné ne l'annule pas).

 
Maxim Dmitrievsky:

Alors quelle différence cela fait-il de savoir de quel côté est l'OOS ? ))

D'autant plus si l'on considère que lern et trane sont une seule et même chose (je comprends ce que vous voulez dire Test, mais la mise en évidence ne l'infirme pas).

coquille, merci, je l'ai réparée.

Makin : Optimiser pour quelque chose de plus proche de la vie réelle, pas pour qui sait quoi et quand !

 
Graal:

coquille, merci, corrigé.

la différence est grande, l'OOS est plus proche de la réalité, vous devez optimiser pour ce qui est plus proche de la réalité, et non pour qui sait quoi et quand.

la tâche est de s'assurer que les 2 parties sont indiscernables (les mêmes erreurs, etc.) dans ce contexte, la définition de ce qui gigote perd tout son sens

 
Maxim Dmitrievsky:

Mon Dieu, qu'est-ce qui est réel, nous parlons de bandits ici.

Comment avez-vous implémenté l'algorithme "Bandit" dans RDF ?

Ou avez-vous codé quelque chose de spécifique pour l'algorithme "Bandit" ?

Raison: