L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1590

 
Andrey:

J'ai lu cet article il y a environ 5 ans, il est intéressant, mais il n'y a pas beaucoup d'informations supplémentaires, l'auteur fait quelque chose avec OHLC pour obtenir une mesure de la volatilité plus "pratique", ce n'est pas nouveau en principe, dans le classique Dacorogna "An introduction to high-frequency finance" au siècle dernier, il était recommandé de prendre les rendements absolus moyens, pas les valeurs RMS comme mesure de la volatilité. La prévisibilité de la volatilité est également un fait bien connu. Elle dépend de deux facteurs, la saisonnalité et l'inertie, qui représente 95 % de son influence. Mais même si nous alignons les (log)retours en fonction de la volatilité, cela ne donnera rien, nous avons besoin d'un signe pour le commerce, et cela n'affecte en rien la distribution.

Par exemple, si vous prenez un bruit gaussien, vous ne pouvez évidemment pas prédire les suivants à l'aide des échantillons précédents, indépendamment de la stationnarité, mais si vous triez cette série, par exemple, ce qui ne changera pas la distribution mais la rendra complètement prévisible, alors vous pouvez jouer avec la volatilité dynamique dans une large gamme et la rendre non stationnaire, mais toujours facilement prévisible.

Il n'est pas inutile de faire tout cela non pas sur une seule période, mais sur un certain segment d'entre elles, en comparant l'image résultante avec ce qui devrait être sur un SB gaussien avec une variance similaire.

 
Aleksey Nikolayev:

Si la rigueur s'impose, on peut considérer qu'il s'agit de l'absence de stationnarité au sens large des logarithmes des rendements, par exemple.

https://github.com/BlackArbsCEO/mixture_model_trading_public/blob/master/notebooks/current_public_notebooks/03_Are_Gaussian_Mixture_Components_More_Stationary_2019-01-01.ipynb

BlackArbsCEO/mixture_model_trading_public
BlackArbsCEO/mixture_model_trading_public
  • BlackArbsCEO
  • github.com
Contribute to BlackArbsCEO/mixture_model_trading_public development by creating an account on GitHub.
 
Aleksey Nikolayev:

Il y a un certain sens à faire tout cela non pas sur une seule période, mais sur un certain segment d'entre elles, en comparant l'image résultante avec ce qui devrait être sur un SB gaussien avec une variance similaire.

En ce qui concerne la distribution des rapatriés, il est très important que plus la période est longue, plus la distribution devient gaussienne, pour la raison triviale du calcul de la moyenne (nous nous souvenons tous que l'agrégation de distributions non normales donne une distribution normale). Les véritables événements "aléatoires" sur le marché ne sont que les changements d'un best (askbid), en plaçant/tirant un ordre ou une transaction ; l'agrégation des ticks, même en une minute, change la distribution, la rendant plus proche de la distribution gaussienne (pour obtenir une distribution gaussienne à partir d'une distribution uniforme, il faut 12 itérations), la véritable distribution du marché n'est que la distribution des ticks, et elle n'est pas du tout normale.

 
Andrey:

En ce qui concerne la distribution des rapatriés, il est très important que plus la période est longue, plus la distribution devient gaussienne, pour la raison triviale du calcul de la moyenne (nous nous souvenons tous que l'agrégation de distributions non normales donne une distribution normale). Les véritables événements "aléatoires" sur le marché ne sont que les changements d'un best (askbid), en plaçant/tirant un ordre ou en effectuant une transaction, l'agrégation des ticks même en une minute change la distribution en la rendant plus proche de la distribution gaussienne (12 itérations sont suffisantes pour transformer la distribution uniforme en distribution gaussienne), la véritable distribution du marché n'est que la distribution des ticks, et elle n'est pas du tout normale.

Pour les devises même ce n'est pas réel. Plus précisément, il n'est pas réel du tout, et il n'est pas "normal" du tout (pas en termes de distributions non plus).

Parce qu'il n'y a pas de centre. Il n'y a pas de source unique de tiques et aucune garantie qu'elles atteignent l'utilisateur. Non seulement le "flux hypothétique de ticks" d'un serveur particulier est le produit de l'agrégation d'autres serveurs, mais ce flux est également dilué par le serveur et le terminal pour des raisons techniques.

Les caractéristiques stat des tics dépendent du DC spécifique, de ses pairs et de leurs logiciels.

 
Andrey:

En ce qui concerne la distribution des rapatriés, il est très important que plus la période est longue, plus la distribution devient gaussienne, pour la raison triviale du calcul de la moyenne (nous nous souvenons tous que l'agrégation de distributions non normales donne une distribution normale). Les véritables événements "aléatoires" sur le marché ne sont que les changements d'un best (askbid), en plaçant/tirant un ordre ou en effectuant une transaction ; l'agrégation des ticks, même en une minute, change la distribution en la rendant plus proche de la distribution gaussienne (pour obtenir une distribution gaussienne à partir d'une distribution uniforme, 12 itérations sont suffisantes), la véritable distribution du marché n'est que la distribution des ticks, et elle n'est pas du tout normale.

Cependant, au niveau des ticks, un modèle plus correct est constitué de certaines variations du processus de Poisson, par exemple un processus de Poisson composé avec une distribution discrète des sauts et une fonction de temps non constante. Toutefois, cela ne tient pas compte du caractère discret du temps réel de négociation.

La forme de l'histogramme dépend des zones que nous rencontrons (Maxim Dmitrievsky a écrit juste au-dessus sur les mélanges). Parfois, il en résulte même un histogramme à double bosse.

 

Comme je ne sais pas comment transférer un modèle entièrement markovien vers metac, l'idée est de regrouper toutes les composantes saisonnières en Python, puis d'entraîner un simple MOH pour prédire les regroupements, et de tester sur un échantillon test. Et le transférer au terminal. Ce sera la bombe n°3.

On s'attend à ce que chaque cluster ait une variance et un matroïde constants.

 
Maxim Dmitrievsky:

Comme je ne sais pas comment transférer un modèle entièrement markovien à metac, l'idée est de regrouper toutes les composantes saisonnières en Python, puis d'entraîner un simple MOH pour prédire les regroupements, et de tester sur un échantillon test. Et le transférer au terminal. Ce sera la bombe n°3.

On s'attend à ce que chaque cluster ait une variance et un matroïde constants.

Je pense que même si les deux flottent dans une gamme non étendue, ce n'est pas un gros problème non plus.
 
Maxim Dmitrievsky:

Comme je ne sais pas comment transférer un modèle entièrement markovien vers metac, l'idée est de regrouper toutes les composantes saisonnières en Python, puis d'entraîner un simple MOH pour prédire les regroupements, et de tester sur un échantillon test. Et le transférer au terminal. Ce sera la bombe n°3.

On s'attend à ce que chaque cluster ait une variance et un matroïde constants.

La Bomba #5 est un mouvement de tendance avec des taux spécifiques, se répétant à intervalles égaux. Mais vous devez passer par le numéro 4 aussi.
 
Aleksey Nikolayev:

Néanmoins, au niveau des tics, un modèle plus correct est une variation du processus de Poisson, par exemple un processus de Poisson composé avec une distribution discrète des sauts et une intensité variable (PAS une fonction de temps constant)).

cela ne fonctionnera pas pour de nombreuses raisons, cela a été étudié depuis longtemps et il ne s'agit même pas du filtrage des tics par le serveur DC.

c'est ce que je sais où chercherhttps://www.mql5.com/ru/forum/102066/page9#comment_2968124 dans cette photo où la flèche est une aberration.

ces tics seront toujours là, c'est ainsi que le marché fonctionne - la raison pour laquelle ils se produisent est une autre question.

et si vous suivez votre hypothèse sur les sauts de ticks, vous considérerez ces pics, mais ces ticks ne forment tout simplement pas la direction des mouvements ultérieurs, ils se produisent tout au plus sur le haut/bas d'une barre.

Je n'ai pas pu trouver de captures d'écran de l'indicateur de tick de Prival, il représente très bien ces pics - vous n'avez donc pas à deviner d'où vient le tick. Une possibilité est que MM mélange souvent les données asc/bid avec un décalage dans le temps, mais c'est une vraie citation ! )))

 
Maxim Kuznetsov:
La Bomba #5 est un mouvement de tendance avec des tempos spécifiques, répétés à intervalles réguliers. Mais vous devez passer par le numéro 4 aussi.

C'est déjà dans la bombe numéro 2 :)