Distribution des augmentations de prix

 

Chers commerçants !

J'ai lu à loisir de nombreux fils de discussion dans ce forum - beaucoup d'entre eux traitent du problème de la détermination du type de distribution des retours d'une variable aléatoire (les soi-disant incréments de prix). Je me suis rendu compte par moi-même que ce problème n'a pas été résolu et en avoir :) :) :), une éducation et des compétences appropriées, j'ai décidé de prendre part à la résolution de ce problème.

Donc, la définition de la tâche :

Déterminer à partir des données tick d'une certaine paire de devises une distribution de probabilité des incréments de prix successifs Bid et Ask (c'est-à-dire analyser un ensemble de données constitué de la différence entre les prix Ask actuel et précédent et le même ensemble pour le prix Bid). Les formules de la fonction de densité de probabilité, de la fonction de distribution et de la fonction quantile d'une distribution donnée doivent être présentées sous forme analytique.

La tâche s'est avérée difficile. Permettez-moi de dire que cette distribution n'est pas l'une de celles dont on parle beaucoup - ni normale, ni logistique, ni de Laplace, ni de Cauchy, etc.

Avant de vous parler de cette distribution (plus précisément, il s'agit d'une famille de distributions, puisque les différentes paires de devises ont des valeurs différentes du coefficient d'échelle, qui, en général, ne coïncide pas avec l'écart-type), veuillez me répondre à quelques questions : qu'apporte exactement la connaissance de cette distribution ? Comment cela aide-t-il dans le trading du Forex ?

Sincèrement,

Passant par hasard et intéressé par le marché du Forex

Alexander_K :) :)

 
Alexander_K:

Chers commerçants !

J'ai lu à loisir de nombreux fils de discussion dans ce forum - beaucoup d'entre eux traitent du problème de la détermination du type de distribution des rendements d'une variable aléatoire (les soi-disant incréments de prix). Je me suis rendu compte par moi-même que ce problème n'a pas été résolu et en avoir :) :) :), une éducation et des compétences appropriées, j'ai décidé de prendre part à la résolution de ce problème.

Donc, la définition de la tâche :

Déterminer à partir des données tick d'une certaine paire de devises une distribution de probabilité des incréments de prix successifs Bid et Ask (c'est-à-dire analyser un ensemble de données constitué de la différence entre les prix Ask actuel et précédent et le même ensemble pour le prix Bid). Les formules de la fonction de densité de probabilité, de la fonction de distribution et de la fonction quantile d'une distribution donnée doivent être présentées sous forme analytique.

La tâche s'est avérée difficile. Permettez-moi de dire que cette distribution n'est pas l'une de celles dont on parle beaucoup - ni normale, ni logistique, ni de Laplace, ni de Cauchy, etc.

Avant de vous parler de cette distribution (plus précisément, il s'agit d'une famille de distributions, car les différentes paires de devises ont des valeurs différentes du coefficient d'échelle, qui, en général, ne coïncide pas avec l'écart-type), veuillez me répondre à quelques questions : qu'apporte exactement la connaissance de cette distribution ? Comment cela aide-t-il dans le trading du Forex ?

Sincèrement,

Passant par hasard et intéressé par le marché du Forex

Alexander_K :) :)

Si vous connaissez la distribution, vous connaîtrez la régularité, qui conduit au fait que la distribution est ainsi. Cette régularité peut être négociée. Mais si c'était aussi simple, les mathématiciens voleraient tout le marché.
Tout change sur le marché et si vous connaissez le type de distribution, il sera différent demain. Le problème n'est pas cela, mais comment faire un profit stable en sachant que tous les paramètres mesurés sont instables.
Il y a un autre problème) les tick Bids et Asks sur le forex ne sont pas réels. Chaque courtier fait ses propres tics. Et par conséquent, la distribution sera différente.
Mais il y a un moyen de s'en sortir !
 
Alexander_K:

Chers commerçants !

J'ai lu à loisir de nombreux fils de discussion dans ce forum - beaucoup d'entre eux traitent du problème de la détermination du type de distribution des retours d'une variable aléatoire (les soi-disant incréments de prix). Je me suis rendu compte par moi-même que ce problème n'a pas été résolu et en avoir :) :) :), une éducation et des compétences appropriées, j'ai décidé de prendre part à la résolution de ce problème.

Donc, la définition de la tâche :

Déterminer à partir des données tick d'une certaine paire de devises une distribution de probabilité des incréments de prix successifs Bid et Ask (c'est-à-dire analyser un ensemble de données constitué de la différence entre les prix Ask actuel et précédent et le même ensemble pour le prix Bid). Les formules de la fonction de densité de probabilité, de la fonction de distribution et de la fonction quantile d'une distribution donnée doivent être présentées sous forme analytique.

La tâche s'est avérée difficile. Permettez-moi de dire que cette distribution n'est pas l'une de celles dont on parle beaucoup - ni normale, ni logistique, ni de Laplace, ni de Cauchy, etc.

Avant de vous parler de cette distribution (plus précisément, il s'agit d'une famille de distributions, car les différentes paires de devises ont des valeurs différentes du coefficient d'échelle, qui, en général, ne coïncide pas avec l'écart-type), veuillez me répondre à quelques questions : qu'apporte exactement la connaissance de cette distribution ? Comment cela aide-t-il dans le trading du Forex ?

Sincèrement,

Passant par hasard et intéressé par le marché du Forex

Alexander_K :) :)


En fait (IMHO), il n'y a aucune dépendance du prix actuel par rapport au prix précédent. Ceux qui recherchent cette distribution veulent simplement identifier la tendance temporelle actuelle du marché (tendance à la hausse, à la baisse ou plate). Une fois la tendance identifiée, le trader cherche une occasion d'en tirer profit.

 
Vitalii Ananev:

En fait (IMHO), il n'y a aucune corrélation entre le prix actuel et le prix précédent. Ceux qui recherchent cette distribution veulent simplement identifier la tendance actuelle du marché (tendance à la hausse, à la baisse ou plate). Une fois la tendance identifiée, le trader cherche l'opportunité d'en tirer profit.

En fait, il y a une corrélation. Il y a une mémoire sur le marché car chaque transaction est de l'argent et si une transaction a été ouverte, elle sera fermée tôt ou tard.
 
Alexander_K:

- Que fait la connaissance de cette distribution en réalité ? Comment cela aide-t-il dans le trading du Forex ?

Les modèles GARCH avec entrées logarithmiques se composent de trois parties : un modèle de tendance, un modèle de volatilité et unmodèle de distribution incrémental. Il existe une énorme littérature sur ces distributions, leur influence sur les algorithmes, les différences de paires de devises par types de distribution et autres..... La question que vous soulevez est celle d'une barbe de 30 ans. Le principal outil mathématique sur les marchés financiers est le GARCH, dont il existe de nombreux exemples. Dans le fil de discussion sur l'apprentissage automatique, j'ai donné une sélection d'ouvrages - je m'y accroche à nouveau.

La distribution en t biseauté est de loin la plus utilisée. Mais je répète qu'un modèle complet se compose de trois éléments.

Il existe des logiciels prêts à l'emploi qui sont largement utilisés dans le trading réel. Les résultats sont disponibles dans les publications publiques. De R nous pouvons nommer : fgarch, rugarch, mais ils ne sont pas les seuls.

Dossiers :
 
Maxim Romanov:
En fait, c'est le cas. Il y a une mémoire sur le marché car chaque affaire est de l'argent et si une affaire a été ouverte, elle sera fermée tôt ou tard.

Je ne contesterai pas le fait que chacun a son opinion, mais s'il existait une telle corrélation, il serait alors possible, par extrapolation, de prédire les mouvements de prix futurs avec une précision bien supérieure à 50/50.

 
СанСаныч Фоменко:

Les modèles GARCH avec le logarithme des incréments en entrée se composent de trois parties : un modèle de tendance, un modèle de volatilité etun modèle de distribution des incréments. Il existe une énorme littérature sur ces distributions, leur influence sur les algorithmes, les différences de paires de devises par types de distribution et autres..... La question que vous soulevez est celle d'une barbe de 30 ans. Le principal outil mathématique sur les marchés financiers est le GARCH, dont il existe de nombreux exemples. Dans le fil de discussion sur l'apprentissage automatique, j'ai donné une sélection d'ouvrages - je m'y accroche à nouveau.

La distribution en t biseauté est de loin la plus utilisée. Mais je répète qu'un modèle complet se compose de trois éléments.

Il existe des logiciels prêts à l'emploi qui sont largement utilisés dans le trading réel. Les résultats sont disponibles dans les publications publiques. On peut citer : fgarch, rugarch, mais ce ne sont pas les seuls.


Oui, vous avez indiqué une approximation très proche - une distribution en T inclinée.

En fait, mes calculs ont donné la soi-disant distribution t de Student non normalisée avec un nombre de degrés de liberté = 2. Le coefficient d'échelle n'est pas égal à l'écart-type et est calculé séparément pour chaque paire de devises.

Cependant, ceci est vrai exactement pour les augmentations de prix. Les prix réels forment un mélange de ces distributions t et le fait de connaître la distribution des incréments ne me permet pas personnellement de comprendre le processus dans son ensemble.

Néanmoins, je demande de ne pas fermer ce fil - peut-être qu'un esprit brillant me dira comment faire passer la connaissance du particulier au général à partir de la connaissance du particulier, ce serait incroyablement cool.

Pour ma part, je promets de publier mes exercices mathématiques dans ce domaine et de lire attentivement les réactions et les commentaires.

Regards.

Alexander_K

 
Vitalii Ananev:

Je ne discuterai pas, chacun a son opinion, mais si une telle relation existait, nous aurions pu utiliser l'extrapolation pour prédire les mouvements de prix futurs avec une précision bien supérieure à 50/50.


Il y a plusieurs raisons pour lesquelles il est impossible d'utiliser l'extrapolation. Tout d'abord, le taux d'échantillonnage doit être correct, si vous échantillonnez une onde sinusoïdale avec un temps aléatoire, même une onde sinusoïdale ne peut être prédite. Et deuxièmement, comment peut-on prédire, si on ne le sait pas, quand chaque participant conclura l'affaire ? On sait que tous les participants qui ont ouvert des marchés les concluront, mais quand, on ne sait pas encore. Ou vous n'êtes pas d'accord avec le fait que tous les échanges ouverts seront fermés ?

 

Cela signifie que les écarts importants par rapport à la moyenne sont plus nombreux que dans une distribution normale et que plus l'échantillon est petit, plus le risque d'obtenir une erreur importante est grand. C'est juste une distribution avec des queues épaisses, tout le monde sait depuis longtemps que les citations ne sont pas normalement distribuées. Ils l'associent généralement à la présence de mémoire ou d'inertie, c'est-à-dire que les grands changements sont suivis de grands changements entre guillemets, les petits changements sont suivis de petits changements (en moyenne), mais les petits changements sont toujours plus nombreux que les grands.

Si c'est le cas, il est impossible de prédire les cotations dans un système de temps unique, c'est-à-dire que le moment du passage des grands changements aux petits et vice versa est statistiquement impossible à deviner. Nous devons donc examiner les cotations dans différentes périodes et comparer les probabilités. Par conséquent, nous devons toujours vérifier l'historique des cotations et l'échelle maximale, alors qu'il est difficile, voire impossible, de déterminer quel type d'incrément de marché se produit actuellement - petit ou grand.

Mais pour certains horizons acceptables et dans certaines situations, il est probablement possible de prévoir et de rechercher les inefficacités, qui forment en partie des queues épaisses.

 
Maxim Dmitrievsky:

Cela signifie que les écarts importants par rapport à la moyenne sont plus nombreux que dans une distribution normale et que plus l'échantillon est petit, plus le risque d'obtenir une erreur importante est grand. C'est juste une distribution avec des queues épaisses, tout le monde sait depuis longtemps que les citations ne sont pas normalement distribuées. Elle est généralement associée à la disponibilité de la mémoire, c'est-à-dire que les grands changements sont suivis de grands changements entre guillemets, les petits changements sont suivis de petits changements (en moyenne), mais les petits changements sont toujours plus nombreux que les grands.


Permettez-moi de vous donner un exemple concret tiré de mes calculs.

Pour la paire de devises EURJPY, la distribution des mouvements de prix est une distribution t de Student non standardisée avec 2 degrés de liberté et le coefficient d'échelle (sigma) = 1,43 points (mes excuses pour une modestie mathématique excessive). 95 % des incréments de prix se situent dans la plage de tolérance de +-6,19 sigma. Cela signifie-t-il que si le prix dépasse cette fourchette, une transaction peut être exécutée pour un certain échantillon ? La précision de mes calculs jusqu'aux millièmes de pourcent a-t-elle un sens ?

 
Alexander_K:

Voici un exemple concret tiré de mes calculs.

Pour la paire de devises EURJPY, la distribution des augmentations de prix est une distribution t de Student non standardisée avec 2 degrés de liberté et le coefficient d'échelle (sigma) = 1,43 points (excusez-moi d'être trop méticuleux sur le plan mathématique). 95 % des incréments de prix se situent dans la plage de tolérance de +-6,19 sigma. Cela signifie-t-il qu'une transaction peut être exécutée pour un certain échantillon si le prix dépasse cette fourchette ? La précision de mes calculs en fractions de millième de pour cent a-t-elle un sens ?


Je suis gêné de demander, mais tolérant pour qui ? Il semble que l'on prenne habituellement 3 sigmas...

SanSanych a donné beaucoup d'informations et de sources intéressantes dans ce domaine. Autant que je me souvienne, seuls les modèles GARCH mentionnés ne traitent pas les ticks, mais les incréments de clôture des jours.
Raison: