Volumes, volatilité et indice de Hearst - page 5

 
Yurixx:

Vous voyez, même si je mets un coefficient non égal à 1 et que je le détermine d'une certaine manière pour l'euro sur tf = H1, cela ne veut pas dire que pour la livre et sur l'autre TF ce sera la même chose. Et ce n'est pas intéressant. Cela revient à traiter le barème de chaque paire séparément. Si c'est le cas, nous pouvons travailler sur les volumes.

Eh bien, nous pouvons considérer Hurst de l'ancienne manière, comme la pente de la régression, et alors ce coefficient n'aura pas d'importance. En fait, vous n'êtes pas lié à des TF standard, ce n'est donc pas un problème pour trouver des points de régression.


P.S. Ce n'était pas un rire, c'était un sourire. Dans le sens d'un certain scepticisme. Cependant, je me trompe peut-être et les utilisateurs du forum peuvent facilement résoudre ce problème.

 

J'ai calculé le ratio (High-Low)/(Close-Open) en utilisant un script simple pour 1,5 millions de barres minutes.

Pour AUDUSD sur l'intervalle de 2005.11.02 07:49 à 2010.08.20 22:59 la moyenne (H-L)/(C-O) = 1.65539495
pour USDJPY sur l'intervalle de 2006.04.11 20:21 à 2010.08.20 22:59 la moyenne (H-L)/(C-O) = 1.72965927
pour USDCHF sur l'intervalle 2006.01.24 04:23 à 2010.08.20 22:59 moyenne (H-L)/(C-O) = 1.69927897
pour USDCAD sur l'intervalle de 2005.05.19 13:31 à 2010.08.20 22:59 moyenne (H-L)/(C-O) = 1.62680742
pour GBPUSD sur l'intervalle de 2006.02.21 23:31 à 2010.08.20 22:59 Moyenne (H-L)/(C-O) = 1.65294349
Pour EURUSD sur l'intervalle de 2006.03.08 13:41 à 2010.08.20 22:59 la moyenne (H-L)/(C-O) = 1.69371256

Il n'y a pas tant d'écart que ça. Bien que j'espérais qu'il soit encore plus petit.

D'ailleurs, il est intéressant de savoir si la valeur locale de ce ratio peut aider à distinguer une tendance d'un plat. Au moins les impulsions doivent être détectées.

 

(Haut-Bas)/(Fermeture-Ouverture) ?

Désolé, le module est perdu ?

 
Svinozavr:

Laissez-moi vous expliquer la méthode. ...

C'est certainement une approche intéressante. Et, vraisemblablement, dans les mains de l'auteur, il est efficace.

Mais tous ces indicateurs continuent de conserver leurs paramètres temporels. Qui, d'après ce que j'ai compris, sont fixés par le goût.

Autrement dit, si nous recherchons ici des indicateurs objectifs, ce sont les critères de sélection des valeurs de ces paramètres qui devraient faire l'objet de discussions.

Pendant ce temps, c'est exactement ce que Peter n'a jamais mentionné. Ou peut-être que je l'ai manqué.

Et ce serait intéressant de l'écouter.

 
NorthAlec:

(Haut-Bas)/(Fermeture-Ouverture) ?

Désolé, le module est perdu ?

le module n'est pas perdu

  for (i=Bars-1;i>0;i--) {
    double res = Close[i]-Open[i];
    if (res < 0) res = -res;
    SumCO += res;
    SumHL += High[i]-Low[i];
  }
  if (SumCO != 0) Alert("Для ",Symbol()," на интервале от ",TimeToStr(Time[Bars-1])," до ",TimeToStr(Time[0])," среднее (H-L)/(C-O) = ",DoubleToStr(SumHL/SumCO,8));
 
Candid:

J'ai calculé avec un simple script le ratio (High-Low)/(Close-Open) sur 1,5 millions de barres minutes.


Et que peut signifier ce rapport en termes de sens ? Par définition, ce rapport doit être supérieur à 1. Il ne peut pas non plus être trop élevé, car le prix évolue (presque toujours) à une vitesse terminale. Il est clair qu'il existe une valeur moyenne située quelque part entre les deux. Et il ne devrait pas être très différent selon l'instrument - le mécanisme du marché est le même partout. Si on dessine la distribution (Close-Open) (sans module) à l'intérieur d'une barre, on obtiendra très probablement une distribution uniforme. Et ce sera la meilleure confirmation que la valeur est purement aléatoire.

Peut-être que je ne comprends pas quelque chose, mais il y a longtemps que j'ai cessé de prêter attention à Close et Open comme sources de données statistiques. Premièrement, leurs valeurs sont purement aléatoires (par rapport à l'ensemble des données de la minute correspondante), et deuxièmement, elles dépendent entièrement du début du chronométrage, ce qui n'est pas bon. Déplacez le début du compte à rebours de quelques secondes, et ces valeurs changeront. Mais la paire High and Low est une autre affaire. Cette paire définit le corridor dans lequel le prix évolue. Il est essentiel, bien sûr, de ne pas jouer dans un bar. Mais si c'est le cas, alors toutes nos approches d'indicateurs ne sont pas pertinentes. En outre, cette paire fixe le spread et la volatilité. À mon avis, ce sont des caractéristiques très importantes, que nous devons apprendre à utiliser.

 
Yurixx:

Que pourrait signifier cette attitude en termes de sens ?

J'ai écrit dans un autre fil
 

Donc, il y a beaucoup de questions sans réponse sur l'indicateur Hirst. Je n'avais pas pensé à le faire, mais les critiques, les questions et les commentaires de Nikolay(Candid), pour lesquels je lui suis très reconnaissant, m'ont convaincu qu'il fallait s'en occuper réellement. Sans cela, la formule proposée ci-dessus pour calculer l'indice de Hurst semble être simplement prise au plafond.

Il fallait aussi répondre (y compris à moi-même) à une telle observation :

Candid:

Mais jusqu'à présent, il n'y a pas de raisons suffisantes pour comparer les valeurs absolues de cette valeur avec un "calibrage" pour Hearst, c'est-à-dire pour considérer qu'à 0,5 la série est aléatoire, qu'au-dessus elle est tendue et qu'en dessous elle est récursive.

Pour cette caractéristique, vous devez effectuer votre propre étalonnage.



Je ne décrirai pas les détails du procès, je vous dirai simplement à quoi j'en suis arrivé.

Je parlerai d'une série de nombres aléatoires (SR) qui est un modèle de flux de tick : chaque tick donne +/- 1 point de changement de prix. Le modèle est, bien sûr, très approximatif, mais nous n'avons pas affaire au marché, mais à Hirst. Et, tout d'abord, nous devons traiter un flux à probabilité égale, c'est-à-dire un SB pur, lorsque les probabilités des ticks +1 et -1 sont égales à 50% chacune. Cela permettrait également d'obtenir le calibrage mentionné par Nikolaï.

Le calcul de l'indice de Hurst est basé sur l'intervalle moyen, c'est-à-dire la différence entre le prix maximum et le prix minimum dans l'intervalle. En plus de cette valeur, il en existe deux autres très importantes : le module moyen des incréments et la dispersion des incréments. Tous trois ont participé à l'étude. Les désignations utilisées ci-dessous sont les suivantes :

N est le nombre de ticks sur l'intervalle. Le premier point d'un intervalle (valeur initiale du prix) est le dernier tick de l'intervalle précédent et n'est pas inclus dans l'intervalle actuel. Par conséquent, le nombre de changements de prix dans l'intervalle est égal à son nombre de ticks.

K - nombre d'intervalles dans les statistiques.

R - prix moyen étalé par intervalles de K.

M - module d'incrément moyen par intervalles de K.

D - dispersion des incréments par intervalles K.

L'augmentation du prix dans un intervalle est une valeur pratique, facilement représentable sous forme analytique, égale à la différence entre le prix final et le prix initial de l'intervalle. Par conséquent, M et D peuvent être calculés sans problème. Les choses sont beaucoup plus compliquées avec la diffusion de R. Étant donné que les prix minimum et maximum de l'intervalle peuvent être atteints à tout moment, le spread dépend de l'ensemble de la trajectoire des prix et ne peut absolument pas être exprimé sous forme analytique. En d'autres termes, il est impossible d'obtenir une formule générale pour cela (comme Nicolai l'a insidieusement demandé).

Néanmoins, la tâche d'étudier le comportement de l'indice de Hurst pour SB est fixée et nous devons donc obtenir des résultats précis, sans nous limiter à des expériences approximatives.

Dans cette situation, il n'y a rien d'autre à faire que, sur la base de la définition de l'écart, de calculer ses valeurs "de face".

 

À cette fin, j'ai dû écrire un script qui, pour un nombre donné de ticks N dans l'intervalle, construit toutes les trajectoires de prix possibles. Toutes ces trajectoires étant également probables pour SB, il reste à déterminer l'écart pour chacune d'entre elles et à calculer sa moyenne pour toutes les trajectoires. Ce sera sa valeur "théorique", ou MO en abrégé. De toute évidence, le nombre total de toutes les trajectoires de prix possibles pour l'intervalle de longueur N est 2^N. Selon la même loi, le temps de comptage des scripts et la consommation de mémoire augmentent. Il est donc possible de calculer l'écart MO uniquement pour une région de petites valeurs de N. Le module moyen et la variance des incréments sont calculés pour compléter l'image et pour vérifier indirectement l'exactitude des calculs.

N R M D
1 1.0000 1.0000 1.0000
2 1.5000 1.0000 2.0000
3 2.0000 1.5000 3.0000
4 2.3750 1.5000 4.0000
5 2.7500 1.8750 5.0000
6 3.0625 1.8750 6.0000
7 3.3750 2.1875 7.0000
8 3.6484 2.1875 8.0000
9 3.9219 2.4609 9.0000
10 4.1680 2.4609 10.0000
11 4.4141 2.7070 11.0000
12 4.6396 2.7070 12.0000
13 4.8652 2.9326 13.0000
14 5.0747 2.9326 14.0000
15 5.2842 3.1421 15.0000
16 5.4806 3.1421 16.0000
17 5.6769 3.3385 17.0000
18 5.8624 3.3385 18.0000
19 6.0479 3.5239 19.0000
20 6.2241 3.5239 20.0000
21 6.4003 3.7001 21.0000
22 6.5685 3.7001 22.0000
23 6.7367 3.8683 23.0000
24 6.8978 3.8683 24.0000
25 7.0590 4.0295 25.0000

Pour le SB en question, il existe une formule simple qui relie la variance des incréments D au nombre de ticks N:

D = N .

Apparemment, Hurst, en postulant sa formule pour la variance moyenne, s'est appuyé sur ce résultat théorique.

Le tableau montre que les valeurs de D obtenues sont en parfait accord avec cette formule. Cela signifie que l'algorithme pour générer l'ensemble des trajectoires de prix et l'arithmétique pour le calcul des moyennes sont écrits correctement. Le calcul des prix max et min sur l'intervalle et de leurs différences est si simple que la probabilité d'erreur est proche de zéro.

 

Maintenant que nous avons un point de comparaison, nous pouvons voir comment l'exposant de Hearst se comporte pour SB avec différentes valeurs de l'intervalle N.

Permettez-moi de vous rappeler la formule utilisée pour calculer le ratio de Hearst tel que défini par son auteur.

H = (Log(R2) - Log(R1))/ (Log(N2) - Log(N1))

Le schéma de calcul en deux points est dû à la nécessité de se débarrasser du facteur inconnu qui est présent dans la formule de Hurst.

Pour simplifier les calculs, être plus clair et maximiser la portée de la recherche, le nombre de ticks dans l'intervalle N a également été modifié en puissances de deux. C'est-à-dire que N = 2^n a été pris. La base du logarithme dans la formule de H ne joue pas de rôle. On a donc supposé qu'il était égal à 2, donc Log(N ) =n.

L'algorithme de calcul était le suivant :

  1. Nous fixons le nombre n, le prix initial p=0 et la précision du calcul acc=0.001.
  2. Calculer le nombre de points dans l'intervalle N
  3. Utilisez le PRNG intégré pour générer le K-ième intervalle - N incréments de ticks d'unités.
  4. Calculez pour cet intervalle la fourchette et le modulus de l'augmentation du prix.
  5. Cumulez l'amplitude, le module et le carré des variables.
  6. Calculez la moyenne et la variance pour les intervalles K
  7. Déterminez si la condition de précision est remplie. Si ce n'est pas le cas, ajoutez un à K et passez à l'étape 3. Sinon, terminez le script.

Les résultats figurent dans le tableau.

(Malheureusement, je n'ai pas réussi à coller le tableau entier - l'éditeur n'accepte pas les textes de cette taille. J'ai dû le diviser en deux tableaux, en conservant les deux premières colonnes pour plus de commodité. La première sera désignée par 2a et la seconde par 2b).

Raison: