Statistiques de dépendance entre guillemets (théorie de l'information, corrélation et autres méthodes de sélection de caractéristiques) - page 25

 
Candid:

Est-ce que je me souviens bien que les données d'entrée ici sont le module de pourcentage incrémental ?

Mais si tel est le cas, il s'agit essentiellement de la même volatilité (c'est-à-dire de sa fonction monotone et univoque), on s'attendrait à ce que tous les effets liés à la volatilité apparaissent ici aussi, bien que sous une forme quelque peu filtrée. Et comme les effets de la volatilité semblent l'emporter de loin sur tous les autres phénomènes de marché, la perspective de voir "autre chose" en arrière-plan semble plutôt problématique. Je le répète, je pense qu'il est plus prometteur d'essayer d'exclure systématiquement les effets connus mais "inutiles" des données brutes.

Au fait, Alexei(Mathemat), avez-vous aussi des données sources dans les modules ?

Bonne journée !

Pour tous les graphiques Forex, je calcule en pips (contrairement au marché boursier).

Deuxièmement - je sauvegarde les signes, c'est-à-dire que je ne prends pas de modulo. Tout ce que vous avez vu pour D1, M5, H1 - est calculé sur la base des retours en pips, discrétisé à 5 symboles de l'alphabet, le signe du changement de prix est préservé.

Dernier graphique pour H1 - J'ai mis les retours au carré pour éliminer le signe.

 
HideYourRichess:

En fait, le grand Bohr comme le grand Shannon, dans la résolution de leurs problèmes, sont passés de l'essence, la "physique", aux chiffres, à la différence de ce qui se passe ici.

Le deuxième problème, c'est qu'il n'est pas possible d'expliquer aux personnes qui veulent croire - que leur croyance est fausse. Comment expliquer aux gens que la méthode n'est pas applicable, car elle est conçue pour la stationnarité et l'indépendance. Soit même l'indépendance sous forme de chaînes de Markov, en tout cas elle exclut l'applicabilité de la méthode aux données avec présence de "mémoire" plus longue que celle considérée. La non-stationnarité et la dépendance (je tiens à souligner une fois de plus que cette dépendance est également non-stationnaire, donc ni la CM, ni les entropies conditionnelles ne fonctionnent) découlent directement de la compréhension des processus de marché générant un flux de cotation.

Non, ils ne venaient pas du point, ils venaient des faits :)) C'est une blague :).

Exigez-vous une stricte stationnarité des processus réels ? J'espère que non. Allons de l'avant. Nous avons besoin de régularité, c'est-à-dire d'un effet qui existe pendant une période suffisamment longue. C'est-à-dire que nous nous intéressons aux processus stationnaires (au moins approximativement et au moins pour le temps limité par notre échantillon) sur le marché. En d'autres termes, l'appareil est tout à fait adapté au but recherché.

 
alexeymosc:

Bonjour !

Pour tous les graphiques du Forex, je compte en pips (par opposition au marché boursier).

Deuxièmement - je sauvegarde les signes, c'est-à-dire que je ne les prends pas modulo. Tout ce que vous avez vu pour D1, M5, H1 - est calculé sur la base des retours en pips, discrétisé à 5 symboles de l'alphabet, le signe du changement de prix est préservé.

Dernier graphique pour H1 - J'ai mis les retours au carré pour éliminer le signe.

La présence d'un panneau fait bien sûr une grande différence. C'est juste que dans votre article, les fonctions de densité de probabilité ne sont données que pour des valeurs positives.
 
Candid:
La présence de l'enseigne fait bien sûr une grande différence. C'est juste que dans votre article les fonctions de densité de probabilité ne sont données que pour des valeurs positives.

Ces fonctions ne sont pas basées sur les rendements, mais sur la valeur de l'information mutuelle calculée, et cette valeur ne peut pas être négative.

Dans l'article de Habra pour les retours, le signe a également été conservé, mais là j'ai pris des incréments de pourcentage. Mais cela ne fait pas une grande différence.

Ici - comparez les deux derniers graphiques pour EURUSD H1. Dans la première, le signe des incréments est conservé, dans la seconde, il est omis. L'informativité du second système est naturellement plus élevée. Mais l'informativité n'est pas faible même avec le signe de la direction du mouvement. C'est déjà intéressant.

 
alexeymosc:
Ces fonctions ne sont pas basées sur les rendements, mais sur les valeurs de l'information mutuelle calculée, et cette valeur ne peut être négative.

Oui, j'ai déjà remarqué que j'avais tort.

En tout cas, si la méthodologie détecte les effets de la volatilité même sur des données significatives, cela plaide plutôt en sa faveur, je pense.

 
Candid:

Oui, j'ai déjà remarqué que j'avais tort.

En tout cas, si la méthodologie détecte les effets de la volatilité même sur les données de référence, cela plaide plutôt en sa faveur, je pense.

J'ai donné ici le tableau de calcul réel ci-dessous - il s'agit des cotations réelles de l'EURUSD M5 : https://www.mql5.com/ru/forum/135430/page22.

L'état 1 est le quantile inférieur (fort mouvement à la baisse), l'état 5 est un fort mouvement à la hausse. La variable indépendante est renvoyée un pas en arrière, c'est-à-dire le retard le plus proche. On constate que si la valeur de la source = 1, le récepteur a plus de chances de prendre la valeur 1 ou 5, mais avec un biais de 5.

Si la source a pris une valeur de 5, le récepteur a une probabilité de 1 ou 5 de pencher vers 1. Ces éléments réduisent l'incertitude de l'état du récepteur. La volatilité et l'asymétrie par rapport à des valeurs spécifiques jouent toutes deux un rôle ici. En isolant la volatilité séparément, la composante informative pour des valeurs spécifiques (plutôt que des paires de valeurs polaires de 1 à 5) demeure.

J'ai volontairement posté cette capture d'écran pour rendre l'essence de la recherche plus claire. Tout est basé sur la probabilité et la fonction de densité.

 
joo:
comment la recherche se fait-elle, pas par force brute ?

L'extermination est une option. Vous pourriez essayer un algorithme de recherche génétique avec l'information mutuelle comme fonction de fitness.

Imaginez que vous avez un ensemble de 100 variables, elles sont échantillonnées de manière égale. Il se peut que si la variable 5 prend la valeur 3 et la variable 76 la valeur 1, la probabilité que la variable dépendante prenne la valeur 4 est de 75%. Mais pour échantillonner cette paire de variables indépendantes, nous devons mesurer l'information mutuelle entre les deux variables indépendantes et la variable dépendante 100 * 100 - 100 fois. Et si nous voulons regarder les combinaisons des trois variables indépendantes

 
Avals:
ne génèrent pas de SB basés sur GARCH. Vous devez prendre une série réelle et générer un SB basé sur une volatilité réelle. J'ai posté un script ici https://forum.mql4.com/ru/41986/page10 qui remplace l'historique hors ligne d'un instrument réel par un SB utilisant le tick volumétrique. Un tel SB reproduira presque à 100% le vol réel. GARCH, etc., ils ne tiennent pas compte de nombreuses nuances telles que les différents cycles de vagues et bien d'autres. S'il y a une différence entre cette ligne de SB et la ligne dont elle est issue, c'est plus intéressant :)

C'est une bonne idée. Voici un graphique généré de SB avec une volatilité identique à celle de l'EURUSD. Alexey, s'il te plaît, fais une analyse pour ça. Voyons s'il y a des différences.
Dossiers :
eurusd_r.zip  499 kb
 
Candid:

Non, ils ne venaient pas du point, ils venaient des faits :)) C'est une blague :).

Exigez-vous une stricte stationnarité des processus réels ? J'espère que non. Allons de l'avant. Nous avons besoin de régularité, c'est-à-dire d'un effet qui existe pendant une période suffisamment longue. C'est-à-dire que nous nous intéressons aux processus stationnaires (au moins approximativement et au moins pour le temps limité par notre échantillon) sur le marché. C'est-à-dire que l'appareil est tout à fait adapté à l'objectif.

Exactement, vous l'espérez. D'après mes calculs, les processus qui se déroulent à différents moments sur le marché diffèrent, disons, plusieurs fois. Pas les pourcentages que vous espériez. Vous essayez de comparer des processus qui se produisent à un moment donné avec un processus d'un autre moment - d'où la stationnarité et l'adéquation des méthodes. Les reflets de cette non-stationnarité peuvent être vus dans les changements de volatilité (à la fois cyclique et sporadique), mais pas complètement.

Ici, il semble que de nombreuses personnes aient lu la conférence de Chiryaev sur l'œuvre de Pastukhov et il semble que lorsque le compteur dit que "la volatilité elle-même est volatile", il devrait être clair que tout n'est pas simple et que nous devons examiner attentivement ce que nous faisons. Mais non, une fois de plus, nous assistons à une nouvelle tentative de retirer certaines formules du marché.

En bref, faites ce que vous voulez, c'est votre temps et vos pertes. Bien sûr, si vous aimez le processus d'étude des chiffres - c'est une autre affaire, il n'y a que le plaisir du hobby.

 
HideYourRichess:

Exactement, vous l'espérez. D'après mes calculs, les processus qui se déroulent à différents moments sur le marché diffèrent, disons, plusieurs fois. Pas dans les pourcentages que vous espérez.

Tout d'abord, nous le comprenons. La non-stationnarité est une donnée dont il faut s'accommoder, dans le pire des cas en versant le prix du sang.

Deuxièmement, en discrétisant par 5 quantiles, nous grossissons la série de données et le bruit est absorbé, au moins partiellement, dans les plages de quantiles. La fonction de densité devient uniforme.

Raison: