- Il y a trois sortes de mensonges : innocents, effrontés et statistiques © Mark Twain
- "Paradoxe de Bleek : nous menons plusieurs expériences et calculons la probabilité de l'hypothèse nulle pour chacune d'entre elles. Bien que tous les résultats statistiques des expériences individuelles aient été "réussis", c'est-à-dire que l'hypothèse nulle a été rejetée avec une probabilité p < n, la méta-analyse donne le résultat inverse : p > n.
- Avant d'appliquer les statistiques à un domaine particulier, il est nécessaire de s'assurer que l'on a affaire à un environnement ergodique. Dans le cas contraire, il s'agira d'un jeu de chiffres avec un visage astucieux.
- "Paradoxe de Bleck : nous menons plusieurs expériences et calculons la probabilité de l'hypothèse nulle pour chacune d'entre elles. Bien que tous les résultats statistiques des expériences individuelles aient été "réussis", c'est-à-dire que l'hypothèse nulle a été rejetée pour chacune d'entre elles avec une probabilité p < n, après la méta-analyse, nous obtenons le résultat inverse : p > n.
Il s'agit d'un paradoxe intéressant. Où puis-je en apprendre davantage à ce sujet ?
Paradoxe intéressant. Où puis-je trouver plus d'informations à ce sujet ?
Votre article me donne une double impression.
D'une part. Dans ce forum, le fait même de poser des questions sur l'évaluation hypothétique des résultats est très important. Le forum est plein de gens qui dessinent une mashka et supposent que c'est le cas plutôt qu'une mashka dans l'intervalle.
Moins.
Je suis tout à fait d'accord avec Reshetov. Tout ce que vous avez dit - cela se réfère à des séries stationnaires ou proches de celles-ci - c'est-à-dire des séries avec peu de changement de mo et de variance dans le temps. Mais de telles séries n'existent pas sur les marchés financiers et toute l'application des statistiques sur les marchés financiers tourne autour de la stationnarité des séries temporelles. Les exemples les plus connus sont ARIMA, ARCH et tous les autres.
Votre série aléatoire, dont l'histogramme est illustré à la figure 2, montre que la série a une faible relation avec la série stationnaire, qu'elle est asymétrique et que ses queues sont très différentes. Cela se voit particulièrement bien par rapport à la courbe parfaitement normale que vous avez tracée. Ainsi, votre raisonnement ne s'applique pas du tout à votre exemple. Celui-ci n'est qu'une illustration de la pensée de Reshetov.
PS. Le concept le plus dangereux et le plus méprisable en statistique est la corrélation. Il est préférable de ne pas en parler du tout.
...Tout ce que vous avez dit - cela se réfère à des séries stationnaires ou proches de celles-ci - c'est-à-dire des séries avec peu de changement de mo et de variance dans le temps. Or, de telles séries n'existent pas sur les marchés financiers, et toute l'application des statistiques aux marchés financiers tourne autour de la stationnarité des séries temporelles. Les exemples les plus connus sont ARIMA, ARCH et tous les autres.
Votre série aléatoire, dont l'histogramme est présenté à la figure 2, montre que la série a une faible relation avec la série stationnaire, qu'elle est asymétrique et que ses queues sont très différentes. Cela se voit particulièrement bien par rapport à la courbe parfaitement normale que vous avez tracée. Ainsi, votre raisonnement ne s'applique pas du tout à votre exemple. Celui-ci est une illustration de la pensée de Reshetov.
Merci pour votre avis !
Je vais donner mes contre-arguments.
La stationnarité est une caractéristique d'une série temporelle. La figure 2 est une série de variations. L'article ne parle pas de séries temporelles! Bien que je sois d'accord pour dire que le temps est une caractéristique utile.....
D'après ce que j'ai compris, l'ergodicité signifie une certaine stabilité du système étudié....
J'aimerais donc souligner un point important. Si le système, disons une série chronologique financière, n'est pas stationnaire, nous pouvons toujours utiliser l'économétrie pour trouver un modèle stable (par exemple GARCH) décrivant le comportement du modèle. C'est là que je vois la constance du système - un comportement conforme au modèle.... mais à condition qu'il y ait une certaine probabilité que le système "casse" le modèle...
Merci de votre avis !
Voici mes contre-arguments.
La stationnarité est une caractéristique d'une série temporelle. La figure 2 est une série de variations. L'article ne parle pas de séries temporelles! Bien que je convienne que le temps est une caractéristique utile.....
D'après ce que j'ai compris, l'ergodicité signifie une certaine stabilité du système étudié....
J'aimerais donc souligner un point important. Si le système, disons une série chronologique financière, n'est pas stationnaire, nous pouvons toujours utiliser l'économétrie pour trouver un modèle stable (par exemple GARCH) décrivant le comportement du modèle. C'est là que je vois la constance du système - un comportement conforme au modèle.... mais à condition qu'il y ait une certaine probabilité que le système "casse" le modèle.....
Il y a quelques années, j'ai publié un article sur ce site dans lequel je justifiais une idée totalement inacceptable pour la plupart des gens. À savoir .
Il y a beaucoup d'indicateurs. Tout le monde pense que si un indicateur est dessiné, c'est qu'il est le même - après tout, c'est ce que nous voyons. En même temps, il ne vient pas à l'esprit de la plupart des gens que ce que nous voyons en réalité peut ne pas exister ! La raison en est banale. Si nous prenons la régression correspondant à l'indicateur, il peut facilement s'avérer que certains de ses coefficients ont des intervalles de confiance si larges qu'il est impossible de parler de la valeur d'un tel coefficient, et si nous éliminons un tel coefficient défectueux, le modèle de l'indicateur sera complètement différent. Lorsqu'on dit : il y a la vérité, il y a le mensonge et il y a les statistiques, on veut dire cette triste et très inhabituelle circonstance - rien n'est fiable, y compris les intervalles de confiance.
C'est pourquoi j'ai abandonné les modèles paramétriques et me suis impliqué dans les modèles basés sur l'apprentissage automatique. Il n'y a pas de problème de stationnarité, mais les problèmes de surentraînement sont en pleine gloire.
Et j'ai apprécié l'article.
Oui, les remarques de San Sanych et Reshetov sont légitimes - si le système (ou les systèmes) comparé(s) change(nt) ses paramètres, les résultats du test seront inutiles.
Mais la démonstration même de l'application des méthodes est plaisante. C'est rare pour le Forex !
Je dirais autre chose, en tant que personne qui applique des méthodes similaires exactement pour les prix de cotation. Il est possible de vérifier à l'avance si l'environnement est homogène (sur deux grands échantillons indépendants) et de se fier ensuite aux résultats des tests d'hypothèse avec une certaine sérénité. Cela peut également se faire grâce aux mêmes tests.
- Applications de trading gratuites
- Plus de 8 000 signaux à copier
- Actualités économiques pour explorer les marchés financiers
Vous acceptez la politique du site Web et les conditions d'utilisation
Un nouvel article Le livre de recettes statistique du trader : Hypothèses a été publié :
Cet article considère l'hypothèse - l'une des idées de base de la statistique mathématique. Diverses hypothèses sont examinées et vérifiées à l'aide d'exemples utilisant des méthodes de statistiques mathématiques. Les données réelles sont généralisées à l'aide de méthodes non paramétriques. Le progiciel Statistica et la bibliothèque d'analyse numérique portée ALGLIB MQL5 sont utilisés pour le traitement des données.
Les deux dernières variantes sont liées à des erreurs.
Maintenant, la valeur du seuil de signification doit être spécifiée. C'est la probabilité que l'hypothèse alternative soit acceptée alors que la vraie hypothèse est nulle (troisième variante). Cette probabilité est préférable car elle est minimisée.
Dans notre cas, une telle erreur se produira si nous supposons que le Stop Loss à la moyenne n'est pas égal à 30 points même s'il l'est réellement.
Habituellement, le niveau de signification (α) est égal à 0,05. Cela signifie que la valeur statistique de test de l'hypothèse nulle peut combler la partie critique dans pas plus de 5 cas sur 100.
Dans notre cas, la valeur de la statistique de test sera évaluée sur un graphique classique (Fig.1).
Fig.1. Tester la distribution des valeurs statistiques par la loi de probabilité normale
Auteur : Denis Kirichenko