English Русский 中文 Español Deutsch 日本語 Português 한국어 Italiano Türkçe
Analyse des Paramètres Statistiques des Indicateurs

Analyse des Paramètres Statistiques des Indicateurs

MetaTrader 5Statistiques et analyses | 12 janvier 2022, 14:49
174 0
СанСаныч Фоменко
СанСаныч Фоменко

Introduction

Les traders utilisent largement les indicateurs qui montrent les cotations de base « plus clairement » leur permettant d’effectuer des analyses et de prévoir l’évolution des prix du marché. Les questions relatives à la validité de la transformation et à la crédibilité des résultats obtenus ne sont généralement pas prises en compte et, dans le meilleur des cas, remplacées par des tests des systèmes de négociation basés sur les indicateurs.

Il est tout à fait évident pour moi qu’il n’y a aucun sens à utiliser les indicateurs, et encore moins les appliquer dans la création de systèmes de trading, à moins que nous ne puissions résoudre les problèmes liés à la transformation des cotations initiales et la crédibilité des résultats obtenus. Dans cet article, nous montrons qu’il y a de réels motifs à une telle conclusion. Nous examinerons les problèmes potentiels dans l’usage de trois indicateurs d’une ligne de tendance droite, moyenne mobile exponentielle etHodrick-Prescott filter.


1. Un Peu de Théorie

Pour la commodité des lecteurs, je mentionnerai quelques termes de la théorie des probabilités et des statistiques mathématiques qui seront utilisés plus loin. Je ne vais pas fournir de liens, car les termes appliqués ici sont tout à fait équivalents à ceux utilisés dans les manuels.

1.1. La Description Probabiliste des Observations Économiques

Les cotations que nous observons sont des mesures sélectives indirectes (la population générale nous est inconnue) d’un processus stochastique notamment au niveau fondamental:

  • Les composants déterministes mesurés avec précision, par exemple, ont exécuté les deals d’achat et de vente de la devise.
  • les composants déterministes mesurés avec une erreur, comme la quantité de devise vendue dans un intervalle de temps, par exemple, en une journée;
  • composant stochastique, qui ne peut pas être mesuré - l’humeur de la foule. La plupart du temps, la principale caractéristique de ce composant est un mouvement aléatoire avec une dérive.

L’interaction de ces composants entraîne un processus stochastique comprenant:

  • tendances (déterministes et stochastiques);
  • cycles avec des périodes fixes et stochastiques;
  • mouvement aléatoire avec une dérive.

La non-stationnarité est une caractéristique commune d’un processus stochastique, qui se reflète dans les cotations des devises. Le concept de processus stochastique non stationnaire n’est important pour nous que parce qu’il ne fournit presque aucun moyen d’analyse, il doit donc être divisé en un ensemble de processus distincts qui peut être analysé. Lors de l’application des indicateurs, un trader ne pense pas à l’applicabilité de l’indicateur à une cotation de symbole spécifique. Cependant, il existe des outils d’économétrie permettant d’évaluer la possibilité d’appliquer un indicateur et le résultat de cette application.


1.2. Événement aléatoire. probabilité

Un événement aléatoire (achat et vente de devises, dans notre cas) est un événement qui peut ou peut ne pas intervenir. Nous savons que le nombre de deals à différents jours et à différents moments d’une journée est différent et, en fait, est une valeur aléatoire, mais seuls les événements à des moments discrets dans le temps (tels que la minute, l’heure, le jour, etc.) sont les plus communément pris en compte

La fréquence relative d’un événement aléatoire est le rapport d’un certain nombre d’occurrences d’un tel événement M au nombre général d’observations accomplies N. Avec la croissance du nombre d’observations (en théorie, jusqu’à l’infini), la fréquence tend vers le nombre appelé probabilité d’événement aléatoire. Selon la définition, la probabilité est une valeur de zéro à un. Le terme « probabilité » sera généralement utilisé dans cet article au lieu de fréquence relative.

La valeur aléatoire est une quantité qui prend des valeurs différentes suivant certaines probabilités.

Ensemble général symbolise toutes les valeurs possibles que celle aléatoire peuvent prendre. Nous traitons toujours avec un échantillon de l’ensemble général sur le marché, en utilisant généralement les cotations pendant un certain temps. Il est tout à fait naturel que les statistiques obtenues à l’aide d’un échantillon diffèrent des statistiques calculées sur l’ensemble général, car la fréquence relative diffère de la probabilité. Des calculs ultérieurs sont effectués pour évaluer les différences entre les statistiques obtenues à l’aide d’un échantillon et celles calculées sur l’ensemble général. Une telle approche est impossible dans le cas des indicateurs, car les prix, par exemple un cours de clôture, sont considérés comme des valeurs déterministes par un indicateur lors des calculs.

Une autre observation intéressante. Puisque nous essayons d’observer l’ensemble général, nous pouvons ignorer les différences dans les cotations soumis par différents centres de négociation, car il est facile de modifier les valeurs des cotations, mais il est très difficile de modifier leurs propriétés statistiques.


1.3. Caractéristiques des Variables Aléatoires

1.3.1. Statistiques Descriptives

Les ensembles de quantités aléatoires (cotations de devises, dans notre cas) se caractérisent par un certain nombre de paramètres. Certains de ces paramètres seront utilisés plus loin.

L’histogramme est un graphique montrant la fréquence de la valeur aléatoire. Dans son cas extrême, il s’agit d’un graphique montrant la densité de la distribution de probabilité.

La moyenne arithmétique (moyenne) est la somme de toutes les valeurs d’observations divisée par le nombre d’observations (le nombre de périodes dans notre cas). Il n’est pas applicable à toutes les distributions et le plus populaire pour les distributions normales lorsqu’il coïncide avec la médiane. Strictement parlant, cela implique que l’indicateur de moyenne mobile le plus populaire peut être appliqué dans le cas où les cotations ont la loi de distribution, pour laquelle la valeur moyenne existe.

La médiane divise toutes les observations d’un échantillon en deux parties: dans le premier cas, toutes les observations sont inférieures à la valeur médiane, dans le second, les valeurs d’observations sont dépassées par la valeur médiane. La médiane existe pour toute distribution et n’est pas sensible aux valeurs aberrantes. Dans le cas où la moyenne est égale (ou proche) de la médiane, c’est l’une des caractéristiques de la loi de distribution normale.

L’écart par rapport à la moyenne est une question assez intéressante. La dispersionest une valeur moyenne de carrés d’écart d’une valeur aléatoire par rapport à son espérance mathématique. La racine carrée de dispersion est un écart moyen-carré (standard).

L’écart-type et la dispersion ne résistent pas aux valeurs aberrantes.

Une grandeur sans dimension appelée rapport d’asymétrie (asymétrie) sert d’indicateur d’un degré d’asymétrie de la courbe de densité de distribution. Si la valeur d’asymétrie est inférieure à « six divisé par le nombre d’observations », la distribution de la probabilité d’une valeur aléatoire dépend de la loi normale.

Une autre valeur qui caractérise la densité de distribution est la kurtose. Il est égal à 3 dans des conditions normales. Dans le cas où le kurtose est supérieur à trois, le dessus est pointu et les queues « lourdes » tombent à faible angle.

Comme nous pouvons le voir, de nombreux concepts sont applicables aux variables aléatoires disposant de la loi de distribution normale. Ce n’est pas si mal, car un grand nombre de lois de distribution sont réduites à la normale lorsque le nombre d’observations augmente.

1.3.2. Distribution Normale

La distribution normale (gaussienne) est un cas extrême de presque toutes les distributions de probabilité réelles.

Le théorème de limite de Lyapunov sert d’assise théorique affirmant que la distribution des sommes des valeurs indépendantes et aléatoires ayant n’importe quelle distribution initiale seront normales en cas où il y a plusieurs observations et leur contribution est faible. Par conséquent, il est largement utilisé dans de nombreuses applications réelles de la théorie des probabilités.

La distribution normale est une courbe symétrique en forme de cloche, s’étendant sur tout l’axe des nombres. La distribution gaussienne dépend de deux paramètres : μ (espérance mathématique) et σ (écart-type).

L’espérance mathématique et la médiane de la distribution donnée sont égales à μ, tandis que la dispersion est égale à σ2. La courbe de densité de probabilité est symétrique à l’espérance mathématique. Le rapport d’asymétrie et l’excès sont γ = 0, ε = 3.

La densité de distribution normale est souvent décrite non pas comme une fonction variable x mais comme z = (x − μ) / σ fonction variable ayant une espérance mathématique nulle et une dispersion égale à 1.

La distribution avec μ = 0 et σ = 1 est appelée la loi normale standard (i.i.i).

Fig. 1.Distribution normale

Fig. 1. Distribution normale

1.3.3. Distribution de Student (distribution-t)

Le paramètre principal est le degré de liberté (le nombre d’éléments dans l’échantillon). Avec l’augmentation du nombre de degrés de liberté, la distribution de Student se rapproche de la normale standardisée, et dans le cas où n > 30, la distribution de Student peut être remplacée par la distribution normale. Dans le cas où n < 30, la distribution de Student a des queues plus lourdes.

Fig. 2. Distribution Student

Fig. 2. Répartition des étudiants

t-statistics est largement utilisé pour tester des hypothèses statistiques.

1.3.4. Chi-carré (Distribution Pearson)

Dans le cas où les Хi sont des valeurs aléatoires indépendantes ayant i.i.i, alors la somme de leurs carrés est soumise à la distributionχ 2. La densité dépend d’un seul paramètre ν (généralement appelé nombre de degrés de liberté) égal au nombre de variables aléatoires et indépendantes. Si le nombre de degrés de liberté ν →∞, χ2-distribution tend vers la loi normale ayant un centre v et une dispersion 2ν. La densité de distribution est asymétrique, unimodale et elle devient également plus plate et symétrique avec des degrés de liberté croissants.

Fig. 3. Distribution de Pearson (chi carré)

Fig. 3. Distribution de Pearson (chi carré)

1.3.5. F - Distribution Fisher

La distribution F de Fisher est une distribution d’une rapport de dispersion, c’est-à-dire le rapport de deux séries de dispersions.

Si deux variables indépendantes et aléatoires disposent d’une distribution ch-carrée avec des degrés de liberté (V1, V2),leur rapport présente la distribution Fisher .

Fig. 4.Distribution Fisher

Fig. 4. Distribution Fisher


1.3.6. Rapport de détermination R-carré

Le rapport de détermination montre quelle proportion de la dispersion des résultats est expliquée par l’influence des variables indépendantes. Dans le cas de deux variables, c’est le carré de corrélation de Pearson. Il montre la quantité de dispersion qui est totale entre les deux variables.

L’importance du rapport de corrélation dépend du nombre d’observations ou des statistiques F de Fisher. Lorsque le nombre de chandeliers dans une cotation dépasse 100, même de très petits écarts des valeurs observées par rapport à zéro suffisent à confirmer la signification de l’indicateur.

1.4. Détermination des Hypothèses

Quelles conclusions pouvons-nous tirer à propos d’un paramètre général défini, au cas où nous aurions une valeur sélective de ce paramètre? La réponse à cette question dépend de si nous disposons d’informations préalables sur la taille du paramètre général.

Si les informations préalables sur l’amplitude générale du paramètre sont absentes, nous pouvons évaluer ce paramètre par une valeur sélective, en définissant l’intervalle de confiance pour celui-ci, c’est-à-dire la plage, dans laquelle sa valeur est située avec une certaine probabilité confiante.

Dans la pratique, nous devons généralement vérifier certaines hypothèses spécifiques et dans la plupart des cas simples Mais. Cette hypothèse est considérée comme nulle. Pour tester l’hypothèse, certainscritères sont utilisés permettant de l’accepter ou rejeter. Les types de statistiques énumérés ci-dessous sont le plus souvent utilisés comme critères: statistiques t, statistiques F et statistiques du chi carré. Lors de l’utilisation d’un logiciel spécifique pour les statistiques (par exemple, STATISTICA) ou l’économétrie (comme EViews), le critère calculé est accompagné de la valeur de signification de ce critère - p-value. Par exemple, la valeur de p de 0,02 (2 %) indique que le critère correspondant n’est pas important au niveau d’importance de 1 % et important au niveau d’importance de 5 %. De manière équivalente, on peut admettre que l’hypothèse nulle n’est pas valide avec une probabilité égale à « 1 - valeur de p ».

La sélection d’une valeur p est subjective et déterminée par la gravité des conséquences d’une évaluation erronée d’un critère spécifique.


1.5. Caractéristiques Statistiques des Cotations

1.5.1. Statistique Descriptive

La statistique descriptive comprend :

  • Un histogramme qui doit s’approcher de la loi de distribution, lorsque la quantité de chandeliers dans une cotation augmente;
  • Principales mesures de tendance: moyenne, médiane;
  • Mesure de dispersion: écart type;
  • Mesures de forme: asymétrie et kurtose;
  • Critère de normalité Jarque-Bera

Critère de Jarque-Bera. Hypothèse nulle Mais: la distribution est normale. Par exemple, la probabilité accompagnant la valeur du critère est égale à 0,04. Il semble que la conclusion suivante puisse être faite: la probabilité de l’acceptation de l’hypothèse nulle est égale à 4%. Cependant, ce n’est pas tout à fait correct, car la valeur calculée est un critère p-valeur et la probabilité de l’acceptation de l’hypothèse nulle est égale à 96%.


1.5.2. Auto-corrélation et Q-statistiques

La corrélation est une mesure de la relation entre deux variables. Le rapport de corrélation peut varier de -1,00 à +1,00. La valeur -1,00 indique totalement négative, la valeur +1,00 indique corrélation totalement positive. La valeur 0,00 indique l’absence de corrélation.

La corrélation entre les éléments d’une cotation est appelée auto-corrélation. Il peut être très utile pour trouver des tendances. La présence d’une auto-corrélation remet en question toute conclusion sur les cotations en tant que variables aléatoires, car le facteur le plus important dans la détermination d’une valeur aléatoire est l’indépendance de divers prix sur différentes périodes de temps.

Dans les logiciels d’analyse statistique, l’auto-corrélation est accompagnée de Q-statistiques de Ljung-Box avec la valeur p. L’hypothèse nulle est la suivante: l’auto-corrélation est absente, c’est-à-dire que dans le cas où la valeur de p est égale à zéro, nous pouvons conclure que la corrélation est absente avant un chandelier défini dans une cotation.

L’exclusion des autocorrélations (tendances) des cotations est la première étape pour obtenir la possibilité d’utiliser les méthodes de statistiques mathématiques.


1.5.3. Stationnarité des Cotations

Nous examinerons les cotations qui sont stationnaires, dans le cas où leur espérance mathématique et dispersion ne dépendentpas du temps. Même cette définition de la stationnarité est trop stricte et peu adaptée à une application pratique. Les cotations sont très souvent considérées comme stationnaires, dans le cas où les écarts de l’espérance mathématique et / ou de dispersion comprennent plusieurs pour cent (généralement pas plus de 5%) dans un certain temps.

Les cotations réelles sur le marché Forex ne sont pas stationnaires. Elles présentent les écarts suivants :

  • La présence d’une tendance générée par la dépendance entre les observations dans le temps. La dépendance est une caractéristique commune des cotations des devises et des observations économiques;
  • Cyclicité;
  • Dispersion variable (hétéro-scédasticité).

Les cotations qui s’écartent de celles stationnaires sont appelées non-stationnaires. EIles sont analysées par la décomposition successive en composants. Le processus de décomposition se termine à la réception de l’équilibre d’une série stationnaire avec une espérance et/ou une dispersion presque constante.

Il existe plusieurs tests de stationnarité des cotations. Les tests de base sont les tests unitaires de racine. Le plus célèbre des tests unitaires de racine est le test de Dickey-Fuller. L’hypothèse nulle Mais: les cotations ne sont pas stationnaires (elles ont une racine unitaire), c’est-à-dire que la moyenne et la dispersion dépendent du temps. Vu il y a une dépendance presque constante au temps (une tendance), la présence d’une tendance dans les cotations doit être indiquée lors de la réalisation du test. À ce stade,elles sont déterminées par l’œil.


1.6.  Spécification des Indicateurs (Régression)

Un coup d’œil superficiel aux textes d’indicateurs écrits à l’aide de langages tels que MQL5, par exemple, permet d’identifier deux formes de leur réglage: analytique (la plus courante) et tabulaire (appliquée aux indicateurs, qui sont appelés filtres, par exemple, les indicateurs de Kravchuk).

Mais nous utiliserons le terme « régression » - un terme courant en statistique mathématique et économétrie.

Ayant l’idée de ce que nous souhaitons obtenir des cotations, nous devons définir les paramètres suivants pour formuler la régression (indicateur):

  • La liste des variables indépendantes utilisées pour le calcul de l’indicateur;
  • Rapport de variables indépendantes;
  • Équation de calcul de l’indicateur qui sera utilisée pour le calcul de la variable dépendante.

Bien qu’il y ait quelques difficultés à créer des indicateurs multi-devises, il n’y a pas de telles difficultés dans la régression.

Ayant ces trois positions, il faudra adapter la régression à un cotation. Contrairement aux forums de traders, le mot « fit, fitting » n’est pas un mot sale en économétrie, mais la procédure standard, au cours de laquelle la conformité de la régression (de l’indicateur) aux cotations est calculée à l’aide de l’une des multiples méthodes d’évaluation. Les moindres carrés ordinaires (OLS) sont la méthode d’évaluation la plus connue.

L’évaluation révèle deux points d’intérêt :

  • Conformité de l’indicateur avec les cotations – la valeur de l’erreur restante;
  • Stabilité des paramètres de régression calculés à l’avenir.

Les réponses à ces questions sont données lors du diagnostic des indicateurs.


1.7. Diagnostics des Indicateurs

Le diagnostic des indicateurs (régressions) est divisé en trois groupes :

  • Diagnostics des rapports;
  • Diagnostic des résidus;
  • Diagnostics de stabilité.

Chaque procédure de vérification décrite ci-dessous inclut la spécification de l’hypothèse nulle utilisée comme hypothèse de vérification. Le résultat de la vérification consiste à sélectionner les valeurs d’une ou plusieurs statistiques et leurs valeurs p associées. Ces dernières indiquent la probabilité de l’exécution de la condition d’hypothèse nulle, qui est la base des statistiques de vérification.

Ainsi, de petites valeurs de p conduisent au rejet de l’hypothèse nulle. Par exemple, si une valeur p se situe entre 0,05 et 0,01, l’hypothèse nulle est déviée au niveau de 5 %, et non de 1 %.

Il convient de noter qu’il existe diverses suggestions et résultats de distribution liés à chaque vérification. Par exemple, certaines statistiques ont des distributions de test précises et finies (généralement des distributions t ou F). D’autres sont de grands échantillons de statistiques de test avec des distributions asymptotiques χ2.


1.7.1. Diagnostics Rapports

Les diagnostics de rapports apportent des informations et définissent les limites des rapports évalués, y compris le cas particulier des vérifications pour les variables manquées et redondantes. Les vérifications suivantes des rapports d’équation de régression seront utilisées :

  • Les ellipses de confiance permettent de révéler la corrélation entre les rapports d’équations ;
  • Le test des variables manquantes permet de déterminer la nécessité de variables supplémentaires dans l’équation de régression;
  • Le test des variables redondantes permet de révéler des variables excessives;
  • Le test de rupture permet de déterminer la réaction de l’équation de régression aux changements d’une tendance. Il est souhaitable de créer une telle équation de régression qui serait tout aussi bonne pour refléter les cotations aux segments ascendants, descendants et plats.


1.7.2. Diagnostics des Résidus

Nous avons déjà mentionné l’importance d’étudier les résidus lorsque l’on essaie de transformer des cotations non stationnaires en cotations stationnaires.

Le test de la racine unitaire peut montrer que les résidus sont distribués beaucoup plus près de la loi normale par rapport aux cotations de base. Le mot « plus proche » reflète le fait que les résidus ont la moyenne et la dispersion en fonction du temps, ce qui conduit à l’instabilité des rapports d’équation de régression.

En utilisant les termes des forums de traders, nous pouvons dire que nous ne devrions pas « sur-optimiser (voici notre infâme ajustement!) » un système de trading, c’est-à-dire qu’il ne doit pas perdre ses caractéristiques aux segments suivants. Le système n’est pas adapté aux segments de cotations futurs en raison de l’évolution des espérances mathématiques et de la dispersion au fil du temps.

Les essais suivants seront effectués pour les résidus : corrélation série, normalité, hétéro-scédasticité et hétéro-scédasticité conditionnelle auto-régressive des résidus.

Corrélogrammes -statistique-Qindique les autocorrélations de résidus et calcule les statistiques Q de Ljung-Box pour les décalages appropriés avec l’indication de la p-value.

Histogramme -test de normalitéindique l’histogramme et les statistiques descriptives des résidus, y compris les statistiques de Jarque-Bera lors du test de normalité. Si les résidus sont normalement distribués, l’histogramme doit être en forme de cloche et les statistiques de Jarque-Bera ne doivent pas être significatives.

Les tests d’hétéro-scédasticité vérifient l’équation des résidus d’hétéro-scédasticité. S’il existe une preuve d’hétéro-scédasticité, il est nécessaire soit de modifier la spécification de régression (changer l’indicateur), soit de modéliser l’hétéro-scédasticité.

Utilisons le test d’hétéro-scédasticité de White avec l’hypothèse nulle concernant l’absence d’hétéro-scédasticité par rapport au test d’hétéro-scédasticité d’une forme inconnue et commune.

White décrit sa méthode comme le test commun pour la spécification d’erreur de modèle, car l’hypothèse nulle sur laquelle le test est basé suggère que les erreurs sont à la fois homo-scédastiques et indépendantes des variables indépendantes, et que la spécification du modèle linéaire est correcte. L’exclusion de l’un ou l’autre de ces paramètres pourrait conduire à des statistiques de test significatives. Au contraire, des statistiques de test insignifiantes impliquent qu’aucun de ces trois paramètres n’a été violé.


1.7.3. Diagnostics de stabilité

La stabilité du diagnostic est la plus intéressante et la plus importante dans ce cas, car les résultats des diagnostics révèlent les capacités prédictives de l’indicateur. Dans MT4 ou MT5, la stabilité peut être diagnostiquée à l’aide du testeur de stratégie. Plus loin, nous montrerons que le testeur de stratégie ne peut pas diagnostiquer la stabilité future d’un système de trading créé à l’aide des indicateurs. Il ne peut assurer qu’une évaluation d’un système trading basée sur des données historiques.

Comme durant les tests des systèmes de trading, la méthode commune du diagnostic de stabilité est queТ barre de cotation sont divisée en observations Т1 qui seront utilisées dans l’évaluation et Т2 = Т Т1 sont des barres qui seront utilisées dans le test et l’évaluation.

Dans le cas où un système de trading est testé sur deux segments, le problème de sa future stabilité ne peut pas être résolu, car le test du deuxième segment indique seulement que ce nouveau segment est similaire au précédent par ses paramètres statistiques inconnus. Dans le même temps, les problèmes statistiques qui ont été résolus lors de la création du système trading demeurent inconnus.

Bien sûr, différents segments de cotations sont sélectionnés lors des tests des systèmes de trading, mais il est impossible de détecter à l’œil, par exemple, les zones d’hétéro-scédasticité ou les segments de cotations, auxquels les rapports de régression seront instables.

Plusieurs tests (pas tous les tests de stabilité) sont énumérés ci-dessous. Avec ces tests, nous pouvons être sûrs qu’un système de trading affichera un résultat stable, au cas où des conditions de test apparaissent dans une cotation à l’avenir.

Par exemple, le changement d’une direction de tendance descendante à ascendante ou vice versa est un test de point d'interruption. Si ce test n’a pas trouvé de point d'interruption, nous pouvons être sûrs que l’indicateur affichera des résultats stables en cas de changement de tendance.

Test du point d’interruption De Quandt-Andrews

L’hypothèse nulle : l’absence de points d'interruption entre deux observations, espacés de 15 % des extrémités de l’échantillon.

Le test de point d’interruption De Quandt-Andrews effectue la vérification d’un ou de plusieurs points d’interruption de structure inconnus dans un échantillon pour une équation donnée. L’idée de base du test de Quandt-Andrews test est un test distinct du point d’interruption de Chow est effectué pour chaque observation entre dates d’observations t1 et t2. k des statistiques de test de Chow sont en suite,regroupés en un seul test de statistique pour le test of test par rapport à l’hypothèse nulle concernant l’absence de points d’interruption entre t1 ett2.

Ramsey RESET Test

L’hypothèse nulle : l’erreur dans la gestion de la régression est une valeur normalement distribuée avec une moyenne nulle.

La corrélation des séries, l’hétéro-scédasticité ou la loi de distribution anormale pour tous violent l’hypothèse selon laquelle les bruits sont distribués normalement.

RESET - un test courant pour les types d’erreurs de spécification suivants :

  • Variables manquées; X n’inclut pas toutes les variables appropriées;
  • Forme fonctionnelle incorrecte : certaines ou toutes les variables de y et X doivent être transformées par un logarithme, une exponentielle, une valeur inverse ou d’une autre manière ;
  • La corrélation entre X et e peut être provoquée par quelques facteurs, notamment une erreur de mesure X ou la présence d’une valeur de décalage et d’une corrélation dans la série de bruit.

Avec de telles erreurs de spécification, les évaluations OSL seront décalées (l’erreur système n’est pas égale à zéro) et invalides (ne rentre pas dans la quantité évaluée par sa probabilité lors de l’augmentation du nombre d’observations), de sorte que les procédures de sortie ordinaires seront injustifiées.

Résidus Récursifs

Les tests récursifs des résidus sont basés sur les évaluations de régression multiple avec l’augmentation progressive du nombre de barres.

Test de Prévision de Longueur d’Avance

Si nous examinons la définition des résidus récursifs présentés précédemment, nous pouvons constater que chaque résidu récursif est une erreur de prévision d’une longueur d’avance. Si nous voulons vérifier la possibilité que la valeur de la variable dépendante de passer par le modèle ajusté le long de toutes les données jusqu’au point pour l’instant t, chaque erreur doit être comparée à son écart-type par rapport à l’échantillon complet.

Estimations Récursives du Rapport

Ce type permet de suivre la variation des estimations pour n’importe quel rapport lorsque la quantité de données d’estimation dans un échantillon augmente. La figure indique les rapports sélectionnés dans l’équation pour toutes les estimations récursives exécutables. Les chiffres indiquent deux intervalles standard autour des rapports estimés.

Dans le cas où le rapport indique un changement significatif lors de l’ajout des données à l’équation d’évaluation, c’est un signe certain d’instabilité. Les images de rapport peuvent parfois indiquer des sauts spectaculaires, car l’équation postulée tente de surmonter une rupture structurelle.

L’analyse technique comporte un large éventail d’indicateurs dits « adaptatifs », bien qu’il n’y ait aucune tentative de déterminer la nécessité réelle d’une telle adaptation. Les estimations récursives des rapports peuvent résoudre ce problème.


2. Préparation des Données Initiales.

Prenons les prix de clôture des cotations quotidiennes EURUSD du 11 novembre 2010 au 23 mars 2011 pour notre analyse. Les cotations sont reçues du terminal MT4 par F2 et exportées vers Excel.

Le graphique linéaire des cotations se présente comme suit :

Fig. 5. Graphique EURUSD

Fig. 5. Graphique EURUSD

Cet exemple indique la nécessité de contrôler les données manquées dans les indicateurs. Nous ne devrions pas croire que les cotations montrées ne sont qu’un cas particulier de cotations de qualité inférieure. Des omissions de données peuvent survenir pour diverses raisons. En outre, nous devrions nous soucier des données manquées pendant les jours fériés aux États-Unis. La question des données manquées devient particulièrement critique lors de la création de systèmes de trading basés sur divers facteurs économiques, tels que la corrélation des taux de change et des indices boursiers, qui ne sont pas négociés jour et nuit.

Dans notre cas simple, il est possible d’effectuer l’interpolation linéaire et de réduire l’influence des données manquées sur les calculs au moins dans une certaine mesure.

En outre, il y a la question des valeurs aberrantes. La question des valeurs aberrantes est plus compliquée que la question des données manquantes. Avant de commencer à chercher les valeurs aberrantes, nous devons répondre à la question suivante: qu’est-ce qu’une valeur aberrante? Je considère qu’une valeur aberrante est un mouvement de prix supérieur à trois écarts-types qui n’a pas été suivi par un mouvement de prix plus fort.

Les valeurs aberrantes ne sont pas déterminées par les cotations mais par leurs résidus : calculons la série en soustrayant la valeur de prix précédente de la suivante – eurusd(i) – eurusd(i+1) (dans la notation MQL). La notation anglaise a plusieurs noms pour cette valeur. C’est « différent » sur le graphique. Le mot « renvois» est utilisé le plus souvent. J’utiliserai le mot « résidu » ici et ci-dessous. C’est la valeur obtenue après suppression d’une tendance dans les cotations. Le tableau des résidus EURUSD se présente comme suit :


Fig. 6. Résidu EURUSD

Fig. 6. Résidu EURUSD

L’écart-type pour les cotations EURUSD est égal à 0,033209. Par conséquent, il n’y a pas de valeurs aberrantes dans nos cotations selon le les critères des valeurs aberrantes formulés.

Dans le cas où des valeurs aberrantes sont présentes, elles peuvent être remplacées par, par exemple, des valeurs pour les données manquées, puis interpolées.

La méthode fournie pour éliminer les valeurs aberrantes n’est pas la seule et, surtout, elle n’est pas correcte. Si le résidu comprend le les résidus de cotations après l’élimination de la tendance, il est tout à fait évident que la taille des valeurs aberrantes dépend de la méthode de détermination de la tendance, c’est-à-dire que la question des valeurs aberrantes doit être prise en compte une fois le problème de détermination de la tendance résolu.

À ce stade, la préparation des données de base pour l’analyse ultérieure est considérée comme terminée.


3. Analyse des Paramètres Statistiques

L’analyse des paramètres statistiques des cotations Forex et l’analyse des cotations EURUSD en particulier sont effectuées pour vérifier la possibilité d’appliquer les indicateurs pour l’analyse et la création de systèmes de trading.

L’algorithme typique de création d’un système de trading se présente comme suit:

  1. Un indicateur est sélectionné (par exemple, la Moyenne Mobile) et un système de trading est créé sur sa base;
  2. Comme il est généralement impossible de créer un système de trading basé sur un seul indicateur, des indicateurs supplémentaires y sont implémentés pour éviter les fausses entrées sur le marché.

En outre, le mantra « ne pas trop s’ajuster, juste ne pas trop faire de sur-ajustement » devrait être prononcé à ce stade.


3.1. Statistique Descriptive

Nous savons par les statistiques que si une cotation avait été soumise à la loi de distribution normale comme une valeur aléatoire, la valeur de l’erreur de calcul moyenne aurait changé en cas de changements dans le nombre de périodes et aurait coïncidé à l’infini avec l’attente mathématique qui est une constante pour la loi normale. Les cotations auraient pu être remplacées par une ligne horizontale droite, le stop loss et le take profit auraient pu être fixés au niveau des écarts-types. Mais ce n’est pas le cas. Examinons les raisons.

Nous vérifierons la conformité des cotations avec la loi normale sur la distribution.

Créons un histogramme de cotations EURUSD qui se présente comme suit:

Fig. 7. Histogramme EURUSD

Fig. 7. Histogramme EURUSD

L’histogramme indique combien de fois un prix défini a émergé dans la fourchette que nous avons sélectionnée.

Selon son apparence, la distribution n’est pas normale, deux sommets gâchent l’ensemble de l’image. Effectuons le test de normalité de Jarque-Bera avec l’hypothèse nulle H0 : la distribution est normale. Le résultat est illustré ci-dessous :

 Paramètre Valeur (fait) Valeur théorique
Moyenne
1.3549
La moyenne doit être égale à la médiane
médiane,
1.3580
La médiane doit être égale à la moyenne
Déviation Standard
0.0332
-
Asymétrie (inclinaison)
0.0909
0.0
Kurtosis
2.1052
3.0
Jarque-Bera
3.5773
0.0
probabilité
0.1671
1.0


Tableau 1 Résultat du test de normalité de la distribution

Selon le critère de Jarque-Bera, la conclusion sur le non-respect de la normalité n’est pas si dogmatique parce que :

  • La moyenne et la médiane coïncident presque
  • Asymétrie est proche de zéro
  • Kurtose est proche de trois
  • Les écarts existants sont bien reflétés par la dernière ligne « Probabilité », qui indique que la distribution est normale avec une probabilité de 16,7186%.

Nous pouvons avoir des attitudes différentes à l’égard de ce chiffre. D’une part, nous ne pouvons pas rejeter l’hypothèse nulle (une cotation est distribuée normalement) au niveau conventionnel de signification, tel que 95%. D’autre part, il est impossible de considérer que la distribution est normale à 16%.

Puisque la moyenne coïncide presque avec la médiane (l’une des caractéristiques de la distribution normale), vérifions si nous pouvons faire confiance aux valeurs calculées de la moyenne. Effectuons le test de l’égalité moyenne en divisant les cotations en sections.

Le résultat est le suivant :

EURUSD
 QuantitéMoyenne
Déviation Standard
 Erreur moyenne
[1.25, 1.3)
4
1.2951
0.0034
0.0017
[1.3, 1.35)
42
1.3262
0.0125
0.0019
[1.35, 1.4)
48
1.3740
0.0133
0.0019
[1.4, 1.45)
9
1.4131
0.0083
0.0027
Tout
103
1.3549
0.0332
0.0032


Tableau 2. Comparaison des valeurs moyennes des segments

Comme l’indique ce test, la moyenne est calculée avec une erreur ayant la valeur la plus typique de 19 pips pouvant atteindre jusqu’à 32 pips.

Compte tenu de cela, nous concluons que nous ne pouvons pas utiliser la moyenne.

La valeur de l’écart-type de 0,033209 semble très suspecte. Ce sont 332 pips! D’une manière générale, un écart-type aussi important est évident: La cotation EURUSD a une tendance, qui est en fait un composant déterministe régulier qui fausse toutes les caractéristiques statistiques des cotations.


3.2. Test de la correction automatique des cotations

Le concept de « caractère aléatoire » est basé sur l’indépendance d’une quantité aléatoire de valeurs les unes par rapport aux autres. L’apparence des cotations permet de trouver les sections de mouvement directionnel - tendances.

Le déterminisme (présence d’une tendance) implique la dépendance des valeurs EURUSD adjacentes qui peuvent être vérifiées en calculant l’auto-corrélation (ACF), c’est-à-dire la corrélation entre les valeurs EURUSD adjacentes.

Les résultats sont indiqués ci-dessous :

Fig. 8.Fonction d’auto-corrélation des cotations EURUSD

Fig. 8. Fonction d’auto-corrélation des cotations EURUSD

La probabilité jointe aux statistiques-Q est la même partout et égale à zéro.

Les calculs indiquent que :

  • La valeur de la fonction d’auto-corrélation diminue légèrement et cette diminution est probablement régulière.

La probabilité calculée se réfère au test avec l’hypothèse nulle mais il n’y a pas de corrélation jusqu’au décalage 16 (dans notre cas). Puisque cette probabilité est égale à zéro pour tous les décalages, nous rejetons catégoriquement l’hypothèse nulle sur l’absence d’auto-corrélation (tendance) entre cotations.


3.3. Analyse de la stationnarité des cotations

Nous effectuerons une analyse de stationnarité des cotations EURUSD à l’aide du test de Dickey-Fuller dans ses trois versions: avec un décalage, avec une tendance, sans décalage et une tendance.

Le résultat du test se compose de deux parties: pour EURUSD et pour les cotations EURUSD différenciées désignées sous forme de D (EURUSD).

L’hypothèse nulle de ce test est que EURUSD n’est pas stationnaire (a une racine unitaire). Nous effectuerons les calculs non seulement d’une racine unitaire, mais aussi des caractéristiques statistiques des résultats de différenciation EURUSD. Le tableau de différenciation est présenté ci-dessous :

Fig. 9. Résidu des cotations EURUSD

Fig. 9. EURUSD résidus des cotations

Nous pouvons conclure visuellement que les cotations différenciées EURUSD sont des oscillations aléatoires situées approximativement autour de zéro.

Examinons trois méthodes de calcul du test de stationnarité des cotations EURUSD.

1. Les cotations sans décalage (une constante) et une tendance,pour lesquels la régression a l’aspect suivant:

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1))

La probabilité d’accepter l’hypothèse nulle (la série n’est pas stationnaire) : 0.6961

 VariableRapport
t-statisticsProbabilité d’être égal à zéro
 EURUSD(1)
3.09E-05
0.0488
0.9611
 D(EURUSD(1))
0.2747
2.8759
0.0049

Tableau 3. Résultats des tests de stationnarité sans tenir compte du décalage et de la tendance

Évaluation de l’ajustement de régression à D(EURUSD) par R-carré: 0.07702.

Les conclusions suivantes peuvent être tirées de ces données:

  1. Les cotations EURUSD doivent être reconnues comme non-stationnaires avec une forte probabilité (69%). Nous ne rejetons pas strictement l’hypothèse nulle;
  2. L’incrément D(EURUSD) ne dépend pas de la valeur de prix EURUSD précédente avec une probabilité de 99,5%;
  3. D(EURUSD) dépend entièrement de l’incrément D(EURUSD(1)) précédent;
  4. La valeur du rapport de détermination R-carré = 0,077028 montre la non-conformité complète de la régression avec les cotations différenciées D(EURUSD).

2. Cotation EURUSD avec un décalage (une constante), pour lequel la régression se présente comme suit :

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1)) + С(3)
 VariableRapport
Statistique-tProbabilité d’être égal à zéro 
 EURUSD(1)
-0.0445
-1.6787
0.0964
 D(EURUSD(1))
0.3049
 3.1647
0.0021
 С 0.0603 1.68030.0961


Tableau 4. Résultats des tests de stationnarité tenant compte du décalage

La probabilité d’acceptation de l’hypothèse nulle (la série n’est pas stationnaire) : 0.4389

Évaluation de l’ajustement de régression à D(EURUSD) par R-carré: 0.1028

Les conclusions suivantes peuvent être tirées de ces données:

  1. Les cotations EURUSD doivent être reconnues comme non-stationnaires avec une probabilité assez élevée (43%). Nous ne rejetons pas strictement l’hypothèse nulle;
  2. Nous ne devrions pas inclure la valeur de prix EURUSD précédente et une constante (un décalage) dans l’équation de régression pour l’incrément D (EURUSD), car nous considérons que ces rapports sont égaux à zéro pour le niveau de signification de 5%;
  3. D(EURUSD) dépend entièrement de l’incrément D(EURUSD(1)) précédent;
  4. La valeur du rapport de détermination R-carré = 0,102876 montre la non-conformité complète de la régression avec les cotations différenciées D(EURUSD).

3. Cotation EURUSD avec un décalage (une constante) et une tendance, pour laquelle la régression se présente comme suit :

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1)) + С(3) + С(4) * TENDANCE

La probabilité d’accepter l’hypothèse nulle (la série n’est pas stationnaire) : 0.2541

 VariableRapport
Statistique-t
Probabilité d’être égal à zéro 
EURUSD(-1)
-0.0743
-2.6631
0.0091
D(EURUSD(-1))
0.2717
2.8867
0.0048
C
0.0963
2.5891
0.0111
TENDANCE(11/01/2010)
8.52E-05
2.7266
0.0076

Tableau 5. Résultats des tests de stationnarité tenant compte du décalage et de la tendance

Évaluation de l’ajustement de régression à D(EURUSD) par R-carré: 0.1667

Les conclusions suivantes peuvent être tirées de ces données:

  1. Les cotations EURUSD doivent être reconnues comme non-stationnaires avec une probabilité assez élevée (25%). Nous ne rejetons pas strictement l’hypothèse nulle;
  2. Bien que la probabilité que le rapport étant égal à zéro au cours d’une tendance soit inférieure à 1 %, la valeur de ce rapport est extrêmement faible, c’est-à-dire que la tendance est une ligne horizontale;
  3. La valeur du rapport de détermination R-carré = 0,166742 montre la non-conformité complète de la régression avec les cotations différenciées D(EURUSD).

De ces calculs, la conclusion suivante peut être tirée: dans le cas où les cotations EURUSD de base ne sont pas stationnaires, leur première différence, obtenue en soustrayant la valeur de prix précédente de la suivante, est probablement stationnaire.

Dans ce cas, nous avons supprimé une tendance et un décalage, qui peuvent être décrits par l’équation suivante:

eurusd = c(1) * tendance + c(2),

où c(1) et c(2) sont des constantes qui peuvent être évaluées par la méthode des moindres carrés.

Cette équation est une équation de régression courante qui coïncide complètement avec l’outil de « régression » du terminal MT4. C’est-à-dire que nous avons remplacé la cotation de base par la ligne droite. C’est une méthode largement utilisée dans l’analyse technique, car nous pouvons facilement rappeler une large gamme d’instruments constitués de lignes droites: canaux, niveaux de support et de résistance, niveaux de Fibonacci, Gann, etc.

Les lignes droites sont le premier outil utilisé par tout trader. Mais pourquoi faisons-nous confiance à cet outil ? Pourquoi considérons-nous que les lignes droites sont fiables? Nous répondrons à cette question plus tard dans l’article.

En plus des lignes droites, les indicateurs qui remplacent les cotations de base par certaines courbes sont également utilisés en analyse technique. Nous ferons de même et prendrons deux indicateurs bien connus pour l’analyse: la moyenne mobile exponentielle et le filtre de Hodrick-Prescott.


4. cotations éliminatrices de tendance.

L’utilisation du terme élimination de la tendance « detrending » vise à souligner le lien de cette section avec la notion correspondante d’économétrie. Plus précisément et conformément au modèle de marchés financiers précédemment déclaré, nous devrions parler de l’élimination (detrending) d’un composant régulier des cotations.

Nous avons déterminé trois composants réguliers dans notre cas : la tendance linéaire, la moyenne mobile exponentielle et le filtre de Hodrick-Prescott.

Tous les composants réguliers seront définis comme des séries chronologiques.


4.1. Tendance linéaire

Définissons la tendance linéaire en ajoutant une à la valeur précédente.

Nous évaluerons les rapports de régression linéaire :

eurusd = c(1) * tendance + c(2),

Nous obtenons le graphique combiné d’une cotation de base eurusd, d’une droite de régression décalée verticalement et du résidu obtenu en déduisant la droite de régression de la cotation:

Fig. 10. Graphique EURUSD chart,régression linéaire et résidu

Fig. 10. Graphique EURUSD, régression linéaire et résidus

Maintenant, nous évaluons l’équation suivante en utilisant la méthode des moindres carrés:

EURUSD = С(1)*TREND + С(2)

L’évaluation de l’équation de régression est accompagnée des données suivantes :

Variable
Rapport
 Statistique-t Probabilité d’être égal à zéro
TENDANCE
0.0004
4.4758
0.0000
C
1.3318
223.3028
0.0000

Tableau 6. Résultats des tests de stationnarité de tendance linéaire

Évaluation de la régression correspondant à la cotation R-carré = 0,1655.

Les conclusions suivantes peuvent être tirées du résultat:

  1. Selon le rapport de détermination R-carré, la ligne droite ne peut expliquer les changements dans les cotations que dans 16% des cas;
  2. Le résidu de la déduction de la tendance linéaire de la cotation diffère considérablement de la cotation elle-même. Apparemment, il aura les mêmes défauts statistiques que la cotation.


4.2. Lissage exponentiel

Algorithme Holt-Winters sans composant saisonnier avec des paramètres de lissage pour une cotation (niveau) et une tendance sera sélectionnée pour un lissage exponentiel.

L’idée principale de la méthode:

  • Supprimez la tendance de la série chronologique en séparant le niveau de la tendance;
  • Lissage du niveau (un paramètre);
  • Lissage de la prévision de tendance (paramètre b).

Le résultat obtenu est illustré dans la figure.

Fig. 11. Moyenne mobile exponentielle

Fig. 11. EMA — Moyenne Mobile Exponentielle ;

Nous avons reçu une moyenne mobile exponentielle standard qui traîne un peu mais affiche assez bien la cotation. Les paramètres de lissage sont affichés en haut, la sélection des paramètres n’a pas été effectuée.

Maintenant, nous évaluons l’équation suivante en utilisant la méthode des moindres carrés:

EURUSD = С(1)*EURUSD_EX +С(2)

L’évaluation de l’équation de régression est accompagnée des données suivantes :

Variable
Rapport
 Statistique-tProbabilité d’être égal à zéro
EURUSD_EX
0.9168
24.3688
 0.0000
C
0.1145
2.2504
 0.0266


Tableau 7. Résultats de l’évaluation par régression linéaire

Évaluation de l’ajustement de régression à la cotation R-carré = 0,8546

Les conclusions suivantes peuvent être tirées du résultat:

  1. Selon le rapport de détermination R-carré, la moyenne mobile exponentielle peut expliquer les modifications dans les cotations dans 84% des cas;
  2. Le résidu de la déduction de la moyenne exponentielle de la cotation est similaire à un processus aléatoire avec la loi normale. Admettons qu’il y a un certain sens dans l’analyse plus approfondie de ce résidu.


4.3. Filtre Hodrick-Prescott

Le filtre Hodrick-Prescott dispose du paramètre lambda.

Nous ne traiterons pas de la sélection de ce paramètre et nous le prendrons comme étant égal à 8162.

Le résultat est illustré ci-dessous :

Fig. 12. Filtre Hodrick-Prescott

Fig. 12. Filtre Hodrick-Prescott

Maintenant, nous évaluons l’équation suivante en utilisant la méthode des moindres carrés:

EURUSD = С(1)*EURUSD_HP + С(2)

L’évaluation de l’équation de régression est accompagnée des données suivantes :

Variable
Rapport
Statistique-t
 Probabilité d’être égal à zéro
EURUSD_HP
1.0577
23.9443
0.0000
C
-0.0782
-1.3070
0.1942


Tableau 8. Résultats de l’évaluation de l’ajustement de la régression aux cotations.

Évaluation de l’ajustement de régression à la cotation R-carré = 0,8502

Les conclusions suivantes peuvent être tirées du résultat:

  1. La probabilité que le deuxième rapport (la constante) soit égal à zéro est de 19%. Cela met en doute l’utilisation de la constante dans l’équation de régression;
  2. Selon le rapport de détermination R-carré, le filtre de Hodrick-Prescott peut expliquer les modifications dans les cotations dans 85% des cas;
  3. Le résidu de la déduction du filtre de Hodrick-Prescott de la cotation est similaire à un processus aléatoire avec la distribution normale et il est logique de l’analyser davantage.


5. Diagnostics Rapports

Le diagnostic des rapports comprend les tests suivants :

  1. L’ellipse de confiance définit la corrélation entre les rapports de l’équation de régression : plus l’ellipse est proche d’un cercle, moins la corrélation est grande ;
  2. L’intervalle de confiance définit les limites de la variation des rapports d’équation. En analyse technique, les rapports sont les constantes qui peuvent généralement être modifiées en utilisant le paramètre « période » ou d’une autre manière. Mais dans tous les cas, les rapports ne sont pas considérés comme des valeurs aléatoires. Vérifions, si c’est vrai;
  3. Test des variables manquées – l’hypothèse nulle est prise en compte : une variable indépendante supplémentaire n’est pas importante.
  4. Test des variables redondantes – l’hypothèse nulle : le rapport des variables supplémentaires est égal à zéro ;
  5. Le test des points d’interruption détermine la présence des caractéristiques statistiques des cotations dont les points sont changeants. Vérifions les points de changement de tendance en termes d’analyse technique dans le rôle des points changeants mentionnés. Dans la cotation EURUSD analysée, nous pouvons allouer au moins deux tendances – descendante et ascendante (ici, nous ignorons un mouvement plat).

5.1. Ellipse de confiance

Créons des ellipses de confiance pour chacune des équations de régression :

Fig. 13. Ellipse de confiance pour l’équation 1

Fig. 13. Ellipse de confiance pour l’équation de régression 1

Fig. 14. Ellipse de confiance pour l’équation 2

Fig. 14. Ellipse de confiance de l’équation de régression 2

Fig. 15.Ellipse de confiance de l’équation de régression 3

Fig 15. Ellipse de confiance de l’équation de régression 3


Les conclusions suivantes peuvent être tirées des chiffres:

  1. La corrélation des rapports pour la régression linéaire des tendances est présente et peut être évaluée à peu près à 0,5;
  2. La corrélation de la régression avec la moyenne mobile exponentielle et le filtre de Hodrick-Prescott est pratiquement égale à un, ce qui nécessite l’exclusion des constantes des équations de régression. Une probabilité importante de la constante soit égale à zéro soutient l’idée de son exclusion de l’équation de régression avec le filtre de Hodrick-Prescott.


5.2. Intervalle de confiance

Vérifions l’hypothèse selon laquelle les constantes de l’équation de régression sont des valeurs aléatoires.

Pour ce faire, nous devons créer des intervalles de confiance:

 Variable  Rapport Intervalle de confiance 90% Intervalle de confiance 95%
Limite inférieure
Limite supérieure
% de l’intervalle
Limite inférieure Limite supérieure % de l’intervalle
TENDANCE
0.0004
0.0002
0.0006
74.3362
0.0002
0.0006
88.7168
C
1.3318
1.3219
1.3417
1.4868
1.3200
1.3436
1.7767
        
EURUSD_EX
0.9168
0.8543
0.9793
13.6247
0.8422
0.9914
16.2810
C
0.1145
0.0300
0.1991
147.5336
0.0135
0.2155
176.2960
        
EURUSD_HP
1.0577
0.9844
1.1310
13.8661
0.9701
1.1453
16.5694
C
-0.0782
-0.1776
0.0211
254.0276
-0.1970
0.0405
303.5529


Tableau 9. Niveaux de confiance des rapports de régression

En examinant les intervalles de confiance, nous pouvons constater que le rapport est une valeur aléatoire qui agit en fonction de son état – tandis que la confiance augmente (la largeur du canal se rétrécit), la largeur de l’intervalle se développe.

La colonne « % de l’intervalle » est d’un grand intérêt, car elle représente la relation en pourcentage de la largeur de l’intervalle de valeur du rapport à la valeur du rapport. Comme nous pouvons le constater, cette quantité pour les constantes de régression avec la moyenne exponentielle et le filtre a des valeurs complètement inacceptables de plus de 100%! il est nécessaire de mentionner à nouveau que les rapports de corrélation entre deux rapports de ces équations sont presque égaux à un.

Supprimons la constante des équations et réévaluons les rapports de régression.

Le résultat suivant sera obtenu :

 Variable  Rapport Intervalle de confiance 90% Intervalle de confiance 95%
Limite inférieure Limite supérieure % de l’intervalle Limite inférieure Limite supérieure % de l’intervalle
EURUSD_EX1.0014
0.9999
1.0030
0.3131
0.9996
1.0033
0.3742
EURUSD_HP
1.0000
0.9984
1.0015
0.3127
0.9981
1.0018
0.3737

Tableau 10. Intervalles de confiance des rapports de régression recalculés

Je n’afficherai pas les nouveaux calculs pour les régressions avec la moyenne exponentielle et le filtre afin de ne pas rendre l’article trop volumineux.

Je mentionnerai simplement que les équations de régression suivantes seront utilisées plus loin:

EURUSD = 1.00149684612*EURUSD_EX

EURUSD = 1.00002609628*EURUSD_HP


5.3. Variables manquées et excessives (indicateurs)

Un algorithme de création de système de trading typique se compose des étapes suivantes. Certains indicateurs sont pris et utilisés pour tester un système de trading. Ensuite, un indicateur supplémentaire est ajouté pour trier les faux déclencheurs du système de trading, etc.

Cet algorithme ne peut pas afficher quand un trader doit s’arrêter. Il n’est pas en mesure d’indiquer si des indicateurs supplémentaires sont nécessaires ou s’il est nécessaire d’exclure certains indicateurs du système de trading. La théorie existante de la création de systèmes de trading ne peut pas répondre à ces questions, mais les réponses peuvent être trouvées lors de la réalisation du test pour les variables manquées et excessives (indicateurs).

Test des variables manquées – l’hypothèse nulle est prise en compte : une variable indépendante supplémentaire n’est pas importante.

Créons un indicateur complexe parmi les trois que nous avons:

EURUSD = C(1)*TREND + C(2) + C(3)*EURUSD_EX + C(4)*EURUSD_HP

En évaluant les rapports de cet indicateur intégral (régression), nous obtiendrons le résultat suivant :

EURUSD = 1,41879198369e-05*TREND - 0,00319950161771 + 0,50111527265*EURUSD_EX + 0,501486719095*EURUSD_HP

La probabilité que les rapports appropriés soient égaux à zéro est indiquée dans le tableau suivant :

 Variable RapportProbabilité d’être égal à zéro
TENDANCE
 1.42E-05
 0.7577
C
 -0.0032
 0.9608
EURUSD_EX
 0.5011
 0.0000
EURUSD_HP 0.5014 0.0004


Tableau 11. Évaluation de la probabilité que les rapports des indicateurs soient égaux à zéro

Le tableau indique que nous n’aurions pas dû inclure l’indicateur TREND et la constante, car nous pouvons être sûrs que leurs rapports sont égaux à zéro.

Ajoutons un indicateur intégral de plus (le carré de la moyenne exponentielle eurusd_ex^2) au précédent et effectuons le test de la variable manquée (eurusd_ex^2) avec l’hypothèse nulle : la variable supplémentaire eurusd_ex^2 n’est pas importante.

Selon les statistiques t et F calculées, la probabilité que la variable supplémentaire (eurusd_ex^2) ne soit pas importante est égale à 44,87%. Sur cette base, nous pouvons soutenir que des indicateurs supplémentaires ne sont pas nécessaires dans notre système de trading.

Mais ce qui est encore plus intéressant, c’est l’estimation de l’indicateur global avec eurusd_ex^2 supplémentaires indiqués dans le tableau:

Variable
 RapportProbabilité d’être égal à zéro
TENDANCE
1.69E-05
0.7154
C
1.9682
0.4496
EURUSD_EX
-2.3705
0.5317
EURUSD_HP
0.4641
0.0020
EURUSD_EX^2
1.0724
0.4487

Tableau 12. Évaluation de la probabilité des rapports globaux de l’indicateur soient égaux à zéro avec eurusd_ex^2

Le tableau indique que seul l’indicateur basé sur le filtre Hodrick-Prescott attire un certain intérêt.

Test des variables redondantes – l’hypothèse nulle : le rapport des variables supplémentaires est égal à zéro.

Essayons d’examiner cela de l’autre côté et effectuons le test des variables redondantes avec l’hypothèse nulle: le rapport des variables redondantes est égal à zéro. Nous indiquerons la tendance c comme variables redondantes dans notre indicateur complexe.

Selon les statistiques t et F calculées, la probabilité que les variables redondantes de tendance et c soient égales à zéro est de 92,95%. Sur cette base,nous pouvons avancer que notre système de trading a des variables de tendance et c redondantes. Cela correspond assez bien aux résultats précédents.

L’évaluation de l’indicateur global composé de la moyenne exponentielle et du filtre de Hodrick-Prescott affiche l’aspect suivant:

Variable
Rapport
Probabilité d’être égal à zéro
EURUSD_EX
0.4992
0.00
EURUSD_HP
0.5015
0.00


Tableau 13.
Évaluation de la probabilité que les rapports globaux des indicateurs soient égaux à zéro, dans le cas où cet indicateur se compose de la moyenne mobile exponentielle et du filtre de Hodrick-Prescott

c’est-à-dire que nous n’avons aucun doute sur l’utilité d’utiliser ces indicateurs dans le système de trading.


6. Diagnostic des Résidus

6.1. Auto-corrélation - Q Statistiques

Fig. 16.Fonction d’auto-corrélation après déduction de la tendance linéaire

Fig. 16. Fonction d’auto-corrélation après déduction de la tendance linéaire

Le corrélogramme indique que la déduction de la tendance linéaire de la cotation de base n’annule pas la présence d’une tendance, comme l’indique ACF. La probabilité de l’absence de corrélation est égale à zéro, c’est-à-dire que nous rejetons strictement l’hypothèse nulle à tous les niveaux de signification.

Fig. 17.Fonction d’auto-corrélation après déduction du lissage exponentiel

Fig. 17. Fonction d’auto-corrélation après la déduction dulissage exponentiel

Le corrélogramme indique que la déduction de la courbe exponentielle de la cotation de base a exclu la tendance de tous les chandeliers plus élevés que le second, comme l’indique ACF.

Selon les calculs, la probabilité de l’absence de corrélation est égale à zéro, c’est-à-dire que nous rejetons strictement l’hypothèse nulle à tous les niveaux de signification.

Mais si nous consentons des efforts supplémentaires et excluons la corrélation aux deux premiers chandeliers, alors nous serons en mesure d’obtenir le résidu sans corrélations.

Fig. 18.Fonction d’auto-corrélation après déduction du filtre Hodrick-Prescott

Fig. 18. Fonction d’auto-corrélation après déduction du filtre Hodrick-Prescott

Le corrélogramme indique que la déduction du filtre de Hodrick-Prescott de la cotation de base a exclu la tendance de tous les chandeliers plus élevés que le troisième, comme le montre ACF. La probabilité de l’absence de corrélation est égale à zéro, c’est-à-dire que nous rejetons strictement l’hypothèse nulle à tous les niveaux de signification. Mais si nous consentons des efforts supplémentaires et excluons la corrélation aux deux premiers chandeliers, alors nous serons en mesure d’obtenir le résidu sans corrélations.

Conclusion. La tentative d’éliminer le composant déterministe en déduisant nos indicateurs de la cotation de base EURUSD a complètement échoué pour la tendance linéaire et a partiellement réussi pour la moyenne mobile exponentielle et le filtre Hodrick-Prescott.

L’analyse ultérieure de nos indicateurs devient dénuée de sens en raison de l’auto-corrélation (composant déterministe). Nous devons trouver un tel indicateur qui permette d’exclure l’auto-corrélation dans les résidus. Nous le ferons dans la prochaine section.


7. Création et examen de l’analyse de l’indicateur

À l’heure actuelle, nous n’avons pas de théorie formelle pour créer un ensemble d’indicateurs. Le seul moyen est la recherche directe avec la sélection d’un ensemble en fonction des résultats de l’analyse.

D’après l’analyse d’auto-corrélation précédente, il a été conclu que l’auto-corrélation aux premières cotations des chandeliers est restée après l’élimination de la tendance(detrending).

Examinons l’équation suivante en tenant compte du fait mentionné:

EURUSD = C(1)*EURUSD_HP(1) + C(2)*D(EURUSD_HP(1)) + C(3)*D(EURUSD_HP(2))

D(EURUSD_HP(1)) désigne le résidu entre la cotation et le lissage du filtre Hodrick-Prescott, le premier décalage (la deuxième barre, pas la première lors du calcul des barres à partir d’un).

L’évaluation de ces rapports d’équation à l’aide de la méthode des moindres carrés conduit aux résultats suivants:

 VariableRapport
Probabilité d’être égal à zéro
EURUSD_HP(1)
1.0001
0.0000
D(EURUSD(1))
0.8262
0.0000
D(EURUSD(-2))
-0.48810.0000


Tableau 14. Résultats de l’évaluation des rapports à l’aide de la méthode des moindres carrés

Selon le test des variables excessives et les statistiques t et F calculées, la probabilité que les rapports en présence des variables eurusd(1) et eurusd(2) soient égaux à zéro est nulle, c’est-à-dire que ces deux variables ne sont pas excessives.

L’auto-corrélation indique l’absence de dépendances jusqu’au décalage 16 avec une probabilité supérieure à 70% (première ligne de signature) :


Fig. 19. Auto-corrélation du résidu

Fig. 19. Auto-corrélation des résidus

Le test d’hétéro-scédasticité de White donne le résultat concernant les statistiques F confirmant que l’hétéro-scédasticité est absente avec une probabilité de 80%.

L’examen du point d'interruption selon le test de Quandt-Andrews avec l’hypothèse nulle: « pas de points d’arrêt » donne le résultat: l’hypothèse nulle avec une probabilité de 71% est acceptée (pas de points d'interruption).

Il convient de mentionner une fois de plus que les cotations examinées ont au moins un point d'interruption (un renversement de tendance) selon l’analyse technique standard. Mais notre indicateur a des paramètres statistiques similaires à la fois pour les tendances descendantes et ascendantes et, par conséquent, il est invariable à l’état du marché.

Test intégral de Ramsey avec l’hypothèse nulle: « les erreurs dans la gestion de la régression est une valeur normalement distribuée » avec une probabilité de 48% par t et F-statistiques est acceptée. Sur cette base,nous pouvons négliger l’auto-corrélation des résidus et son hétéro-scédasticité.

En outre, cela indique que les évaluations des carrés linéaires ne sont pas décalées (l’espérance mathématique de la valeur examinée coïncide avec la valeur examinée) et qu’il est possible d’effectuer le test des résidus récursifs.

Testons la prévision des résidus récursifs d’une longueur d’avance. La partie supérieure de la figure donne les résidus récursifs et les lignes de limitation à deux écarts-types. En outre, l’axe de gauche montre la probabilité pour les chandeliers de cotations, à laquelle l’hypothèse de constance du rapport indicateur serait déviée au seuil de signification de 5%, 10% et 15%. Il n’y a pas tellement de ces points, mais leur existence indique un faux déclenchement de stop loss et de take profits.

Fig. 20. Test de prévision des résidus récursifs

Fig. 20. Test de prévision des résidus récursifs

Nommons les estimations récursives des rapports d’équation de régression. Le graphique se forme comme suit: les valeurs des rapports pour la barre d’extrême gauche sont calculées. Ensuite, une barre est ajoutée et les valeurs des rapports sont calculées encore et encore jusqu’à la toute dernière barre. Dans le cas d’une petite quantité de barres sur le côté gauche, les valeurs des rapports sont très instables, bien sûr. Cependant, alors que le nombre de barres utilisées pour le calcul est augmenté, la stabilité (constance) se renforce également.

Fig. 21. С(1) Estimations récursives du rapport

Fig. 21. Estimations récursives du rapport C(1)

Fig. 22. Estimations récursives du rapport С(2)

Fig. 22. Estimations récursives du rapport С(2)

Fig. 23. Estimations récursives du rapportС(3)

Fig. 23. Estimations récursives du rapport C (3)

Les chiffres indiquent qu’une certaine instabilité a été observée au début de l’intervalle des cotations, mais nous pouvons alors considérer que les valeurs des rapports sont devenues stables. Cependant, à proprement parler, les rapports de notre équation de régression ne sont pas des constantes.


Conclusion


Cet article a présenté une preuve de plus du fait que les données financières ne sont pas stationnaires. La méthode standard de division des données non stationnaires en somme de données a été utilisée dans l’article pour obtenir un résidu stationnaire.

Ayant un résidu stationnaire des cotations de base, nous pouvons répondre à la question principale concernant la stabilité de l’indicateur obtenu.

Les informations présentées dans l’article ne sont que le début d’une création de système de trading qui peut et doit être basée sur les prévisions de cotations.


Liste des références

EViews 7. Guide de l’utilisateur II.


Traduit du russe par MetaQuotes Ltd.
Article original : https://www.mql5.com/ru/articles/320

Utiliser l'Analyse Discriminante pour Élaborer des Systèmes de Trading Utiliser l'Analyse Discriminante pour Élaborer des Systèmes de Trading
Lors de l’élaboration d'un système de trading, il se pose généralement un problème de sélection de la meilleure combinaison d'indicateurs et de leurs signaux. L'analyse discriminante est l'une des méthodes pour trouver de telles combinaisons. L'article donne un exemple d’élaboration d'une évaluation environnementale pour la collecte de données de marché et illustre l'utilisation de l'analyse discriminante pour la construction de modèles prognostiques pour le marché FOREX dans le logiciel Statistica.
Prévision de Séries Chronologiques à l'Aide du Lissage Exponentiel Prévision de Séries Chronologiques à l'Aide du Lissage Exponentiel
L'article familiarise le lecteur avec les modèles de lissage exponentiel utilisés dans la prévision à court terme des séries chronologiques. De plus, il aborde les questions liées à l'optimisation et à l'estimation des résultats prévisionnels et fournit quelques exemples de scripts et d'indicateurs. Cet article sera utile pour une première prise de connaissance des principes de prévision à partir de modèles de lissage exponentiel.
Prévision de séries chronologiques à l'aide du lissage exponentiel (suite) Prévision de séries chronologiques à l'aide du lissage exponentiel (suite)
Cet article vise à faire évoluer l'indicateur créé précédemment et traite brièvement d'une méthode d'estimation des intervalles de confiance des prévisions à l'aide du lancement et des quantiles. En conséquence, nous obtiendrons l'indicateur de prévision et les scripts à utiliser pour estimer l'exactitude des prévisions.
Analyse des Principales Caractéristiques des Séries Chronologiques Analyse des Principales Caractéristiques des Séries Chronologiques
Cet article présente une classe conçue pour donner une estimation préliminaire rapide des caractéristiques de diverses séries chronologiques. Au fur et à mesure que cela se produit, les paramètres statistiques et la fonction d'auto-corrélation sont estimés, une estimation spectrale des séries chronologiques est effectuée et un histogramme est créé.