Une corrélation nulle entre les échantillons ne signifie pas nécessairement qu'il n'y a pas de relation linéaire. - page 42

 

Oui... Le mot magique "corrélation" induit beaucoup de gens en erreur.

Corrélation == dépendance probabiliste. C'est-à-dire l'auto-illusion. Recherchez une relation linéaire.

 
C-4: Que vont faire les logarithmes pour vous ? Les logarithmes ne peuvent être utilisés que lorsque les points de départ et d'arrivée d'une série sont trop différents dans leur volatilité et leur niveau. C'est-à-dire que si vous analysez les DowJons de 1900 à 2013, vous ne pouvez pas vous en passer, mais dans d'autres cas, vous ne pouvez pas l'utiliser.

Encore une fois, ce fil de discussion semble en avoir déjà parlé.

Pensez à la définition de la corrélation - en termes simples, il s'agit de la relation entre deux ensembles. Pour les ensembles de l'espace linéaire, cette corrélation peut être estimée via le produit scalaire des vecteurs (équivalent au QC de Pearson), et il est par exemple logique pour les vecteurs orthogonaux que cette corrélation soit nulle. Pour les ensembles n'appartenant pas à l'espace linéaire, cette relation doit être estimée différemment. Comment ? Cela dépend déjà des caractéristiques de l'espace. A titre d'exemple, nous pourrions considérer d'autres coefficients de corrélation.

Si les relevés sont sur une échelle relative, ce qui est le cas des cotations (montrant combien de fois une monnaie a "plus de valeur" qu'une autre), alors il est incorrect d'appliquer "purement et simplement" des méthodes linéaires (produit scalaire) aux données brutes. Le logarithme transfère les lectures d'une échelle relative à une échelle d'intervalle, où la même corrélation peut déjà être estimée en utilisant le QC de Pearson.

 
GaryKa:

Encore une fois, ce fil de discussion semble en avoir déjà parlé.

Pensez à la définition de la corrélation - en termes simples, il s'agit d'une relation entre deux ensembles. Pour les ensembles de l'espace linéaire, cette corrélation peut être estimée via le produit scalaire des vecteurs (équivalent au QC de Pearson), et il est par exemple logique que pour les vecteurs orthogonaux cette corrélation soit nulle. Pour les ensembles n'appartenant pas à l'espace linéaire, cette relation doit être estimée différemment. Comment ? Cela dépend déjà des caractéristiques de l'espace. A titre d'exemple, nous pourrions considérer d'autres coefficients de corrélation.

Si les relevés sont sur une échelle relative, ce qui est le cas des cotations (montrant combien de fois une monnaie a "plus de valeur" qu'une autre), alors il est incorrect d'appliquer "purement et simplement" des méthodes linéaires (produit scalaire) aux données brutes. Le logarithme transfère les lectures d'une échelle relative à une échelle d'intervalle, où la même corrélation peut déjà être estimée en utilisant le QC de Pearson.


Pouvez-vous fournir un exemple spécifique où le fait de prendre des logarithmes change la lecture du CQ d'une manière essentielle ? Veuillez me donner un exemple où la série originale donne un QC proche de zéro, alors que ses logarithmes mettent miraculeusement le QC à une estimation significative.

Jusqu'à présent, prenons un exemple :

Corrélation de Pearson entre le prix de l'or et l'intérêt ouvert calculé sur les premières différences sans logarithme : 0.1968

Corrélation de Pearson entre le prix de l'or et l'Open Interest calculé pour ln(Pi/Pi-1) : 0.2067

Maintenant, à cause de la différence de 1%, vous pouvez crier de joie et dire à tous les coins de rue qu'il n'y a pas de solution sans logarithme.

 
alsu:

Le type de distribution de la matrice de corrélation dépend des propriétés des deux séries et de la relation entre elles, c'est-à-dire qu'elle ne doit pas être la même pour toutes les séries possibles... Pour SB c'est un, pour certaines éruptions solaires un autre...
c'est une mesure de l'erreur. Si la distribution est telle que C-4 l'a montré, l'erreur est énorme et la probabilité d'obtenir un écart plus important par rapport à la valeur réelle est presque inexistante. Quel est l'intérêt d'un tel indicateur si, avec une indépendance réelle, on peut obtenir une corrélation de -0,6 à +0,6 avec une probabilité égale ?
 
C-4: Pouvez-vous fournir un exemple spécifique où le fait de prendre les logarithmes change la lecture du CQ d'une manière essentielle ? Veuillez me donner un exemple où la série originale donne un QC proche de zéro, alors que ses logarithmes mettent miraculeusement le QC à une estimation significative.

Je vais essayer de le faire.

C-4: Pendant que vous prenez un exemple :
  • Corrélation de Pearson entre le prix de l'or et l'intérêt ouvert calculé sur les premières différences sans logarithme : 0,1968
  • Corrélation de Pearson entre le prix de l'or et l'intérêt ouvert calculé pour ln(Pi/Pi-1) : 0.2067

Maintenant, à cause de la différence de 1%, vous pouvez crier de joie et dire à chaque coin de rue que sans logarithme vous ne pouvez aller nulle part.

Je ne compte pas les premières différences ... dixièmes non plus)

Sur les données de votre exemple :

  • La corrélation de Pearson sur les données brutes est de 0,767687.
  • La corrélation de Pearson sur les logarithmes des données brutes est de 0,819971.

Cela semble être en assez bon accord avec l'observation visuelle. La différence est de plus de 5%.

Dossiers :
 
GaryKa:

Je vais essayer d'en faire un.

Je ne compte pas les premières différences ... dixièmes aussi...)

...

Voyons d'abord s'il est correct d'utiliser le CQ sur les séries à prix réguliers. Jusqu'à présent, j'ai fourni des données disant que le QC sur I(1) ne peut pas être compté.
 
C-4:
Voyons d'abord s'il est correct d'utiliser QR sur une série de prix réguliers. Jusqu'à présent, j'ai fourni des données indiquant qu'il semble que le QC sur I(1) ne peut être calculé.

Où avez-vous déjà vu une exigence de normalité pour le calcul du CQ ? Une fois de plus, il s'agit d'une exigence pour utiliser l'analyse de corrélation.

Quelle absurdité - le QC ne concerne que les valeurs normalement distribuées........... Il s'avère que vous ne pouvez pas calculer le QC entre, par exemple, les cotations de l'or et de l'argent..........

 
Demi:

Où avez-vous déjà vu une exigence de normalité pour le calcul du CQ ? Une fois encore, il s'agit d'une exigence pour l'utilisation de l'analyse de corrélation.

Quelle absurdité - le CQ est seulement pour les valeurs normalement distribuées..........

Qu'est-ce que la normalité a à voir avec ça ? Encore une fois, I(1) est la somme consécutive d'une série de la forme I(0). I(0) est l'incrément normal, ou le retour. Le type de retours n'est pas important. L'important est que le CQ ne peut être calculé que sur les retours, mais pas sur le prix lui-même.
 
C-4:
L'important est que le CQ ne peut compter que sur les rendements, et non sur le prix lui-même.

Encore une fois, pourquoi ?
 
Demi:
Encore une fois, pourquoi ?


Parce que : 1. Voir l'image ci-dessus.

2. 2. lisez ce qu'écrit Avals :

Avals:
il s'agit d'une mesure de l'erreur. Si la distribution est telle que représentée par C-4, l'erreur est énorme et la probabilité d'obtenir un écart plus important par rapport à la valeur réelle diminue à peine. Quel est l'intérêt d'un tel indicateur si l'on peut obtenir une corrélation de -0,6 à +0,6 avec une réelle indépendance ?

Raison: