Une corrélation nulle entre les échantillons ne signifie pas nécessairement qu'il n'y a pas de relation linéaire. - page 51

 
GaryKa:
Alsu, anonyme, aide-moi à comprendre. Qu'est-ce que cela signifie ? Il s'avère que l'apparente corrélation positive entre l'offre et la demande d'un symbole est une fiction. Et la corrélation négative entre les cotations avant et arrière est également quelque chose qui peut être jeté, parce qu'elle n'a ni stationnarité ni ergodicité ?
.
Les quantités que vous mentionnez sont colinéaires, c'est-à-dire qu'elles sont liées par une relation arithmétique. L'étude de la colliniarité est obligatoire dans la construction de modèles statistiques. Les valeurs de colinéarité ne peuvent pas être utilisées dans les calculs statistiques.
 

1. Si vous ne saviez pas comment les séries des exemples ont été obtenues, comment reconnaîtriez-vous (de préférence avec un exemple) qu'il ne s'agit pas de quantités corrélées à 100% mais de quantités colinéaires ? Une contrainte similaire (recherche de colinéarité) s'applique-t-elle à l'autocorrélation?

2. Quelle est la relation arithmétique entre le Bid et le Ask ?

P.S. "Plus on s'enfonce dans les bois, plus les partisans sont épais" il semblerait que nous cherchions l'interrelation, et là, où cette interrelation se révèle le plus nettement, ... déconcerter. Et vous vouliez juste évaluer la corrélation des deux rangs à un moment donné dans le passé.

 
GaryKa:
Il s'avère quel'apparente corrélation positive entre l'offre et la demande d'un symbole est une fiction. Et la corrélation négative entre les cotations avant et arrière peut également être rejetée, puisqu'il n'y a pas de stationnarité
.

Vous pouvez le jeter. Utilisez des rangs stationnaires.

GaryKa:
(3) Comment quantifier les données
Prenez la première différence entre les bougies, ce n'est pas HP BP. Pourquoi devrait-il être normalement distribué si une bougie a X transactions et l'autre a 100X transactions et toutes avec des volumes différents. Vous creusez l'histoire des tiques, l'histoire de niveau II ? Plus elle est profonde, plus les différences entre les courtiers sont importantes.

Vous pouvez quantifier par volume si vous y avez accès.

Vous pouvez ne pas quantifier du tout. La formule de la corrélation sera alors différente.

Dans tous les cas, vous ne parviendrez pas à la normalité par la seule quantification des prix.

GaryKa:

Les offres et les demandes sont simplement de meilleures offres et... et ainsi de suite. Peuvent-ils changer s'il n'y a pas de commerce réel ? Bien sûr. Peuvent-ils rester inchangés en cas d'échange ? Oui, absolument (partiellement exécuté). Prix moyen ! Qu'en est-il des moments où l'écart augmente plusieurs fois, qu'en est-il du milieu de gamme ou de la meilleure gamme ?


Si vous calculez sur la base des prix de transaction, les résultats seront bruyants en raison du rebondissement des cours acheteur et vendeur.

Pour les prix moyens, vous pouvez l'utiliser, si l'instrument est suffisamment liquide.

La meilleure solution consiste à utiliser la moyenne arithmétique entre les prix attendus de deux ordres de marché (achat et vente) d'un certain volume prédéfini. Mais nous avons besoin de données de niveau 2 pour cela.

EconModel:
Les valeurs colinéaires ne peuvent pas participer aux calculs statistiques.

Ce n'est pas vrai :P C'est juste que des méthodes différentes sont utilisées. Par exemple, au lieu de la régression linéaire, vous pouvez utiliser la régression en composantes principales.

EconModel:

La corrélation est une constante. Si chaque échantillon de deux SV pour lequel la corrélation est calculée est statistiquement le même que les autres échantillons de la population générale de ces SV, alors on peut dire que les deux SV sont dépendantes. Plus précisément, leur comportement est similaire. Ceci est valable pour une SV normalement distribuée.

Si les SV ne sont pas normalement distribués, alors la cointégration est appliquée, lorsque la caractéristique de la dépendance mutuelle de deux SV n'est pas un nombre, mais une série avec certaines propriétés.

Les conditions d'applicabilité de la corrélation et de la cointégration ne sont pas écrites correctement. La corrélation (en particulier, les méthodes de rang) est applicable quelle que soit la forme de la distribution, la stationnarité et l'ergodicité des variables aléatoires suffisent. Les tests de cointégration ne dépendent pas non plus de la forme de la distribution, seul le même ordre d'intégration des processus aléatoires est requis (l'ordre doit être supérieur à zéro).

 
Les gars, appliquez au moins une partie de ce qui précède à votre trading, puis évaluez les résultats statistiquement :)
 
anonymous:

Vous pouvez le jeter. Utilisez des rangs stationnaires.

Vous pouvez quantifier par le volume si vous y avez accès.

Vous ne pouviez pas quantifier du tout. La formule de la corrélation sera alors différente.

De toute façon, la quantification des prix ne suffit pas à garantir la normalité.


Si vous effectuez des calculs sur les prix des transactions, les résultats seront bruités en raison de la présence de rebondissements entre les offres et les demandes.

Vous pouvez utiliser le midprice, si l'instrument est suffisamment liquide.

Le meilleur moyen est d'utiliser la moyenne arithmétique entre les prix attendus de deux ordres de marché (achat et vente) d'un certain volume prédéfini. Mais nous avons besoin de données de niveau 2 pour cela.

Ce n'est pas vrai :P C'est juste que des méthodes différentes sont utilisées. Par exemple, la régression en composantes principales peut être utilisée à la place de la régression linéaire.

Les conditions d'applicabilité de la corrélation et de la cointégration ne sont pas écrites correctement. La corrélation (en particulier les méthodes de rang) est applicable quelle que soit la forme de la distribution, la stationnarité et l'ergodicité des variables aléatoires suffisent. Les tests de cointégration ne dépendent pas non plus de la forme de la distribution, seul le même ordre d'intégration des processus aléatoires est requis (l'ordre doit être supérieur à zéro).

Bien sûr, vos remarques sont plus précises que les miennes.

Mais.

Moi, je pense que ma définition est plus correcte car l'application en ressort plus clairement, et pour moi c'est beaucoup plus important que la pureté des définitions. En général, j'essaie d'oublier toutes ces définitions qu'on m'a enseignées à l'institut et de prendre le sens du terme sous la forme d'un code de programme. Prendre un code spécifique, par exemple R, et exécuter ce code pour calculer la cointégration est la définition de ce mot. C'est, à mon sens, le seul moyen de me dissocier de la diversité pseudo-scientifique florissante de la science russe. Cela reflète mon désir de profit, et non de dissertation.

Donc si vous pouviez donner les spécificités d'un paquet, de préférence R, pour étayer ce que vous dites, ce serait super précieux pour moi.

 
tara:
Les gars, appliquez au moins une partie de ce qui précède à votre trading, puis évaluez les résultats statistiquement :)
Je ne comprends pas votre message. Jusqu'à présent, il n'y a aucune discussion sur la voiture ici, juste les boulons et les écrous d'une voiture inconnue. Que faut-il appliquer ? A quoi servent les statistiques ?
 

Messieurs, pouvez-vous me dire si cette série de données est stationnaire ou non stationnaire ?

 
Integer:

Messieurs, pouvez-vous me dire si cette série de données est stationnaire ou non stationnaire ?


Et combien d'observations sont représentées ? Juste deux, ou il y en a une douzaine ?

 
anonymous:


Combien d'observations sont représentées ? Juste deux, ou il y en a une douzaine ?

Beaucoup. Beaucoup.
 
Integer:
Beaucoup. Beaucoup.


Bien alors I(1), instable.