Tics : distributions de l'amplitude et du délai

 
J'ai téléchargé les données de http://ratedata.gaincapital.com/ pour plusieurs semaines différentes et j'ai essayé de les analyser. C'est une histoire intéressante, cependant !

Voici la deuxième semaine d'avril, du 9 au 13 avril 2007. Le total est de 27516 ticks, soit un peu moins de 4 ticks par minute en moyenne. Et voici les statistiques (le chiffre signifie la différence entre le tick actuel et le précédent) :

-1 : 13600 ticks
+1 : 13742 ticks
0 : 12 ticks (faux ?)
-2 : 71 ticks
+2 : 78 ticks

Et juste un peu plus du reste :

+3 : 3
+4 : 1
+8 : 1
-3 : 5
-4 : 2 ticks.

Tout le reste se retrouve avec 12 ticks, c'est-à-dire rien. Si l'on exclut les zéros, qui sont censés être absents, on obtient que +-1 représente 99,4 % de tous les ticks, et +-2 environ 0,55 %. Le reste est tout simplement absent !

Notons qu'il s'agit d'une semaine assez tendue, au cours de laquelle l'euro a gagné quelques chiffres avec confiance. Ce faisant, l'euro a gagné 142 pips grâce aux singles, 14 pips grâce aux +-2 ticks, et -2 pips grâce à tout le reste.

Quelles sont les conclusions ?

La montée et la descente se font par petites étapes, et non par grandes poussées. Les grandes pointes de tic-tac n'ont aucun effet sur l'image globale du mouvement du taux (s'il était en tendance) !

OK, l'image de la semaine précédente : l'euro a à peine bougé. statistiques :

-1 : 11884 ticks
+1 : 11909 ticks
0 : 18 ticks (faux ?)
-2 : 96 ticks
+2 : 100 ticks

Contribution - plus 33 points.

Et le reste (-31 points) :

-3 : 13
-4 : 3
-5 : 2
-7 : 1
+3 : 6
+4 : 2
+5 : 1
+6 : 1

L'image est différente. Mais encore une fois, +-1 est la grande majorité, ce qui a aussi essentiellement défini le tableau.

Cela devrait-il être le cas - ou s'agit-il de données fortement normalisées et purifiées ?
 
Mathemat:

La montée/descente se fait par petits pas, pas par grandes secousses. Les grands lancers de tic-tac n'ont aucun effet sur le modèle de mouvement global du taux (s'il était en tendance) !

Les cotations sont tout à fait normales, si nous prenons les cotations des sociétés de courtage qui abusent des filtres et sont donc en retard sur les mouvements brusques, alors des écarts de 15-20 pips sont suffisants et les ticks sont deux fois moins.
 
Mathemat:
J'ai téléchargé les données de http://ratedata.gaincapital.com/ pour plusieurs semaines différentes et j'ai essayé de les analyser. C'est une histoire intéressante, cependant !

Voici la deuxième semaine d'avril, du 9 au 13 avril 2007. Le total est de 27516 ticks, soit un peu moins de 4 ticks par minute en moyenne. Et voici les statistiques (le chiffre représente la différence entre le tick actuel et le précédent) :

En divisant 27516 (nombre de ticks dans une semaine) par 5 (nombre de jours dans une semaine), on obtient 5503.2
Si nous examinons les citations du Centre d'histoire, nous constatons ce qui suit



"S'il n'y a pas de différence, pourquoi payer plus ?" (c) :)
 
Est-ce que c'est comme ça que ça devrait être - ou s'agit-il de données fortement normalisées et nettoyées ?

Les données propres doivent toujours présenter une différence d'unité. Plus la différence est précise, c'est-à-dire égale à un, plus elles sont propres.
Un écart de zéro est un écart de tic-tac, ce qui signifie que n'importe quel nombre de tic-tac peut manquer dans ces zéros exactement et même en unités pour ne pas dire plus.
Malheureusement, j'ai identifié un modèle de filtres qui autorisent une différence de un, et rejettent tout ce qui est plus grand, ce qui allonge l'intervalle entre les tics.

Il est difficile d'imaginer la quantité de données qui peuvent être éliminées, et pas de manière séquentielle, en brisant exactement n'importe quelle séquence.
Pour autant que je sache, personne ne s'occupe de la fabrication de données, mais seulement du filtrage des données, et les requotes n'ont rien à voir avec cela.
C'est pourquoi des DC différents peuvent avoir exactement les mêmes données dans la plupart des cas, à l'exception du volume de ces données.
 
Et en général, je ne comprends toujours pas ce que signifie requote en langage tick, il m'a toujours semblé que cela s'exprime uniquement dans l'offre d'un autre prix par le courtier, pas dans la fabrication de données par le courtier, certaines personnes apportent ces informations de telle manière qu'il semble que cela change le tick, c'est-à-dire les timbres tick, l'heure et le prix. C'est donc ça qui est stupide ici, quelqu'un peut-il développer ? La même question, est-ce que quelqu'un est impliqué dans la fabrication des données de tick, des courtiers, en général, c'est-à-dire, est-il possible que des ticks inexistants apparaissent ? D'après ce que je comprends, non, sinon ça n'a aucun sens... Cela pourrait être utilisé contre le courtier en un rien de temps.
 

La question est de savoir quel est l'intérêt de travailler avec des ticks, si seulement la moitié, disons même un tiers, ou même un pour cent pour un jour seulement, est manquante, c'est-à-dire que l'image de l'événement réel est brisée, les données pour lesquelles nous avons commencé l'analyse des ticks sont jetées :) En fait, ces données peuvent être recueillies en attirant des clients sur cette question, des clients de sociétés de courtage complètement différentes. Si l'on dit qu'il y a du filtrage, de l'imprécision, qu'il y a une grande différence dans le montant des ticks entre les sociétés de courtage, alors cela a du sens. Vous aimeriez voir des fluctuations que vous ne verrez pas en utilisant les données d'un seul DC, vous aimeriez voir l'évolution réelle. Si vous prenez l'ADC - Analog to Digital Converter, les développeurs dans ce domaine disent généralement que pour analyser des données numérisées, vous devez les numériser avec des systèmes d'exploitation en temps réel, c'est-à-dire des RTOS, des systèmes comme DOS et QNX, certaines modifications de Linux, sinon une petite partie, une partie de l'image est perdue, et c'est à cause de cela que vous ne pouvez pas voir toutes les influences et les tendances. Vous ne pouvez pas tout voir à un niveau super précis, alors je pose une question, de quelle analyse technique parlez-vous, si vous ne pouvez pas dire où la vague va déferler, parce que le déferlement a été coupé :) Plus l'image du marché est précise, plus nous voyons clairement l'évolution, et dans notre cas, nous ne voyons qu'une image floue. Oui, je comprends que les cotations dépendent de nombreux facteurs, mais pouvons-nous vraiment regarder l'image, si les cotations peuvent changer brusquement, c'est-à-dire juste frappé, alors nous obtenons la situation inverse, les données propres au contraire ne sont pas fusionnées dans la différence un, et si les filtres fonctionnent de telle manière que les cotations réelles sont plus d'un pip de différence dans le prix et c'est ce que les données propres sont. Nous ne pouvons donc pas travailler à une distance inférieure à, disons, une semaine, car la précision de même une minute est très vague, car les sauts qui sont réels, pour nous, n'existent tout simplement pas.

Z.I. : Je pense tout haut :)

 
Et il y a des preuves de cela, en comparant deux DT, j'ai vu exactement une coupure de données, comme des ticks avec une différence de plus d'un pip, ce qui signifie que mon affirmation qu'une différence d'un pip est une donnée précise, est cent pour cent fausse. Un pip garantit que les données peuvent être filtrées à coup sûr. Et le zéro est définitivement une erreur, car les ticks prônent initialement la différence de données :)

P.S. : C'est ainsi qu'on arrive à la vérité, par essais et erreurs... Ugh, combien de temps est passé sur la recherche, dans sa propre erreur, il serait encore pire, si sur ces erreurs serait basé sur un système entier. Donc, merci pour le thème Mathemat. Je vais m'endormir maintenant, sans pensées douloureuses :)
 

Eh bien non, Dieu m'en garde, je n'ai jamais eu l'intention de construire une stratégie sur les ticks. Il me semble que c'est la même chose que de conduire une voiture, en repérant les signes d'un virage par la structure peu profonde de la route sous les roues. Les routes sont entretenues de différentes manières. La bonne nouvelle est que, bien qu'il existe des différences significatives dans les histoires de tiques d'un vendeur à l'autre, les résultats sur les TF pas trop peu profondes sont presque identiques.

 
xnsnet:
Même question, est-ce que quelqu'un est impliqué dans la fabrication de données de ticks, provenant de courtiers, en général, c'est-à-dire qu'il est possible que des ticks inexistants apparaissent ? Pas à ce que je vois, sinon ça n'a aucun sens. ... Cela pourrait instantanément être utilisé contre un courtier.

D'après ce que j'ai lu dans l'Inet et ce que des traders ont dit, certains courtiers (DC) le font ou l'ont fait.
Et il ne s'agit pas de tics, mais de mouvements sérieux de +/- 100 points.
C'était avant les vacances, et après cela il y a eu une mer d'argent perdu en stop loss et appel de marge.
Après cela, la plupart des traders ont cessé d'utiliser les stop loss dans cette société de courtage.
Quel est l'intérêt ici - l'argent reste dans la "cuisine" !
En supposant que quelqu'un ait pu l'utiliser à son avantage, les bénéfices de la société de courtage restent importants.
 
Mathemat:

...Il me semble que c'est la même chose que de conduire une voiture, en repérant les signes d'un virage par la structure peu profonde de la route sous les roues.



Cool. La définition la plus précise des stratégies de tic-tac.
 
Analysons plus en détail les tics. Reprenons la même semaine de tendance, du 9 au 13 avril 2007, et dessinons des graphiques dans MS Excel.

Le premier graphique est un histogramme de la distribution de probabilité des ticks en fonction du temps d'attente depuis le tick précédent (en secondes). Horizontalement - le temps lui-même, verticalement - la fréquence. La distribution est assez régulière et belle, à l'exception d'une région très raide près de zéro. De quel type de distribution s'agit-il ? Ça ne ressemble pas à une distribution de Poisson.



Le second graphique - les mêmes intervalles de tics (temporels), mais disposés dans l'ordre de leur arrivée au cours de la semaine. Horizontalement se trouve l'échelle de temps, verticalement - le temps d'attente en secondes. C'est beaucoup plus difficile ici. Vous pouvez voir une certaine périodicité superposée au processus aléatoire en raison du relâchement de la session asiatique. Comment y faire face - je n'en ai aucune idée.



Et un autre graphique, très intéressant. Il s'agit maintenant des amplitudes des tics, mais aussi de l'ordre d'arrivée. Horizontalement - ligne de temps, verticalement - amplitude. Ici, la situation est presque sans ambiguïté : il n'y a pas d'hétérogénéité temporelle particulière comme dans le graphique précédent. 99,5% des tiques sont +-1, presque tout le reste est +-2. Le bleu plein entre -1 et +1 indique précisément l'incidence écrasante des tics d'amplitude minimale. Le processus peut être considéré comme presque stationnaire.
Raison: