Tics : distributions de l'amplitude et du délai - page 4

 
New:
La première figure au début de la branche montre un exposant de bruit typique. On obtient exactement le même exposant
si l'on calcule, par exemple, le nombre de points que le taux passe en
5 minutes et que l'on crée ensuite un histogramme N à partir du nombre de points.
Merci pour ces informations précieuses, New. Veuillez expliquer ce que signifie un "exposant de bruit typique", c'est-à-dire quelle fonction de densité de probabilité il représente. Il n'est pas nécessaire de donner la formule ; il suffit de donner son nom tel qu'il est accepté dans les statistiques.

La deuxième figure montre l'évolution de la volatilité du marché au cours d'une semaine - la variabilité y est apparente, ses variations sont également de nature aléatoire.

Je ne dis pas qu'il y a là une périodicité strictement déterministe, mais la régularité statistique est là et a un caractère objectif (l'accalmie asiatique). A mon avis, la "partie déterministe" du processus peut être modélisée avec une précision acceptable par une fonction périodique.

Il est plus avantageux de rechercher des modèles à long terme.

Merci encore pour ce rappel. Je fais la même chose, et j'ai décidé d'analyser les ticks non pas pour profiter directement de leur comportement, mais pour, disons, élaborer des tactiques de gestion du risque raisonnables.
 
Mathemat:
Merci pour ces informations précieuses, New. Veuillez expliquer ce qu'est un "exposant de bruit typique", c'est-à-dire à quelle fonction de densité de probabilité spécifique il correspond. Il n'est pas nécessaire de donner la formule ; il suffit de donner son nom tel qu'il est accepté dans les statistiques.


Oui, c'est plutôt un terme d'argot. Si, par exemple, l'amplitude du signal est distribuée de manière aléatoire,
alors le spectre serait similaire à la première figure, c'est-à-dire que le nombre (nombre) de signaux ayant une amplitude plus élevée
diminuerait de manière exponentielle. S'il y avait des anomalies (régularités), il y aurait des "pics et des pointes sur
cet exposant inverse.

L'accalmie asiatique est bien sûr une chose objective, à moins que les Japs ne se déchaînent, mais je pense qu'il est difficile d'utiliser
.
 
New:
Si par exemple l'amplitude du signal est distribuée de manière aléatoire,
alors le spectre sera similaire à la première figure, c'est-à-dire que le nombre (nombre) de signaux ayant une amplitude plus élevée
diminuera de manière exponentielle. S'il y avait des anomalies (modèles), il y aurait des "pics" et des "pointes" sur
cet exposant inverse.
J'ai souligné les mots critiques dans votre réponse. C'est un hasard, non?

Et deuxièmement : notez que le premier graphique n'est pas un histogramme d'amplitudes, mais un histogramme de décalages. Presque tout est plus ou moins clair avec les amplitudes.

P.S. Je n'ai pas trouvé le terme "exposant de bruit" sur Internet.
 
Mathemat:
J'ai souligné les mots critiques dans votre réponse. C'est un hasard, non?

Et deuxièmement : notez que le premier graphique n'est pas un histogramme d'amplitudes, mais un histogramme de décalages. Les amplitudes sont plus ou moins claires.

En fait, peu importe la distribution gaussienne ou l'exposant de Poisson ici et là.
Supposons que les retards soient distribués selon Gauss. Si le maximum gaussien des décalages se situe dans la région de 1 seconde, alors le nombre de décalages de durée t sera N0*(1/exp(t-to)) avec un certain facteur kpf, où N0 est le nombre de décalages au maximum. Pour identifier les spécificités de la distribution, il faut l'étudier soigneusement près du maximum (vous l'avez près de 1 seconde), mais dans la pratique, ce n'est généralement pas nécessaire, et souvent impossible en raison d'erreurs et de limitations - d'où le terme argotique généralisé d'exposant de bruit. Dans la pratique, il est encore une fois plus important de trouver les écarts - si vous avez un pic de décalage par exemple autour de 50 secondes avec N de disons 3000, alors ce serait intéressant.
 

Bien sûr, il n'y a finalement pas de différence particulière entre les distributions de Gauss et de Poisson : il y a un seul pic dans les deux cas, et le comportement de toutes les courbes proches du maximum est le même (parabole), ce qui permet d'ignorer les 3ème et 4ème moments des distributions (asymétries et excès). En fait, les différences entre toutes les distributions monomodes sont absolument éphémères - surtout si elles ont les mêmes exposants. On peut aussi oublier les queues lourdes, ce sont des bêtises, du malin...

P.S. du 31.10.2012 : C'était une blague, mais je n'ai pas été compris à l'époque...

 
Mathemat:
rébus:
Ayez la gentillesse de ne pas abandonner à mi-chemin.
Je ne vais pas l'abandonner : il fait partie d'un projet plus vaste. C'est juste que ce deuxième calendrier est un peu problématique, et je n'ai pas encore de réelles réflexions. Il suffit d'attendre un peu - puis les pensées viendront ...

P.S. Ils l'ont fait. Un seul pour le moment. C'est ce que j'ai fait : sur le deuxième graphique de la première page de la branche, pour aplanir en quelque sorte les différences frénétiques entre les retards des tics, j'ai simplement calculé leurs logarithmes. Voici un processus pseudo-aléatoire de logarithme à retardement pour deux semaines d'avril (1er et 2) :

.......................

Les deux processus sont devenus plus "homogènes" par rapport aux processus des délais eux-mêmes. Les logarithmes des décalages sont maintenant des nombres dans les intervalles d'environ 0 (décalage = 1 seconde) à 7 (décalage supérieur à 1000 sec). ..............
Je soupçonne que la "quasi-stationnarité" du processus de logarithme de retard en fonction du temps n'est pas apparue ici par hasard. ..........
Si vous tracez la fonction de distribution des logarithmes des intervalles entre les ticks,
, vous obtiendrez très probablement quelque chose de proche de la gaussienne.

Il s'agit d'une tendance générale des statistiques - une sorte de corollaire du théorème central limite (CLT).
Si une variable aléatoire est non bornée (c'est-à-dire qu'elle peut prendre des valeurs allant de moins à plus l'infini),
alors, selon le CPT, de nombreux facteurs aléatoires amèneront la fonction de distribution de cette variable à la loi normale.
En supposant, bien sûr, que toutes les hypothèses du TPT soient respectées.

De même, si une variable aléatoire est strictement positive
(par exemple, l'intervalle de temps entre les événements précédents et suivants),
alors cette variable aléatoire obéira à une distribution lognormale.
Ou, de même, le logarithme de cette quantité obéira à une distribution normale.

Ces affirmations sont vraies pour un grand nombre de variables aléatoires.
Par exemple pour les prix, pour le montant des dépôts dans une banque, pour la taille des personnes, etc.
 

De même, si une variable aléatoire est strictement positive
(par exemple, l'intervalle de temps entre les événements précédents et suivants),
alors cette variable aléatoire obéira à une distribution lognormale.

Mak, lis Peters, il est sur Spider. Il dissipera rapidement vos rêves de normalité/lognormalité sur le marché. Quoi qu'il en soit, l'évaluation des risques fondée sur l'hypothèse normale est très éloignée de la réalité.
 
Merci, une autre fois...
Mes rêveries sur ces sujets se sont éteintes il y a environ sept ans.
 
Eh bien, il s'avère qu'il existe déjà des études similaires : http://forum.fxclub.ru/showthread.php?t=32942. Il est vrai que l'objectif de Northwind était quelque peu différent, mais ses messages sont néanmoins très intéressants en termes de style et d'informations - et, plus intéressant encore, il a la même source de tics. Et l'homme semble avoir été sérieusement chargé de prouver expérimentalement le bénéfice sur des données gaussiennes. Les véritables informations sur le sujet sont concentrées sur les deux premières et deux dernières pages du fil.

Mak, vous avez peut-être raison concernant la lognormalité de la distribution des ticks sur les lags, mais on ne peut pas le prouver directement...
 
Voici quelques résultats curieux prouvant que les résultats pour une paire ne peuvent pas être étendus à tout le reste. Prenons _DJI. Il s'agit de l'indice qui est négocié de 15h30 à 22h00 (heure Alpari). Les données vont du 19.06.07 au 22.06.07, soit un total de 38500 ticks.

1. La f.d.p. est en retard sur les ticks :


2. les décalages en fonction du temps (quelques très grands décalages ont dû être supprimés pour voir plus clairement les zones de concentration des décalages ; ces grands décalages sont en fait très peu nombreux) :

3. pdf des amplitudes :


Que voyons-nous ? Le troisième graphique n'est pas surprenant (comme pour l'EURUSD, il y a deux pics aigus), mais les deux premiers nous font réfléchir : les décalages pdf ont des extrémités clairement marquées dans la zone des secondes même et la fonction décalage par rapport au temps le confirme. Peut-être, ceci est lié aux particularités de cotation de cet indice.

Il est intéressant de noter que des graphiques/histogrammes similaires pour l'or ne montrent rien de trop spécial par rapport à l'EURUSD, même s'ils sont certes beaucoup plus "bruyants".
Raison: