Théorème de Bernoulli, Moab-Laplace ; critère de Kolmogorov ; schéma de Bernoulli ; formule de Bayes ; inégalités de Chebyshev ; loi de distribution de Poisson ; théorèmes de Fisher, Pearson, Student, Smirnov etc., modèles, langage simple, sans formules. - page 7

 
sever31: Que sont les "queues" dans une distribution ? S'agit-il de valeurs aberrantes qui sortent clairement du schéma général de la distribution ?

Eh bien, en gros, mais pas tout à fait. Oui, nous parlons des valeurs d'une variable aléatoire qui sont très différentes de sa moyenne.

Habituellement, les queues sont épaisses ou fines. Voici une définition très libre de la queue : c'est la probabilité qu'une valeur aberrante dépasse une valeur donnée.

L'épaisseur de la queue n'est pas déterminée par l'ampleur de la valeur aberrante elle-même, c'est-à-dire l'écart par rapport à la moyenne, mais par la probabilité de tels écarts importants. Plus elle est haute, plus la queue est épaisse.

On considère généralement qu'une distribution normale a des queues fines. Je ne connais pas de distribution pratique dont les queues sont plus fines que celles de la distribution normale.

Et maintenant, une définition encore plus précise des queues. Mais d'abord, une photo et une petite introduction :

Il s'agit de l'image bien connue d'une cloche, c'est-à-dire d'une distribution gaussienne. La courbe dessinée ici est la fonction de densité de la distribution (ici une distribution normale). En bas, sont dessinés les sigmas - écarts types. Le Sigma est une mesure de l'étroitesse ou de l'étendue d'une distribution (quelconque).

L'aire sous toute fonction de densité de distribution (f.p.r., en littérature anglaise pdf, probability distribution function) est toujours égale à 1.

Tout pdf est non-négatif. Cela reflète en fait le fait que la probabilité est toujours non négative.

Si l'on veut trouver la probabilité qu'une variable aléatoire se situe entre sigma et deux sigmas (à droite de la moyenne), il suffit de trouver l'aire sous la courbe délimitée par les lignes verticales "+ sigma" et "+ 2*sigma". Désignons-la comme suit : P( sigma <= X < 2*sigma). N'oubliez pas que même à +1000*sigma, cette fonction n'est toujours pas égale à zéro. Oui, elle diminue très rapidement (comme mathExp(-x^2)), mais elle ne devient pas nulle.

Maintenant, revenons aux queues. La queue droite est la fonction queue_droite( X ; X0 ) = P( X0 <= X < infini ). Notez à nouveau que la queue est exactement une fonction de X0. Plus X0 est grand (vers la droite), plus la fonction est généralement petite. C'est-à-dire que généralement (pas toujours, mais asymptotiquement toujours) cette fonction est une fonction décroissante de X0 et tend vers zéro.

Pour la distribution normale right_tail_normal( X ; X0 ) ~ mathExp(-X0^2) ou quelque chose de comparable (je ne me souviens pas, c'est une fonction non élémentaire).

Mais pour la distribution de Laplace (voir image dans mon post précédent) :


droite_taille_laplace( X ; X0 ) ~ mathExp(-a*X0). Remarque : il s'agit déjà d'une autre fonction qui tend vers zéro beaucoup plus rapidement que la queue de la distribution normale !

Et en voici une autre - la distribution de Cauchy :


Pour cela, right_tail_cauchy( X ; X0 ) ~ 1 / X0. Cette fonction est encore plus lente à se rapprocher de zéro lorsque x augmente.

Nous avons vu trois fonctions right_tail( X ; X0 ) différentes. La véritable différence entre les queues des différentes fdp est le taux de décroissance différent de cette fonction pour les différentes fdp. Pour la distribution normale, la fonction décroît très rapidement (queue fine), pour la distribution de Laplace, elle décroît assez rapidement mais infiniment plus vite que la première (queue déjà épaisse), pour Cauchy, elle est infiniment plus rapide que les deux premières (queue grasse glauque).

 
Mathemat:

Ce n'est pas une bonne idée d'illustrer une distribution normale. Je ne suis pas sûr que l'arrêt du processus à, disons, 10 000 donne exactement une distribution normale dans la section transversale. De plus, cette distribution a des paramètres qui changent constamment.

Veuillez développer ce point si possible. Franchement, je ne comprends pas pourquoi la cloche qui apparaît n'est pas normale. Le point est que chaque ligne est une trajectoire d'errance d'une particule, toutes les particules ont le même processus binomial d'incrémentation et un nombre fini et égal d'étapes, donc tout processus agrégé a des propriétés agrégées identiques. Comment les paramètres peuvent-ils changer ?
 
C-4:
A partir de ce point, si vous pouvez élaborer. Pour être honnête, je ne comprends pas pourquoi la cloche qui est tirée n'est pas normale ? Le point est que chaque ligne est une trajectoire d'errance de la particule, toutes les particules ont le même processus binomial d'incréments et un nombre fini et égal d'étapes, . Comment les paramètres peuvent-ils changer ?

Bien sûr, c'est ce que je veux des détails de votre part.

1. "toutes les particules ont le même processus d'accrétion binomial" - expliquez ce que cela signifie. C'est la première fois que j'entends parler d'un tel processus. Quelle est la fonction de distribution des incréments ?

2. "donc tout processus agrégé a des propriétés agrégées identiques" - eh bien cela aussi est complètement incompréhensible et pas du tout mathématique.

Si vous faites une "coupe transversale" de cet ensemble de trajectoires en abscisse, disons 10000, alors chaque trajectoire marquera un point à cet endroit. Comment pouvez-vous être sûr que tous ces points sont distribués exactement selon la loi normale ?

 
Mathemat:

Si vous "coupez" tout cet ensemble de trajectoires en abscisse, disons 10000, alors chaque trajectoire marquera un point à cet endroit. Comment pouvez-vous être sûr que tous ces points sont distribués exactement selon la loi normale ?


Le théorème de la limite centrale. La variable aléatoire en question est la somme d'un grand nombre (10000) de variables aléatoires indépendantes, ce qui signifie que sa distribution est proche de la distribution normale.
 

1. "все частицы обладают одним и тем же биноминальным процесоом приращения" - поясните, что это означает. Я впервые слышу о таком процессе. Какова функция распределения приращений?

Peut-être que je ne l'ai pas exprimé correctement. Je voulais dire ceci, qui provient à son tour de l'accumulation de variables aléatoires discrètes : -1 и +1.

Si vous "coupez" toute cette accumulation de trajectoires en abscisse, disons 10000, alors chaque trajectoire marquera un point à cet endroit. Comment pouvez-vous être sûr que tous ces points sont distribués exactement selon la loi normale ?

Maintenant, je ne comprends pas du tout pourquoi ces points peuvent être distribués de manière non-normale si chacun d'entre eux a la même valeur efficace et le même nombre de pas de 10 000 ? Nous devons mettre en place une expérience et tracer les coups de probabilité, je parie qu'elle sera normale, avec le sommet de la cloche à zéro.

 

Tu m'as convaincu, Avals.

Je m'en prenais à toi, C-4. Je ne comprends toujours pas le "processusbinomial incrémental". Eh bien, supposons que vous vouliez parler d'incréments distribués selon une loi avec une moyenne et une variance finies.

 
Dans le cadre de mes recherches, j'avais besoin de générer un graphique boursier aléatoire de type OHLC. En ce qui concerne les retours, tout est simple : nous générons des nombres aléatoires dans des limites spécifiées de MO et de variance (Excel permet de faire une telle chose), mais comment créer à partir de ces retours des graphiques de type OHLC, telle est la question. La difficulté consiste à définir la fourchette normale de haut et de bas par rapport à l'ouverture et à la fermeture. C'est pourquoi je demande à des experts de me conseiller sur la manière de faire correctement des OHLC à partir de retours. On peut bien sûr générer aléatoirement chaque tick et le "collecter" à partir de l'historique des tick d'un chandelier OHLC, mais c'est une méthode très lente et dénuée de sens.
 
C-4: Il est bien sûr possible de générer aléatoirement chaque tick et d'"assembler" les bougies OHLC à partir de l'historique des tick, mais cette méthode est très lente et inutile.
Mais elle est très précise, car elle ne nécessite pas l'introduction de plusieurs paramètres arbitraires. Mais cela n'évite pas la nécessité de connaître les caractéristiques statistiques du processus de tique :). Et il n'est pas similaire au Wiener à certains égards. Par exemple, il est beaucoup plus récupérable que le processus de Wiener standard.
 

Oui, très précis en effet. Mais c'est la vitesse qui est le problème. Je l'écris simplement en C# + WealthLab - et c'est assez encombrant. J'ai essayé de générer 100 barres avec 3000 ticks chacune et cela a fini par prendre 8-10 secondes. Je dois générer au moins 500 000 mesures, et de préférence 3 à 4 millions (environ 10 ans d'historique d'une minute).

Il semble que l'entrée de la formule devrait être la variance, le MO, le nombre de ticks, la sortie devrait être une barre OHLC. Ça ressemble à ça.

Simplifions la tâche pour la première approximation : générons un OHLC tout à fait "normal". Soit une distribution normale classique. Par la suite, nous voudrions générer une distribution basée sur cette formule qui se rapproche de celles du marché réel - par exemple, prendre la volatilité réelle des instruments et générer un OHLC aléatoire basé sur celle-ci.

 
Faites ce que vous voulez. Je ne peux pas vous conseiller car je ne connais pas les caractéristiques du processus de tic-tac.
Raison: