Bernoulli, Moab-Laplace-Theorem; Kolmogorov-Kriterium; Bernoulli-Schema; Bayes-Formel; Tschebyscheff-Ungleichungen; Poisson-Verteilungsgesetz; Theoreme von Fisher, Pearson, Student, Smirnov usw., Modelle, einfache Sprache, ohne Formeln. - Seite 7

 
sever31: Was sind "Schwänze" in einer Verteilung? Handelt es sich um Ausreißer, die eindeutig aus dem allgemeinen Muster der Verteilung herausfallen?

Nun, ungefähr, aber nicht ganz. Ja, es geht um Werte einer Zufallsvariablen, die sich stark von ihrem Mittelwert unterscheiden.

Normalerweise gibt es Schwänze in dick und dünn. Hier ist eine sehr lockere Definition eines Ausreißers: Es ist die Wahrscheinlichkeit, dass ein Ausreißer einen bestimmten Wert überschreitet.

Die Dicke des Ausreißers wird nicht durch die Größe des Ausreißers selbst, d. h. die Abweichung vom Mittelwert, bestimmt, sondern durch die Wahrscheinlichkeit solch starker Abweichungen. Je höher er ist, desto dicker ist der Schwanz.

Bei einer Normalverteilung wird im Allgemeinen davon ausgegangen, dass sie dünne Schwänze hat. Mir ist keine praktische Verteilung bekannt, deren Schwänze dünner sind als die der Normalverteilung.

Und nun eine noch genauere Definition von Schwänzen. Aber zuerst ein Bild und eine kleine Einführung:

Dies ist das bekannte Bild einer Glocke, d. h. einer Gaußschen Verteilung. Die hier gezeichnete Kurve ist die Dichtefunktion der Verteilung (hier eine Normalverteilung). Unten sind Sigmas - Standardabweichungen - eingezeichnet. Sigma ist ein Maß dafür, wie eng oder weit eine (beliebige) Verteilung ist.

Die Fläche unter jeder Verteilungsdichtefunktion (f.p.r., in der englischen Literatur pdf, probability distribution function) ist immer 1.

Jedes pdf ist nicht-negativ. Dies spiegelt die Tatsache wider, dass die Wahrscheinlichkeit immer nicht-negativ ist.

Will man die Wahrscheinlichkeit ermitteln, dass eine Zufallsvariable zwischen Sigma und zwei Sigmas (rechts vom Mittelwert) liegt, so genügt es, die Fläche unter der Kurve zu ermitteln, die durch die senkrechten Linien "+ Sigma" und "+ 2*Sigma" begrenzt wird. Bezeichnen wir sie wie folgt: P( sigma <= X < 2*sigma). Beachten Sie, dass diese Funktion selbst bei +1000*Sigma noch nicht gleich Null ist. Ja, sie nimmt sehr schnell ab (wie mathExp(-x^2)), aber sie wird nicht Null.

Nun zurück zu den Schwänzen. Das rechte Ende ist die Funktion right_tail( X; X0 ) = P( X0 <= X < unendlich ). Bitte beachten Sie nochmals, dass der Schwanz genau eine Funktion von X0 ist. Je größer X0 (nach rechts), desto kleiner ist die Funktion in der Regel. D.h. normalerweise (nicht immer, aber asymptotisch immer) ist diese Funktion eine abnehmende Funktion von X0 und tendiert gegen Null.

Für die Normalverteilung right_tail_normal( X; X0 ) ~ mathExp(-X0^2) oder etwas Vergleichbares (kann mich nicht erinnern, es ist eine nicht elementare Funktion).

Aber für die Laplace-Verteilung (siehe Bild in meinem vorherigen Beitrag):


right_tail_laplace( X; X0 ) ~ mathExp(-a*X0). Hinweis: Dies ist bereits eine weitere Funktion, die viel schneller gegen Null tendiert als der Schwanz der Normalverteilung!

Und hier ist eine weitere - die Cauchy-Verteilung:


Für sie right_tail_cauchy( X; X0 ) ~ 1 / X0. Diese Funktion geht noch langsamer gegen Null, wenn x zunimmt.

Wir haben drei verschiedene right_tail( X; X0 ) Funktionen gesehen. Der eigentliche Unterschied zwischen den Schwänzen der verschiedenen pdf's liegt in den unterschiedlichen Abnahmeraten dieser Funktion für verschiedene pdf's. Bei der Normalverteilung nimmt die Funktion sehr schnell ab (dünner Schwanz), bei der Laplace-Verteilung nimmt sie recht schnell ab, aber unendlich schneller als die erste (bereits dicker Schwanz), bei der Cauchy-Verteilung ist sie unendlich schneller als die beiden ersten (unheimlicher dicker Schwanz).

 
Mathemat:

Es ist keine gute Idee, eine Normalverteilung zu illustrieren. Ich bin mir nicht sicher, ob das Anhalten des Prozesses bei, sagen wir, 10.000 eine exakte Normalverteilung im Querschnitt ergibt. Außerdem hat diese Verteilung Parameter, die sich ständig ändern.

Bitte erläutern Sie diesen Punkt, wenn möglich. Ehrlich gesagt, verstehe ich nicht, warum die Glocke, die erscheint, nicht normal ist. Der Punkt ist, dass jede Linie eine Wanderungsbahn eines Teilchens ist, alle Teilchen haben den gleichen binomischen Prozess der Zunahme und eine endliche und gleiche Anzahl von Schritten, folglich hat jeder aggregierte Prozess identische aggregierte Eigenschaften. Wie können sich die Parameter ändern?
 
C-4:
Könnten Sie diesen Punkt näher erläutern? Um ehrlich zu sein, verstehe ich nicht, warum die Glocke, die gezogen wird, nicht normal ist? Der Punkt ist, dass jede Linie eine Trajektorie der Wanderung des Teilchens ist, alle Teilchen haben den gleichen binomischen Prozess der Inkremente und endliche und gleiche Anzahl von Schritten, . Wie können sich die Parameter ändern?

Natürlich möchte ich genau das von Ihnen wissen.

1. "Alle Teilchen haben den gleichen binomischen Akkretionsprozess" - erklären Sie, was das bedeutet. Dies ist das erste Mal, dass ich von einem solchen Verfahren höre. Wie lautet die Verteilungsfunktion der Inkremente?

2. "Daher hat jeder Aggregatprozess identische Aggregateigenschaften" - auch das ist völlig unverständlich und überhaupt nicht mathematisch.

Wenn Sie einen "Querschnitt" dieser gesamten Reihe von Flugbahnen an der Abszisse, sagen wir 10000, erstellen, dann wird jede Flugbahn dort einen Punkt markieren. Wie können Sie sicher sein, dass alle diese Punkte genau nach dem Normalgesetz verteilt sind?

 
Mathemat:

Wenn man alle diese Flugbahnen auf der Abszisse "kreuzt", z.B. 10000, dann markiert jede Flugbahn dort einen Punkt. Wie können Sie sicher sein, dass alle diese Punkte genau nach dem Normalgesetz verteilt sind?


Der zentrale Grenzwertsatz. Die fragliche Zufallsvariable ist die Summe einer großen Anzahl (10000) unabhängiger Zufallsvariablen, was bedeutet, dass ihre Verteilung nahe an der Normalverteilung liegt.
 

1. "все частицы обладают одним и тем же биноминальным процесоом приращения" - поясните, что это означает. Я впервые слышу о таком процессе. Какова функция распределения приращений?

Vielleicht habe ich mich nicht richtig ausgedrückt. Ich meinte dies, was wiederum aus der Akkumulation von diskreten Zufallsvariablen resultiert: -1 и +1.

Wenn man die gesamte Ansammlung von Flugbahnen an der Abszisse, sagen wir 10000, "durchschneidet", dann markiert jede Flugbahn dort einen Punkt. Wie können Sie sicher sein, dass alle diese Punkte genau nach dem Normalgesetz verteilt sind?

Nun verstehe ich überhaupt nicht, warum diese Punkte nicht-normal verteilt sein können, wenn jeder von ihnen den gleichen RMS und die gleiche Anzahl von Schritten von 10.000 hat? Wir müssen ein Experiment einrichten und die Wahrscheinlichkeitstreffer aufzeichnen, ich wette, es wird normal sein, mit der Spitze der Glocke bei Null.

 

Sie haben mich überzeugt, Avals.

Ich habe Sie auf den Arm genommen, C-4. Ich verstehe immer noch nicht, was es mit dem "binomialen inkrementellen Prozess" auf sich hat. Nun, nehmen wir an, Sie meinten Inkremente, die nach einem Gesetz mit endlicher Varianz und Varianz verteilt sind.

 
Im Rahmen meiner Forschung musste ich eine zufällige Aktienkurve vom Typ OHLC erstellen. Bei den Renditen ist alles ganz einfach: Wir generieren Zufallszahlen innerhalb bestimmter Grenzen von MO und Varianz (Excel erlaubt so etwas), aber wie man aus diesen Renditen Diagramme vom Typ OHLC erstellt, das ist die Frage. Die Schwierigkeit besteht darin, den normalen Bereich von Höchst- und Tiefstkursen im Verhältnis zu Eröffnungs- und Schlusskursen zu definieren. Deshalb bitte ich Experten um Rat, wie man OHLC aus Rückkehrern richtig macht. Natürlich kann man jeden Tick nach dem Zufallsprinzip generieren und aus der Tick-Historie eines OHLC-Candlesticks "sammeln", aber das ist eine sehr langsame und sinnlose Methode.
 
C-4: Es ist natürlich möglich, jeden Tick nach dem Zufallsprinzip zu generieren und OHLC-Kerzen aus der Tick-Historie "zusammenzusetzen", aber dies ist eine sehr langsame und sinnlose Methode.
Sie ist jedoch sehr genau, da sie nicht die Einführung mehrerer willkürlicher Parameter erfordert. Aber das entbindet nicht von der Notwendigkeit, die statistischen Merkmale des Tick-Prozesses zu kennen :). Und in mancher Hinsicht ist er dem Wiener nicht ähnlich. So ist es zum Beispiel wesentlich ertragreicher als das Wiener Standardverfahren.
 

Ja, in der Tat sehr genau. Aber das Problem ist die Geschwindigkeit. Ich schreibe gerade in C# + WealthLab - und das ist ein ziemlich schwerfälliger Haufen. Ich habe versucht, 100 Balken mit jeweils 3000 Ticks zu generieren, und es dauerte 8-10 Sekunden. Ich benötige mindestens 500 000 Balken, vorzugsweise 3-4 Millionen (etwa 10 Jahre Ein-Minuten-Geschichte).

Es scheint, dass die Eingabe in die Formel sollte Varianz, MO, Anzahl der Ticks, die Ausgabe sollte ein OHLC bar haben. Es sieht so aus.

Vereinfachen wir die Aufgabe für die erste Annäherung: Erzeugen wir ganz "normale" OHLC. Es sei eine klassische Normalverteilung. Ein weiterer Punkt ist, dass wir anschließend auf der Grundlage dieser Formel eine Verteilung generieren möchten, die sich den realen Marktverhältnissen annähert - zum Beispiel die reale Volatilität von Instrumenten und eine darauf basierende zufällige OHLC.

 
Machen Sie, was Sie wollen. Ich kann Ihnen keinen Rat geben, da ich die Merkmale des Tickings nicht kenne.
Grund der Beschwerde: