Diskussion zum Artikel "Ökonometrischer Ansatz zur Chartanalyse" - Seite 10

 
denkir:

Ich verstehe, ich verwende dafür das Konzept der "Klasse" oder des "Intervalls".

faa1947, in Ihrer Abbildung sehe ich, dass die Verteilung nicht unimodal ist. Das ist ein weiteres Problem.

Dann wird die Anzahl der Klassen (Racks) auch durch einige Formeln, Regeln... berechnet. die bekanntesten sind:

Sturges-Formel, Freedman-Diaconis-Regel, Scott-Regel, Quadratwurzel-Wahl, usw.

Siehe meinen Beitrag oben - Alexey. Dennoch sollten Sie mit der Länge der Stichprobe beginnen, die durch den Zweck der Prognose für den TS bestimmt wird. D.h.: reicht die Länge der Stichprobe aus, um die Frage zu beantworten, ob es möglich ist, eine Pose einzunehmen (eine Pose zu verlassen) oder nicht? Höchstwahrscheinlich wird die Stichprobenlänge nicht signifikant sein (bis zu hundert), und fantastische Verteilungen wie die obige werden verschwinden.
 
-Alexey-:

denkir :

Ich denke, das können Sie. Sie sollten die statistischen Parameter der Stichprobe (insbesondere die Verteilungsparameter) in keiner Weise beeinflussen. Deshalb sind sie Ausreißer.

Worauf stützt sich die obige Aussage? (Das ist übrigens nicht der Grund, warum sie entfernt werden, obwohl sie die Parameter beeinflussen).

Auf der Grundlage, dass der Stichprobenumfang groß genug ist, um nicht von Ausreißern beeinflusst zu werden. Dies ist einer der Gründe, warum ich einen großen Stichprobenumfang befürworte. Dann sagte Kollege faa1947, wenn ich mich nicht irre, dass Ausreißer nicht dasselbe sind wie Ausreißer. Es ist klar, dass ein Ausreißer alle statistischen Parameter der Stichprobe durcheinander bringt, wenn beispielsweise der Eurusd-Kurs in der Stichprobe im Bereich von 1,20 bis 1,50 Dollar schwankt und dann ein Serverfehler auftritt, der den Wert 15,77 Dollar zurückgibt .


-Alexey-:

Eine echte Verteilung charakterisiert die Eigenschaften einer Reihe, aber eine nicht-stationäre Verteilung ist per Definition eine, in der sie sich ändern.

Aber sagen Sie mir, was ist der Zusammenhang zwischen der wahren Verteilung und der Stationarität? Ich gestehe, dass ich einen solchen Zusammenhang noch nie gesehen habe. Woher haben Sie sie, wenn sie nicht ein Geheimnis ist? ;-)


 
faa1947:
См. мой пост выше -Alexey. Все-таки надо начинать с длины выборка, которая определяется целью прогноза для ТС. Т.е.: достаточна ли длина выборки для ответа на вопрос: можно входить  в позу (выходить из позы) или нельзя? Скорее всего длина выборки будет не значительной (до сотни) и исчезнут фантастические распределения, подобные выше приведенному.

Sehen Sie, das ist das Problem. Durch die Verringerung des Stichprobenumfangs können wir ein Phänomen wie das Clustering der Volatilität übersehen. Dann macht es keinen Sinn, ein nicht-lineares Modell zu verwenden. Wir können also ein lineares Modell verwenden. Und das spiegelt nicht die Natur der Finanzreihe wider, ihre Ableitung (nicht zu verwechseln mit der Ableitung in der Matrixanalyse).

Und was sind das für Daten, auf deren Grundlage Sie die bimodale Verteilung erhalten haben? Könnten Sie eine Datei mit den Daten hochladen?

 
denkir:

Sehen Sie, das ist das Problem. Durch die Verringerung des Stichprobenumfangs können wir ein Phänomen wie das Clustering der Volatilität übersehen. Dann macht es keinen Sinn, ein nicht-lineares Modell zu verwenden. Wir können also ein lineares Modell verwenden. Und das wird der Natur der Finanzreihe, ihrer Ableitung (nicht zu verwechseln mit der Ableitung in der Matrixanalyse), nicht gerecht.

Wenn wir uns zum Systemansatz bekennen, sollten wir vom Ziel: Eintritt/Austritt zur Pose tanzen. Wie hoch wird der Quotient im trockenen Rückstand sein? Wenn wir eine begrenzte Stichprobe nehmen, ist Volatilität oder Nicht-Stationarität überhaupt nicht notwendig, oder? Das Modell muss gewählt werden. ARMA (nicht einmal ARIMA) wird häufig verwendet. Wir haben nicht das Ziel, ein bestimmtes Modell anzuwenden. Ziel ist es, eine Vorhersage mit einem vernünftigen Maß an Konfidenzgrenzen zu erhalten. Es ist interessant, die Vorhersage für z.B. 100, 500 oder 1000 Kerzen zu berechnen. Vielleicht werden wir etwas sehen.

Und was sind das für Daten, auf deren Grundlage Sie eine bimodale Verteilung erhalten haben? Könnten Sie eine Datei mit den Daten hochladen?

EURUSD D1 vom 4.1.1999 bis 13.1.2011, 3063 Candlesticks aus dem Terminal.

[Gelöscht]  
denkir:

Auf der Grundlage, dass die Stichprobe groß genug ist, um nicht auf Ausreißer reagieren zu müssen. Das ist einer der Gründe, warum ich für einen großen Stichprobenumfang bin. Dann sagte mein Kollege faa1947, wenn ich mich nicht irre, dass ein Ausreißer nicht dasselbe ist wie ein Ausreißer. Es ist klar, dass ein Ausreißer alle statistischen Parameter der Stichprobe durcheinanderbringt, wenn beispielsweise der Eurusd-Kurs in der Stichprobe zwischen 1,20 und 1,50 Dollar schwankt und dann ein Serverfehler auftritt, der den Wert von 15,77 Dollar ausgibt .


Aber sagen Sie mir, was ist der Zusammenhang zwischen der wahren Verteilung und der Stationarität? Ich gestehe, ich habe noch nie einen solchen Zusammenhang gesehen. Woher haben Sie sie, wenn sie kein Geheimnis ist? ;-)


Ich habe Ihnen auf der letzten Seite mit einem Zitat aus dem Lehrbuch geantwortet. Wenn es nicht klar ist, werde ich es genauer erklären:

Der Begriff der Grundgesamtheit ist in gewissem Sinne dem Begriff der Zufallsvariablen (Wahrscheinlichkeitsverteilungsgesetz, Wahrscheinlichkeitsraum) ähnlich, da er durch eine bestimmte Menge von Bedingungen vollständig bedingt ist.

Ein bestimmter Satz von Bedingungen erzeugt einen stationären Prozess. Ist sie undefiniert, so gibt es keine Grundgesamtheit bzw. keine wahre Verteilung. Die Logik ist ungefähr so. Obwohl ich natürlich falsch liegen könnte.

Nach Ihrer Antwort - die Antwort ist falsch. Übrigens hatte ich gehofft, einen Verweis auf die Matrix zu sehen, auf deren Grundlage Sie die obige Aussage gemacht haben. Wenn Sie diese nicht haben (d.h. Sie wissen nicht, warum Ausreißer entfernt werden und wie sie sich auf die Verteilung auswirken), dann empfehle ich Ihnen, so wie Sie es vorhin bei mir getan haben, den Stoff zu lernen. Bei großen Ausreißern ist alles klar, und Sie haben Recht, wenn Sie anmerken, dass es eine Prüfung für sie geben sollte (eine solche Prüfung kann eine Lücke in den Anführungszeichen erkennen), aber die Frage bezieht sich nicht auf sie, sondern auf 3-4-5 Sigma. Interessant ist auch, dass selbst ohne die Frage zu berühren, ob sie entfernt werden sollten oder nicht, die Methodik ihrer Entfernung (zumindest nach dem oben erwähnten Buch, obwohl es nicht alles sagt) eine sehr große und lange Arbeit ist, wie ich denke, und ziemlich kompliziert.

 
-Alexey-:

Ein bestimmter Satz von Bedingungen erzeugt einen stationären Prozess. Wenn sie unsicher ist, gibt es keine Grundgesamtheit und damit keine wahre Verteilung. Die Logik ist ungefähr so. Allerdings kann ich mich natürlich auch irren.

Laut Wikipedia ist die Grundgesamtheit die Menge der Werte, die ein Forscher für die Analyse ausgewählt hat. Ein Forscher kann aus der Grundgesamtheit nach jeder beliebigen Regel eine Stichprobe ziehen, auch nach einer so zweifelhaften wie der "Stationarität". Es ist normal, wenn eine Regel außerhalb der Konzepte der Statistik gewählt wird, z. B. "alle Transaktionen des Kaufs von Euro für Rubel". Die Transaktionen werden durch einen wirtschaftlichen Prozess erzeugt, den wir nur ungefähr kennen, und wir kennen die Anzahl der Transaktionen nicht. Diese beiden Umstände veranlassen uns, die Nicht-Stationarität als das Hauptmerkmal der Währungsnotierungen zu betrachten, alles andere sind ihre Zeichen.

Bei großen Ausreißern ist alles klar, und Sie haben richtig bemerkt, dass es eine Kontrolle für sie geben sollte (eine solche Kontrolle kann eine Lücke in den Notierungen erkennen), aber die Rede (und die Frage) ist nicht von ihnen, sondern von 3-4-5 Sigmas.

Ferner bringe ich Histogramme von D1-Kursen des Euro-Dollar-Paares in Höhe von 100 Candlesticks.

Hier sind die deskriptiven Statistiken der Stichprobe

Außerdem wurde einer der Close-Werte konsequent auf 3 Sigma, 5 Sigma und 5 Durchschnitt geändert.

Wir sehen:

1. überall Linkshänder.

2. Die Anzahl der Histogrammspalten ändert sich, obwohl überall 20 Intervalle pro 100 Kerzenständer angegeben sind.

3. der p-Wert der Anpassung an das Normalgesetz und dementsprechend der Vertrauensbereich der Anpassung ändert sich.

[Gelöscht]  
faa1947:
Laut Wikipedia: Eine Grundgesamtheit ist eine Reihe von Werten, die ein Forscher für die Analyse ausgewählt hat. Ein Forscher kann die Grundgesamtheit nach jeder beliebigen Regel auswählen, auch nach einer so zweifelhaften wie der "Stationarität". Es ist normal, wenn eine Regel außerhalb der Konzepte der Statistik gewählt wird, z. B. "alle Transaktionen des Kaufs von Euro für Rubel". Die Transaktionen werden durch einen wirtschaftlichen Prozess erzeugt, den wir nur ungefähr kennen, und wir kennen die Anzahl der Transaktionen nicht. Diese beiden Umstände veranlassen uns, das Hauptmerkmal der Devisennotierungen als Nicht-Stationarität zu betrachten, alles andere sind ihre Zeichen.

Die Hälfte davon ist falsch, die andere Hälfte ist untertrieben, ein Teil davon ist richtig. Deshalb ist es wünschenswert, Wiki mit Fachliteratur zu überprüfen, und es - empfohlen vom Bildungsministerium und so weiter - zu haben. Später werde ich eine Definition aus dem enzyklopädischen Wörterbuch der Statistik schreiben. Ich glaube, Sie sind völlig verwirrt.

Eine Grundgesamtheit ist eine Menge von Werten, die ein Forscher für die Analyse ausgewählt hat.

Das ist nur dann der Fall, wenn alle vorhandenen Daten ausgewählt wurden und bekannt ist, dass es keine anderen gibt. Andernfalls, wenn ich 10 Kerzen nehme, ist das eine Stichprobenpopulation, keine allgemeine Population. Wenn man zum Beispiel die Arbeit einer Maschine misst, weiß man, dass es morgen neue Daten geben wird - es gibt nie eine Grundgesamtheit. Die Grundgesamtheit wird durch sie (Stichprobe) bewertet - lesen Sie über Schätzung, über Stichproben. Und bei der Schätzung wird sie nicht nach dem normalen Gesetz angepasst (wenn man nicht weiß, dass es ein solches ist), sondern das Gesetz wird durch spezielle Methoden identifiziert, und solange es unbekannt ist - wie kann man etwas entfernen (ich habe Ihnen einen Link zum Buch gegeben - dort steht es geschrieben). Und es wird nicht nur anhand einer Probe, sondern anhand mehrerer Proben bewertet, spezielle Tests werden verglichen usw.
 
-Alexey-:

Die Hälfte davon ist falsch, die andere Hälfte ist untertrieben, einiges ist richtig. Daher ist es wünschenswert, Wiki mit Fachliteratur zu überprüfen und es vom Bildungsministerium empfehlen zu lassen und so weiter. Später werde ich eine Definition aus dem enzyklopädischen Wörterbuch der Statistik schreiben. Ich glaube, Sie sind völlig verwirrt.

Das ist nur dann der Fall, wenn alle vorhandenen Daten genommen werden und bekannt ist, dass es keine anderen gibt. Andernfalls, wenn ich 10 Kerzen nehme, ist das eine Stichprobenpopulation, nicht eine allgemeine Population. Wenn man zum Beispiel die Arbeit einer Maschine misst, weiß man, dass es morgen neue Daten geben wird - es gibt keine Grundgesamtheit. Die Grundgesamtheit wird daraufhin ausgewertet (Stichprobe) - lesen Sie über Auswertungen. Und bei der Schätzung wird sie nicht an das normale Gesetz angepasst (wenn nicht bekannt ist, dass es ein solches ist), sondern das Gesetz wird durch spezielle Methoden identifiziert, und solange es unbekannt ist, wie kann etwas entfernt werden (ich habe Ihnen einen Link zu dem Buch gegeben - dort steht es geschrieben). Und es wird auch nicht durch eine Probe, sondern durch mehrere bewertet, spezielle Tests werden verglichen usw.

Leider haben Sie sich erlaubt, einzelne Phrasen aus dem Zusammenhang zu reißen, ohne zu versuchen, den Sinn meines Beitrags zu verstehen. Noch einmal. In der Forex-Branche ist die Regel für die Auswahl der Grundgesamtheit alle Geschäfte, die uns nicht bekannt sind. Ich interessiere mich nicht für die Definition aus der Enzyklopädie wie aus Wiki - ich interessiere mich für die Prognose, nicht für statistische Eigenschaften der allgemeinen Bevölkerung. Unter Ihrem Druck bin ich fast in botanische Unzucht geraten und habe sogar das Paket STATISTIK aufgesucht, um die Definition von "Allgemeinbevölkerung" zu sehen: das weltberühmte Paket berücksichtigt dieses Konzept nicht.

Bereinigung von Emissionen. Die Auswirkungen von Emissionen auf die Passform wurden genau untersucht. Wenn Sie die Emission nicht entfernen, erhalten Sie eine falsche Anpassung, das ist der springende Punkt, und das möglicherweise mit sehr guten Eigenschaften. Ändert man den Ausreißer, so ändern sich entweder die Parameter des Gesetzes oder das Gesetz, und das alles nur wegen eines oder zweier Werte in der Stichprobe. Nach der Anpassung besteht keine Notwendigkeit, die Daten zu bereinigen.

Es ist immer noch sehr wünschenswert, dass Sie Lehrbücher und bessere Dokumentationen von Mat-Paketen über Ökonometrie lesen, nicht über Matstatistik - das wird Ihr Verständnis verbessern. Jedes Ökonometrie-Paket beginnt mit der Vorbereitung der Daten für die Analyse, nicht umgekehrt: erst die Anpassung und dann die Datenvorbereitung.

[Gelöscht]  
OK, ich überlasse es Ihnen. Jedes Paket ist nur ein Werkzeug - mehr nicht. Wir scheinen verschiedene Sprachen zu sprechen :) Ich wollte nur nicht, dass die Leser in die Irre geführt werden, aber ich hoffe, dass diejenigen, die es brauchen, es verstehen werden.
 
-Alexey-:
. :) Ich wollte nur nicht, dass die Leser in die Irre geführt werden, aber ich hoffe, dass diejenigen, die es brauchen, es herausfinden werden.

Okay, ich lasse euch in Ruhe.

Ich glaube nicht, dass es die richtige Entscheidung ist.

Jedes Paket ist nur ein Werkzeug - mehr nicht. Wir scheinen unterschiedliche Sprachen zu sprechen.

Bitte verzeihen Sie mir, dass ich Ihnen Ratschläge zu Paketen gebe. Bei theoretischen Argumenten, wie z. B. Diplomarbeiten und Dissertationen, ist Ihr Ansatz durchaus berechtigt und dem meinen vorzuziehen. Aber wir haben ein praktisches Problem, und ein Paket ist nicht nur ein Werkzeug, sondern ein System, in dem viele Konzepte zusammengeführt werden, um ein praktisches Ergebnis zu erzielen. Wir erhalten nicht nur eine eindeutige Interpretation von Begriffen, sondern auch deren eindeutige Berechnung. Der Autor des Artikels erwähnte GARCH, und dies ist ein sehr dehnbarer Begriff, viel weniger eindeutig als "allgemeine Bevölkerung".

Ich hoffe, dass Sie sich weiterhin an diesem Thema beteiligen werden.