Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
Bravo! Toller Beitrag, der viele Themen anspricht. Aber einige Punkte können kritisiert werden. Zum Beispiel einer davon - auf welcher Grundlage haben Sie entschieden, dass Sie Ausreißer entfernen müssen? Man kann sie nicht entfernen.
Ein Ausreißer ist kein Ausreißer. Sie müssen sich die Zitate ansehen. Wenn es sich bei einem Ausreißer um ein relativ seltenes Ereignis handelt, sollte er auf den Schwellenwert reduziert (nicht gelöscht) werden. Ist dies nicht der Fall, ist nicht klar, was zu tun ist. Im Prinzip verzerren Ausreißer die Statistik stark. Jedes Statistikpaket sieht diese Möglichkeit vor und gibt entsprechende Empfehlungen.
Soweit ich weiß, werden Ausreißer in Messungen entfernt, wenn im Voraus bekannt ist, dass die Ergebnisse zumindest durch ein Gesetz vereint sind, d. h. wenn der Prozess, der den Messwert erzeugt, nicht zufällig oder stationär ist, und der Ausreißer durch Zufälligkeit (Überschreitung der Grenzen der Nicht-Zufälligkeit oder der Stationarität) verursacht werden kann, und diese Zufälligkeit ist in diesem Fall eine Verzerrung. Wenn es sich um eine nicht-stationäre Preisreihe handelt, dann ist die Zufälligkeit auf jedem Niveau ein Teil der Statistik (neben dem nicht-zufälligen Teil, aber es ist schwierig, sie zu trennen), und die Entfernung eines Teils der Statistik ist eine Verzerrung der Statistik. Ich bin eher der Meinung, dass wir bei der Arbeit mit einem nicht-stationären Zufallsprozess kein Recht haben, etwas zu entfernen (abzuschneiden). Übrigens haben Sie nicht beantwortet, was Ihrer Meinung nach das eigentliche Ziel z. B. des Trimmens ist. Statistikpakete sind wahrscheinlich darauf ausgerichtet, mit stationären Reihen zu arbeiten, und die Empfehlungen zum Trimmen anomaler Werte sind in diesem Fall gültig.
Wenn dies nicht der Fall ist, ist nicht klar, was zu tun ist.
Soweit ich weiß, werden Ausreißer bei Messungen entfernt, wenn im Voraus bekannt ist, dass die Ergebnisse zumindest durch ein Gesetz vereint sind, d.h. mit anderen Worten, wenn der Prozess, der den gemessenen Wert erzeugt, nicht-zufällig oder zufällig stationär ist, und der Ausreißer durch Zufälligkeit (Überschreitung der Grenzen der Nicht-Zufälligkeit oder Stationarität) verursacht werden kann, und eine solche Zufälligkeit ist in diesem Fall eine Verzerrung. Wenn es sich um eine nicht-stationäre Preisreihe handelt, dann ist die Zufälligkeit auf jedem Niveau ein Teil der Statistik (neben dem nicht-zufälligen Teil, aber es ist schwierig, sie zu trennen), und die Entfernung eines Teils der Statistik ist eine Verzerrung der Statistik. Ich bin eher der Meinung, dass wir bei der Arbeit mit einem nicht-stationären Zufallsprozess kein Recht haben, etwas zu entfernen (abzuschneiden). Übrigens haben Sie nicht beantwortet, was Ihrer Meinung nach das eigentliche Ziel z. B. des Trimmens ist. Statistikpakete sind wahrscheinlich auf die Arbeit mit stationären Reihen ausgerichtet, und die Empfehlungen zum Trimmen anomaler Werte in diesem Fall sind gültig.
Was meinen Sie damit?Auch das ARIMA-Modell befasst sich mit nicht stationären Reihen, indem es sie auf eine stationäre Form reduziert.
Mir scheint, dass das Problem des Kürzens von Zitaten zwei Ebenen hat: eine oberflächliche und eine tiefe.
An der Oberfläche gibt es Probleme, z. B. beim Absenken von Stopps, die nichts mit der Nicht-Stationarität des Marktes zu tun haben.
Das tiefere Problem bei der Anwendung der mathematischen Statistik und der Ökonometrie besteht darin, dass sowohl die Ausgangsdaten als auch die Zwischenergebnisse und die Schlussfolgerungen durch außermathematische - intuitive - Methoden überprüft werden müssen. Die Wahl des Grenzwertes (2, 3, 4 Sigma oder andere) ist nur nach visueller Betrachtung der Grafik möglich und bezieht sich auf das Problem der Wahl der Konfidenzintervalle. Das größte Problem bei der Anwendung der Statistik ist, dass ihre Anwendung ohne die Kunst des Statistikers selbst nicht denkbar ist. Niemand wird die Regel "cut - don't cut" formulieren. Wenn man schneidet, beseitigt man das Merkmal der Nicht-Stationarität, wenn man nicht schneidet, verzerrt man die wahre Verteilung der Grundgesamtheit durch misslungene Stichproben.
Das Herzstück der Ökonometrie ist die Hypothesenprüfung, bei der man Fehler der ersten und zweiten Art machen kann: die richtige Nullhypothese zugunsten der falschen Alternativhypothese verwerfen und die richtige Alternativhypothese zugunsten der falschen Nullhypothese verwerfen.
In Anbetracht der obigen Ausführungen kann ich Ihnen gleichzeitig zustimmen und nicht zustimmen. Es ist unmöglich, Ihre Frage eindeutig zu beantworten, ohne vorher eine bestimmte Stichprobe zu betrachten.
Даже модель ARIMA работает с нестационарными рядами путем приведения их к стационарному виду.
Und selbst danach können sich die Modellreihen im Laufe der Zeit ändern. Schlussfolgerung: Eine nicht-stationäre Datenreihe wurde an ein Modell (eine Methode) angepasst, das für die Arbeit mit einer stationären Reihe entwickelt wurde. Da dies so ist, ist es notwendig, irgendwie zu untersuchen, wie oft die Anpassung durchgeführt werden muss und wie lange sie funktioniert. Wie kann man sonst ein ungeeignetes Modell verwenden?
Hier denke ich, dass die Argumentation falsch ist. Eine nicht-stationäre Reihe hat keine Grundgesamtheit, sonst wäre sie ja eine stationäre Reihe. Und da dies der Fall ist, gibt es keine wahre Verteilung.
Woher wissen Sie, ob der Knockdown stattgefunden hat oder nicht? Wenn man natürlich die Daten mehrerer DCs in der Nähe starker Niveaus, sogar runder Niveaus, analysiert und feststellt, dass einige von ihnen den Stopp nach unten gezogen haben (wofür man ein Kriterium einführen muss), dann stimme ich Ihnen zu, dass es einige quasi-objektive Gründe für einen Schnitt gibt. Aber - um dies festzustellen, ist eine ganze Arbeit, eine große Forschung.
Das tiefere Problem bei der Anwendung der mathematischen Statistik und der Ökonometrie besteht darin, dass sowohl die Ausgangsdaten als auch die Zwischenergebnisse und die Schlussfolgerungen durch außermathematische, intuitive Methoden überprüft werden müssen. Die Wahl des Grenzwertes (2, 3, 4 Sigma oder andere) ist nur nach visueller Betrachtung des Diagramms möglich und bezieht sich auf das Problem der Wahl der Konfidenzintervalle. Das größte Problem bei der Anwendung der Mathematik ist, dass ihre Anwendung ohne die Kunst des Statistikers selbst nicht denkbar ist.
Und selbst danach können sich die Modellreihen im Laufe der Zeit ändern. Schlussfolgerung: Eine nicht-stationäre Datenreihe wurde an ein Modell (eine Methode) angepasst, das für eine stationäre Reihe an einem bestimmten Ort entwickelt wurde.
Standardargumentation in der TA: nicht-stationäre Reihen sind eine Summe von stationären Abschnitten mit unterschiedlichen Merkmalen. Nimmt man die Matlab-Toolbox, wird dieses Problem überhaupt nicht berücksichtigt: Es wird davon ausgegangen, dass der BP mehrere Abweichungen von der Normalverteilung aufweist, und dann kämpft man mit diesen Abweichungen. Es werden nicht alle davon behandelt.
Da dies der Fall ist, muss man irgendwie herausfinden, wie oft man die Verfolgung durchführen muss und wie lange sie dauert. Wie kann man sonst ein ungeeignetes Modell verwenden?
Es gibt kein solches Problem. Es gibt zwei Arten von Prognosen: einen Schritt voraus (für die nächste Kerze) und viele Schritte voraus.
Hier ist die Argumentation meines Erachtens falsch. Eine nicht-stationäre Reihe hat keine Grundgesamtheit, sonst wäre sie bereits eine stationäre Reihe. Und da sie das ist, gibt es keine echte Verteilung.
Ich bin da grundsätzlich anderer Meinung. Stationarität ist eine Eigenschaft der Reihe, nicht die Größe der Grundgesamtheit.
Woher wissen Sie, ob die Haltestelle überfahren wurde oder nicht? Natürlich, wenn man die Daten mehrerer DCs in der Nähe starker Niveaus, sogar runder Niveaus, analysiert und feststellt, dass einige von ihnen den Stopp durchbrochen haben (wofür man ein Kriterium einführen muss), dann stimme ich Ihnen zu, dass es einige quasi-objektive Gründe für einen Schnitt gibt. Aber - um das festzustellen, braucht man eine ganze Menge Arbeit, eine Menge Forschung.
Eine Haltestelle zu streichen ist nur ein Beispiel. Bei der Überprüfung von Angeboten müssen wir entscheiden, was wir als Angebot annehmen und was aus uns unbekannten Gründen wegfällt.
So würde ich es nicht nennen. Die Kunst, oder vielleicht auch nur der Ausbildungsgrad eines Statistikers wird dadurch bestimmt, wie er die Grenzen der Anwendbarkeit von Methoden, die auf die Arbeit mit einer stationären Reihe ausgerichtet sind, im Verhältnis zu einer nicht-stationären Reihe abschätzen kann. Aber nicht intuitiv zu schätzen, sondern immer noch quantitativ (numerisch).
Ich bin anderer Meinung. Es ist unmöglich, eine stationäre Reihe vollständig zu erfassen, daher die Fehler bei der Definition der Hypothesen.
Gibt es eine Grundlage für diese Argumentation? Schließlich kann die durch die erwähnte Summe erhaltene Reihe auch ohne sie erhalten werden - durch Zufall, und sie kann durch eine andere Summe anderer Abschnitte mit anderen Gesetzen erhalten werden. Und da das so ist - wie kann dann das sein, was wahr ist?
Wenn wir die Matlab-Toolbox nehmen, wird diese Frage überhaupt nicht berücksichtigt: Es wird davon ausgegangen, dass der BP einige Abweichungen von der Normalverteilung hat und dass wir mit diesen Abweichungen weiter kämpfen müssen.
Auf welcher Grundlage wird dies berücksichtigt?
Es gibt diese Frage nicht. Es gibt zwei Arten von Prognosen: einen Schritt voraus (für die nächste Kerze) und viele Schritte voraus.
Was hat das mit der Tatsache zu tun, dass ein Modell mit anderen Parametern bei den nächsten Schritten optimaler sein kann?
Im Prinzip bin ich anderer Meinung. Stationarität ist eine Eigenschaft der Reihe, nicht der Größe der Grundgesamtheit.
Dies ist nicht klar - können Sie genauer beschreiben, was Sie meinen? Eine echte Verteilung charakterisiert die Eigenschaften einer Reihe, aber eine nicht-stationäre Verteilung ist per Definition eine, bei der sich diese Eigenschaften ändern. Daher gibt es keine wahre Verteilung, die zur Grundgesamtheit gehört. Bei der N.R. gibt es nur eine wahre Verteilung, und zwar zu einem bestimmten Zeitpunkt und für eine endliche Anzahl von Kerzenständern.
Das Niederreißen eines Stopps ist nur ein Beispiel. Bei der Überprüfung von Kursen müssen wir entscheiden, was wir als Kurs annehmen, und was aus uns unbekannten Gründen herausfällt.
Und auf welcher Grundlage kann man etwas entscheiden, wenn die Gründe unbekannt sind?
Da bin ich anderer Meinung. Es ist völlig unmöglich, auf eine stationäre Reihe zu reduzieren.
Gibt es eine Grundlage für diese Argumentation? Schließlich kann die Reihe, die durch die erwähnte Summe erhalten wird, auch ohne sie erhalten werden - durch Zufall, und sie kann durch eine andere Summe von anderen Plots mit anderen Gesetzen erhalten werden. Und da dies der Fall ist - was ist der Fall (der wahr ist)?
In meinem Beitrag habe ich argumentiert, dass es dafür keine Grundlage gibt. in der TA gibt es einfach keinen anderen Weg.
Auf welcher Grundlage soll das der Fall sein?
Es ist nicht meine Meinung - das ist die Grundlage der gesamten Mathematik.
Was hat das mit der Tatsache zu tun, dass ein Modell mit anderen Parametern in den nächsten Schritten optimaler sein kann?
So etwas wie "optimal" gibt es nicht. Entweder gibt es eine Anpassung mit einem gewissen Vertrauensniveau oder nicht. Es gibt eine Anpassung - es gibt eine Vorhersage
Dies ist nicht ganz klar - können Sie genauer beschreiben, was Sie meinen?
Die Anzahl der SVs im BP ist nicht an der Bestimmung der Stationarität beteiligt.
Und auf welcher Grundlage kann etwas entschieden werden, wenn die Ursachen unbekannt sind?
Das ist der Standard für Zufallsprozesse. Wenn die Ursachen bekannt sind, dann handelt es sich höchstwahrscheinlich um einen deterministischen Prozess.
Nun bin ich prinzipiell anderer Meinung. Schon mit der Formulierung. Wie kann eine Reihe, deren Merkmale sich zufällig ändern, stationär gemacht werden? D.h. dieser Ansatz ist durch nichts begründet, von welchen Hypothesen können wir sprechen?
GARCH ist zum Beispiel ein Modell mit wechselnder Volatilität.
Wir haben eine Diskussion zu zweit, die zu abstrakt geworden ist. Selbst der Topstarter beteiligt sich nicht. Ich würde mir eine gewisse Kohärenz in der Diskussion und in der Entwicklung des zur Diskussion stehenden Artikels wünschen. Zum Beispiel im ersten Schritt, an einem konkreten Beispiel, die Voranalyse der Daten und ihre Aufbereitung für die Modellierung im Detail zu betrachten. Zum Beispiel:
1. die Rechtfertigung des Stichprobenumfangs.
2. die Rechtfertigung der Notwendigkeit einer Datentransformation.
3. Auswahl der Art der Datentransformation:
- Umgang mit Ausreißern und fehlenden Daten.
- Datentransformation - Beseitigung von Trends, Zyklizität
4. die Bestimmung von Trendtypen und deren Verbuchung
5. Anpassen der Verteilung an die transformierten Daten.
6. Analyse auf Stationarität der transformierten Daten.
7. Berücksichtigung von Heteroskedastizität
Das ist genug für jetzt. Ein weiterer Plan ist durchaus zulässig. Ich möchte eine systematische Darstellung des Problems der Erstellung des Quotienten für die in der zur Diskussion stehenden Arbeit beschriebene Modellierung organisieren.Topikstarter[Fischgräten, so wurde es noch nicht genannt] steckt in einer kleinen kreativen Krise :-))))
Aber er verfolgt die Diskussion....
Er bedankt sich bei faa1947 für die konstruktiven Kommentare...
-Alexey-, ich würde dir empfehlen, die Matrix zu studieren ...
Ich werde alle Kommentare berücksichtigen und später meine Gegenargumente und Argumente vorbringen...
-Alexey-, würde ich Ihnen empfehlen, die Matrix zu studieren....
Welche Abschnitte können Sie empfehlen? Zu jeder meiner Aussagen (einschließlich Fragen) kann ich einen Link zur Matrix angeben.
P.S. Und mit welchem Moment ist die kreative Krise verbunden, wenn es kein Geheimnis ist? :)