Diskussion zum Artikel "Regressionsanalyse des Einflusses makroökonomischer Daten auf Fluktuationen des aktuellen Kurses" - Seite 2

 
Salavat:

Bislang wurden keine anderen Ansätze gefunden....

Das ist der Punkt, an dem Sie so falsch liegen.
 
Na gut. Ich werde nicht streiten, ich werde es umformulieren: Unter den vielen Alternativenschlage ich vor, die in dem Artikel beschriebene Methode als vielversprechend zu betrachten
 
Salavat:
Na gut. Ich will nicht streiten, ich formuliere um: Von den vielen Alternativenschlage ich vor, dass die in dem Artikel beschriebene Methode ebenfalls als vielversprechend betrachtet werden sollte

Das von Ihnen skizzierte Instrument kann sich unter folgenden Umständen zweifelsohne als nützlich erweisen

1. In Arbeiten zur Konstruktion einer TK mit einer großen Anzahl von unabhängigen Variablen, mehreren Dutzend oder Hunderten, wird der von Ihnen skizzierte Ansatz nützlich sein, um einige Suchrichtungen zu markieren. Wenn diese formalen Richtungen mit inhaltlichen Überlegungen über den Einfluss der unabhängigen Variablen auf die abhängige Variable und über die gegenseitige Beeinflussung der unabhängigen Variablen gepaart werden, ist das gut.

2. Das von Ihnen vorgeschlagene Instrument als Übergangsschritt zu einer größeren Reihe von Instrumenten. Soweit ich mich erinnere, ist STATISTIK ein sehr begrenztes Instrumentarium und nicht auf dem neuesten Stand. Wenn man diesen ersten Schritt zur Analyse der Signifikanz von Variablen für die Zielvariable gemacht hat, ist es nur natürlich, zu einem größeren Satz von Werkzeugen überzugehen, wie z. B. denjenigen, die die Caret-Shell in R bietet.

 
Viel fragwürdiger ist die Quelle der Daten. Welche Veröffentlichung von makroökonomischen Indikatoren wurde verwendet? Häufig sind solche Daten nicht mit dem Datum der Veröffentlichung, sondern mit dem Datum des Endes des Zeitraums, auf den sie sich beziehen, gekennzeichnet. Wenn man also z. B. eine BIP-Reihe verwendet, die nicht aus der ersten Veröffentlichung stammt, kann man leicht sechs Monate in die Zukunft blicken (ganz zu schweigen von der Überarbeitung der Berechnungsmethoden und der Neuberechnung von Jahrzehnten der Vergangenheit, wie es kürzlich beim US-BIP der Fall war).
 

Der Artikel ist interessant. Ich danke Ihnen. Aber er ist eher ein Leitfaden für die Verwendung von Statistiken. Und er enthält eine Reihe von Missverständnissen.

  1. Eine Vorhersage (und dieses Wort erscheint in der Überschrift Regressionsgleichung und endgültige Vorhersage) für 5 Tage anhand von makroökonomischen Indikatoren ist Unsinn. Makroökonomische Indikatoren werden auf monatlicher und vierteljährlicher Basis veröffentlicht und dann über mehrere Monate hinweg angepasst. Hinzu kommt, dass makroökonomische Indikatoren selbst in vierteljährlichen und jährlichen Abständen starkes Rauschen aufweisen, von täglichen Abständen ganz zu schweigen.
  2. In dem Artikel wird kaum erläutert, wie diese makroökonomischen Indikatoren ausgewählt wurden. Es werden einfach die 99 populärsten Indikatoren ausgewählt, die häufig in den Nachrichten erwähnt werden. Fast alle von ihnen sind nicht in der Lage, den Markt vorherzusagen, da sie nachlaufend und nicht vorlaufend sind. Selbst wenn Sie die Fabrikaufträge oder die Baugenehmigungen nehmen, obwohl sie als vorlaufend gelten, sind sie nicht wirklich vorlaufend, weil sie konstituierende Indikatoren enthalten, die bereits vor ein paar Monaten bekannt gegeben wurden und auf die der Markt bereits reagiert hat. Ich verrate Ihnen ein Geheimnis: Suchen Sie nach anderen Verbrauchsindikatoren, die Sie nicht in Ihrer Datenliste haben. Sie sind wirklich führend. Als der Verbrauch zurückging, gingen auch die Fabrikaufträge und die Baugenehmigungen zurück, und mit ihnen das BIP und der Markt. Es beginnt also alles mit dem Konsum. Dies ist sogar in Marx' Kapital gut beschrieben.
  3. Die Regressionsanalyse ist sogar sehr gut auf Wirtschaftsmodelle anwendbar. faa1947 verwendet einige Dogmen, anstatt auf das Wesen der mathematischen Methode einzugehen. Das Problem liegt nicht in der Methode, sondern in den Daten und deren Aufbereitung. Die Daten sollten stationär sein, unabhängig davon, ob es sich um eine Regression oder einen "kontrollierten Prozess" handelt. Wirtschaftsdaten sind in ihrer ursprünglichen Form nicht stationär. Sie können aber leicht in stationäre Daten umgewandelt werden, zum Beispiel durch Differenzierung und Normalisierung.
  4. Das Problem der Regression besteht darin, dass in jede modellierte Reihe jede andere Reihe eingefügt werden kann, auch wenn sie nichts mit der modellierten Reihe zu tun hat, wenn solche Eingangsreihen in ausreichender Zahl gewählt werden. So können zum Beispiel die Schwankungen der Lufttemperatur in Alaska, Daten über die Luftverschmutzung in Los Angeles usw. erfolgreich in die Devisenpreise einbezogen werden. Der Regressionsfehler kann durch die Einbeziehung solcher "Fremddaten" auf Null gebracht werden. Die Genauigkeit der Vorhersage wird ebenfalls gleich Null sein. Daher muss man wissen, wie man die richtigen Daten auswählt, in welchem Umfang und mit welcher Verzögerung.
  5. Es ist auch nützlich, den Mechanismus zu kennen, wie Unternehmen funktionieren. Zum Beispiel zitiert jeder gerne die Arbeitslosenquote. Sie betrachten diese Quote als ein Barometer für die Wirtschaft. Doch wenn die Arbeitslosenquote erst einmal gestiegen ist, ist es zu spät, um zu reagieren, denn die Wirtschaft befindet sich bereits im Abschwung, und das schon seit langem. Das Problem mit der UR ist, dass sie alle Personen über 16 Jahren erfasst. Es gibt Dutzende von unterschiedlichen Arbeitslosenquoten für verschiedene Bevölkerungsgruppen und Berufe. Hier eine Frage zur Aufstockung: Wenn Unternehmen einen Rückgang der Nachfrage nach ihren Produkten feststellen, wen entlassen sie dann zuerst? Und die zweite Frage lautet: Welche Unternehmen bekommen den Nachfragerückgang als erste zu spüren?
 
gpwr:

Der Artikel ist interessant. Ich danke Ihnen. Aber er ist eher ein Leitfaden für die Verwendung von Statistiken. Und er enthält eine Reihe von Missverständnissen.

  1. Eine Vorhersage (und dieses Wort erscheint in der Überschrift Regressionsgleichung und endgültige Vorhersage) für 5 Tage anhand makroökonomischer Indikatoren ist Unsinn. Makroökonomische Indikatoren werden auf monatlicher und vierteljährlicher Basis veröffentlicht und dann über mehrere Monate hinweg angepasst. Hinzu kommt, dass makroökonomische Indikatoren selbst in vierteljährlichen und jährlichen Abständen starkes Rauschen aufweisen, von täglichen Abständen ganz zu schweigen.
  2. In dem Artikel wird kaum erläutert, wie diese makroökonomischen Indikatoren ausgewählt wurden. Es werden einfach die 99 populärsten Indikatoren ausgewählt, die häufig in den Nachrichten erwähnt werden. Fast alle von ihnen sind nicht in der Lage, den Markt vorherzusagen, da sie nachlaufend und nicht vorlaufend sind. Selbst wenn Sie die Fabrikaufträge oder die Baugenehmigungen nehmen, obwohl sie als vorlaufend gelten, sind sie nicht wirklich vorlaufend, weil sie konstituierende Indikatoren enthalten, die bereits vor ein paar Monaten bekannt gegeben wurden und auf die der Markt bereits reagiert hat. Ich verrate Ihnen ein Geheimnis: Suchen Sie nach anderen Verbrauchsindikatoren, die Sie nicht in Ihrer Datenliste haben. Sie sind wirklich führend. Als der Verbrauch zurückging, gingen auch die Fabrikaufträge und die Baugenehmigungen zurück, und mit ihnen das BIP und der Markt. Es beginnt also alles mit dem Konsum. Dies ist sogar in Marx' Kapital gut beschrieben.
  3. Die Regressionsanalyse ist sogar sehr gut auf Wirtschaftsmodelle anwendbar. faa1947 verwendet einige Dogmen, anstatt auf das Wesen der mathematischen Methode einzugehen. Das Problem liegt nicht in der Methode, sondern in den Daten und deren Aufbereitung. Die Daten sollten stationär sein, unabhängig davon, ob es sich um eine Regression oder einen "kontrollierten Prozess" handelt. Wirtschaftsdaten sind in ihrer ursprünglichen Form nicht stationär. Sie können aber leicht in stationäre Daten umgewandelt werden, zum Beispiel durch Differenzierung und Normalisierung.
  4. Das Problem der Regression besteht darin, dass in jede modellierte Reihe jede andere Reihe eingefügt werden kann, auch wenn sie nichts mit der modellierten Reihe zu tun hat, wenn solche Eingangsreihen in ausreichender Zahl gewählt werden. So können zum Beispiel die Schwankungen der Lufttemperatur in Alaska, Daten über die Luftverschmutzung in Los Angeles usw. erfolgreich in die Devisenpreise einbezogen werden. Der Regressionsfehler kann durch die Einbeziehung solcher "Fremddaten" auf Null gebracht werden. Die Genauigkeit der Vorhersage wird ebenfalls gleich Null sein. Daher muss man wissen, wie man die richtigen Daten auswählt, in welchem Umfang und mit welcher Verzögerung.
  5. Es ist auch nützlich, den Mechanismus zu kennen, wie Unternehmen funktionieren. Zum Beispiel zitiert jeder gerne die Arbeitslosenquote. Sie betrachten diese Quote als ein Barometer für die Wirtschaft. Aber wenn die Arbeitslosenquote erst einmal gestiegen ist, ist es zu spät, um zu reagieren, denn die Wirtschaft befindet sich bereits im Abschwung, und das schon seit langem. Das Problem mit der UR ist, dass sie alle Personen über 16 Jahren erfasst. Es gibt Dutzende von unterschiedlichen Arbeitslosenquoten für verschiedene Bevölkerungsgruppen und Berufe. Hier eine Frage zur Aufstockung: Wenn Unternehmen einen Rückgang der Nachfrage nach ihren Produkten feststellen, wen entlassen sie dann zuerst? Und eine zweite Frage: Welche Unternehmen sind die ersten, die einen Nachfragerückgang spüren?

Ich habe meinen Standpunkt nicht vollständig dargelegt und werde versuchen, dies im Folgenden kurz nachzuholen, wobei ich mich vielleicht wiederhole.

1. Das Problem der Auswahl der Ausgangsdaten - der Prädiktoren - ist grundlegend, schlecht formalisiert und tendiert eher zur Kunst als zur Wissenschaft. Vergessen wir nicht eines der Grundpostulate der Statistik: "Garbage in - rubbish out".

2. Wie ich oben schrieb, wird mehr als die Hälfte der Zeit bei der Erstellung eines Modells auf die Auswahl und Begründung der Liste und der Art der Ausgangsdaten verwendet. Darüber hinaus ist die sinnvolle Interpretation der Ausgangsdaten, nicht ihre formalen, statistischen Eigenschaften, von entscheidender Bedeutung. Der Matapparatus ist ein Hilfsmittel für die sinnvolle Auswahl der Ausgangsdaten.

3. In Anlehnung an die Literatur unterscheide ich zwischen zwei Arten von Prognosen: die eine ist die Vorhersage, die andere die Prognose.

4. Vorhersage: Wir nehmen die Vergangenheit und extrapolieren sie ein paar Schritte in die Zukunft. Klassisch: Wir nehmen die Mach und extrapolieren sie in die Zukunft. Das Hauptproblem ist, dass der Fehler mit zunehmender Anzahl von Schritten in die Zukunft zunimmt, da der nächste Wert auf dem vorherigen basiert.

5. Vorhersage: Wir nehmen den aktuellen Satz von Eingabedaten und sagen die Zukunft ohne Vorgeschichte voraus. Der vorherige Wert wird nicht verwendet, d.h. wenn wir +5 vorhersagen, brauchen wir dafür nicht die vorherigen 4 Werte, im Gegensatz zur Vorhersage.

5. Zusätzlich zu den Ausgangsdaten ist es sehr wichtig, WAS wir voraussagen. Beim Handel haben wir zwei Arten von Aufträgen (mit Optionen) zum Kauf und Verkauf. Aus irgendeinem Grund sagen wir den zukünftigen Kurswert durch Regressionen voraus und schließen von diesem Kurswert auf "Kauf und Verkauf". Und wenn wir den Fehler berücksichtigen und die Entscheidung "Kauf-Verkauf" unter Berücksichtigung des Konfidenzintervalls bilden, wird schnell klar, dass es unmöglich ist, eine Entscheidung zu treffen. Daraus folgt: REGRESSIONALE MODELLE PROGNOSIERENDE SIGNIFIKANZ - UNERWARTBAR.

6. Man sollte die Richtung des Trends vorhersagen, die mit den Aufträgen der Handelssysteme übereinstimmt. Dies geschieht durch Klassifizierungsmodelle, die in der Lage sind, Werte vorherzusagen: "long-short" oder "long-side-short", oder etwas anderes Qualitatives, aber nicht Quantitatives, wie z.B.: der zukünftige Wert des Paares = 1,3500.

7. Für die Erstellung von Klassifikationsmodellen kann dieser Artikel sehr nützlich sein.

 
gpwr:

Der Artikel ist interessant. Ich danke Ihnen. Aber er ist eher ein Leitfaden für die Verwendung von Statistiken. Und er enthält eine Reihe von Missverständnissen.

Willkommen zurück auf der Website. ;-) Hoffentlich für eine lange Zeit. Es wird endlich wieder etwas Nützliches und Informatives zu lesen geben.
 

Hier ist ein Beispiel für mein Regressionsmodell zur Vorhersage des S&P500. Die schwarze Linie ist der historische Index, die durchgezogene horizontale blaue Linie ist der vierteljährliche Durchschnitt, und die gepunktete Linie ist die Vorhersage. Die Vorhersagen sind in Quartalen angegeben. Die Genauigkeit der Vorhersagen ist nicht so groß, aber sie reicht aus, um den Charakter der Bewegungen vorherzusagen: abwärts, aufwärts, flach. Das Modell sagt voraus, dass der Markt in den verbleibenden 3,5 Monaten dieses Jahres nach unten gehen oder im besten Fall stagnieren wird. Ich nutze diese Vorhersagen nur, um rechtzeitig aus dem Markt auszusteigen.

 

Frage oder Anfrage an den Autor - in der erhaltenen Modell, gehen Sie bitte auf die Registerkarte "Advanced" in den Ergebnissen und klicken Sie auf die Schaltfläche "Partial Correlations".

Posten Sie hier, wenn nicht schwierig, den Wert der PC-Koeffizienten für jeden der Modellfaktoren.

 
Demi:

Frage oder Anfrage an den Autor - in der erhaltenen Modell, gehen Sie bitte auf die Registerkarte "Advanced" in den Ergebnissen und klicken Sie auf die Schaltfläche "Partial Correlations".

Posten Sie hier, wenn nicht schwierig, den Wert der PC-Koeffizienten für jeden der Modellfaktoren.

Alle Operationen können Sie selbst durchführen, die Datei mit vorbereiteten Daten ist dem Artikel im Archiv calendar_2010-2011_usd_out. zip beigefügt .


b*in Teilweise Kor. Semipart Cor. Toleranz R-Quadrat t(357) p-Wert
Preisveränderung für 1 Tag 0.3500049 0.3883344 0.3045530 0.7571426 0.2428574 7.9622506 0.0000000
Preisveränderung für 10 Tage 0.3271369 0.3623699 0.2809839 0.7377407 0.2622593 7.3460567 0.0000000
USD Verkäufe bestehender Häuser (MoM) 0.4499016 0.2746573 0.2064353 0.2105391 0.7894609 5.3970552 0.0000001
USD MBA Hypothekenanträge -0.1070692 -0.1315908 -0.0959356 0.8028431 0.1971569 -2.5081463 0.0125795
USD Beschäftigungskostenindex 1.1924082 0.3459071 0.2664363 0.0499272 0.9500728 6.9657258 0.0000000
USD NAPM-Milwaukee 0.4918679 0.3281278 0.2510388 0.2604862 0.7395138 6.5631723 0.0000000
USD Verkäufe bestehender Häuser -0.6131716 -0.3510242 -0.2709271 0.1952275 0.8047725 -7.0831333 0.0000000
USD Arbeitslosigkeitsrate -0.2303595 -0.1174173 -0.0854492 0.1375953 0.8624047 -2.2339883 0.0261025
USD ISM Verarbeitendes Gewerbe 0.4683029 0.2807841 0.2114298 0.2038349 0.7961651 5.5276311 0.0000001
USD Investitionsgüterbestellungen ohne Verteidigung, ohne Luftverkehr -1.0522008 -0.3326872 -0.2549579 0.0587137 0.9412863 -6.6656324 0.0000000
USD Gebrauchsgüter ohne Transport 1.0195595 0.3332286 0.2554246 0.0627625 0.9372375 6.6778344 0.0000000
USD Hauspreis-Kaufindex (QoQ) -0.6493641 -0.3164098 -0.2410558 0.1378030 0.8621970 -6.3021765 0.0000000
USD Chicago-Einkaufsmanager -0.7364752 -0.2854029 -0.2152134 0.0853930 0.9146070 -5.6265502 0.0000000
USD Persönliche Konsumausgaben Kern (YoY) -0.5430761 -0.2067342 -0.1527068 0.0790670 0.9209330 -3.9923747 0.0000794