Abhängigkeitsstatistik in Anführungszeichen (Informationstheorie, Korrelation und andere Methoden der Merkmalsauswahl) - Seite 3

 
alexeymosc:

Ich habe versucht, mit statistischen Methoden nach Korrelationen in den Notierungen eines Finanzinstruments zu suchen. Zunächst nahm ich den Dow Jones Industrial Index, tägliche Daten, und wandelte die Reihe in eine Reihe von Prozentschritten um.

Die Inkremente sind heteroskedastisch. Wenn Sie die Richtung der Kursbewegung vorhersagen wollen, müssen Sie dies berücksichtigen.

Zur Vorhersage der Volatilität ist es besser, spezifischere Modelle anstelle von NS zu verwenden.

 

Antwort faa1947:

"Mit "Linearität" und "Nichtlinearität" wäre ich ebenfalls vorsichtig, denn diese Frage kann und sollte im Rahmen des Modells gestellt werden, mit dem Sie die Zeitreihe approximieren. Aus der Analyse der Koeffizienten dieses Modells kann man schließen, dass es sich bei diesen Koeffizienten um Konstanten (oder Fast-Konstanten), deterministische Funktionen oder stochastische Funktionen handelt. Dies ist ein ganz konkreter und konstruktiver Prozess der Analyse der Art der Abhängigkeiten. Und was ist an der Entdeckung dieser Informationsabhängigkeit konstruktiv? Und noch einmal: Wie sehen Sie das in der ursprünglichen Zeitreihe?


Ich könnte auch einen Link zur wirtschaftlichen Komponente einfügen, aber sorry, lesen Sie einfach die Antworten auf meinen ersten Beitrag in diesem Thread, es geht genau darum: Intraday-Volatilität ist zyklisch. Und die gegenseitige Information hat das gezeigt. Bei täglichen und höheren Zeitrahmen ist die Situation ganz anders, hier gibt es keine offensichtlichen Zyklen.

Wie ist sie in der ersten Serie zu sehen? Nichts leichter als das: Schauen Sie sich den Verlauf für mindestens ein halbes Jahr auf den Stundenbalken an und stellen Sie fest, ob es einen Unterschied in der Volatilität (in der Größe der Kerzen) nach Zeit gibt. Und was die Tagesbarren anbelangt, so habe ich persönlich keine natürlichen Zyklen oder eine andere alltägliche oder wirtschaftliche Logik gefunden. Es handelt sich lediglich um eine interne Abhängigkeitsstruktur bei den Preisen.

Und ich approximiere die Zeitreihen noch nicht, ich extrahiere Daten aus den Preisen, die es mir ermöglichen, die bekannten Preise aus einem etwas anderen Blickwinkel zu betrachten. Hier sehen Sie das Fehlen von Abhängigkeiten in den Inkrementen, und ich sehe, dass Sie die Autokorrelation verwenden. Das sagt mir eine Menge. Es gibt keine lineare Abhängigkeit und hat es nie gegeben, und es ist nicht nötig, ständig Autokorrelogramme zu zeigen, ich habe selbst schon lange genug davon, und sie waren genauso wie Ihre. )

 
anonymous:

Die Inkremente sind heteroskedastisch. Wenn Sie die Richtung der Kursbewegung vorhersagen wollen, müssen Sie dies unbedingt berücksichtigen.

Zur Vorhersage der Volatilität ist es besser, spezifischere Modelle anstelle von NS zu verwenden.


Und welche Modelle sind spezifischer für Devisen im Gegensatz zu, sagen wir, NS? Ich bin nur an Ihrer Meinung interessiert. Es gibt eine Menge Modelle auf der Welt.
 
alexeymosc:

Und welche Modelle sind spezifischer für Devisen im Gegensatz zu, sagen wir, NS? Ich bin nur an Ihrer Meinung interessiert. Es gibt eine Menge Modelle auf der Welt.

Ich sprach nicht von spezifischen Modellen für den Devisenhandel (davon gibt es viele, insbesondere für Derivate: https://en.wikipedia.org/wiki/Vanna_Volga), sondern von spezifischen Modellen für die Volatilität (davon gibt es viele, abgesehen von ARCH).

NS ist kein Forex-spezifischer Ansatz, denn er wird überall eingesetzt (oder sogar umgekehrt - wo man zu faul ist, normale Modelle zu erstellen, und wo man über eine Menge Rechenressourcen verfügt, wird er eingesetzt).

Die Ansätze zur Vorhersage der Volatilität und der Preisrichtung sollten unterschiedlich sein. Im ersten Fall ist es nicht notwendig, NS zu verwenden (ungerechtfertigte Komplikation), im zweiten Fall können Sie es versuchen.

 

faa1947, bitte achten Sie mehr auf das Layout Ihrer Beiträge. Manchmal kann man nicht sofort unterscheiden, was man zitiert und was man antwortet.

Nun zur Sache:

faa1947: Как мне кажется, увеличение объема выборки представляет интерес только в рамках предельной теоремы о сходимости по вероятности к нормальному закону. Хочу Вас разочаровать, что если мы не ставим перед собой такой задачи, то простое увеличение выборки ничего не дает. Ниже привожу увеличение выборки в 10 раз.

Finger in den Himmel, sorry. Von welcher Normalität im Grenzbereich sprechen Sie? Normalität von was? Die Verteilung der Erträge? In diesem Stadium ist diese Hypothese für mich weder heiß noch kalt. Ich benötige keine Hypothese über die Verteilung der Renditen und die Gesetzmäßigkeit, zu der sie tendieren.

Ich persönlich habe folgende Vorgabe auf der Uhr: Da ich das Chi-Quadrat-Kriterium der Unabhängigkeit von Zufallsvariablen anwenden wollte (und wollte), musste der Stichprobenumfang so sein, dass jede Häufigkeit eines gemeinsamen Ereignisses garantiert mindestens 5 beträgt. Diese Einschränkung sollte auch Ihnen bekannt sein. Deshalb kam eine so schwache Stichprobe zu den Uhren heraus.

Aber so bin ich eben. Ich weiß nicht, warum alexeymosc seine Stichprobe genau so groß gewählt hat, wie sie war. Aber ich kann es mir denken: Wahrscheinlich wollte er ein Muster für die gesamte Serie und nicht nur für einen Teil der Serie festlegen.

faa1947: Ich würde eher auf "Linearität" und "Nichtlinearität" achten, denn diese Frage kann und sollte im Rahmen eines Modells gestellt werden, mit dem man Zeitreihen approximiert. Aus der Analyse der Koeffizienten dieses Modells kann man schließen, dass es sich bei diesen Koeffizienten um Konstanten (oder Fast-Konstanten), deterministische Funktionen oder stochastische Funktionen handelt. Dies ist ein ganz konkreter und konstruktiver Prozess der Analyse der Art der Abhängigkeiten.

Es gibt noch keine Modelle. Nur Data Mining mit nicht-parametrischen statistischen Methoden.

Ich bin zuversichtlich, dass es sich um eine nichtlineare Beziehung handelt: Es gibt keine signifikante lineare Beziehung, die durch die Pearson-Korrelation bei Verzögerungen von mehr als 10 Jahren nachweisbar wäre. Das wissen Sie selbst. Es gibt aber auch Beziehungen mit vielgrößeren Verzögerungen. Sie sind also nicht-linear!

faa1947: Und was ist an der Feststellung dieser Informationsabhängigkeit konstruktiv? Und noch einmal: Wie sehen Sie das in der ursprünglichen Zeitreihe?

Es ist nicht leicht zu erkennen, hier stimme ich Ihnen zu. Wir kennen nur die durchschnittliche Menge an Informationen, die aus einer recht weit zurückliegenden Geschichte auf den Nullstrich übertragen wurde - und der Mechanismus dieses "Informationsangriffs aus der Vergangenheit" ist uns nicht bekannt. Wir müssen es noch schaffen, diese nackten Daten in ein Prognoseinstrument umzuwandeln. Wer hat gesagt, dass es einfach sein würde?

Die Inkremente sind heteroskedastisch. Wenn Sie die Richtung der Kursbewegung vorhersagen wollen, sollten Sie dies unbedingt berücksichtigen.

Ich kenne mich mit modernen ökonometrischen Modellen, einschließlich ARCH und der damit verbundenen Familie, überhaupt nicht aus. Können Sie uns erklären, warum dies in einer Phase berücksichtigt werden muss, in der noch keine Modelle für inkrementelles Verhalten erstellt wurden? Keine Modelle, nur eine stumpfe Anwendung der Informationstheorie. Ich danke Ihnen.

 
anonymous:

Ich sprach nicht von spezifischen Modellen für den Devisenhandel (davon gibt es viele, insbesondere für Derivate: https://en.wikipedia.org/wiki/Vanna_Volga), sondern von spezifischen Modellen für die Volatilität (davon gibt es viele, abgesehen von ARCH).

NS ist kein Forex-spezifischer Ansatz, denn er wird überall eingesetzt (oder sogar umgekehrt - wo man zu faul ist, normale Modelle zu bauen, und wo man über eine Menge Rechenressourcen verfügt, wird er eingesetzt).

Die Ansätze zur Vorhersage der Volatilität und der Preisrichtung sollten unterschiedlich sein. Im ersten Fall ist es nicht notwendig, NS zu verwenden (unangemessene Komplikation), im zweiten Fall können Sie es versuchen.


Ich stimme im Prinzip mit NS überein, obwohl die Methode selbst nicht so einfach ist. Es gibt auch eine Reihe von Konventionen, deren Einhaltung wünschenswert und manchmal sogar obligatorisch ist (von der Datenvorverarbeitung und der Auswahl relevanter Variablen bis hin zum Aufbau von Netzen). Und im Allgemeinen gibt es Menschen, die gerne das ihnen bekannte Wissen auf die untersuchten Phänomene anwenden, und es gibt diejenigen, die von Grund auf neu studieren, und letztere würden wahrscheinlich NS vorziehen. IMHO.

Aber ich werde die Volatilität nicht vorhersagen, ich versuche immer, die Richtung der Preisbewegung vorherzusagen. Bei diesem Problem verwende ich NS.

 
alexeymosc:

Antwort faa1947:


...die Intraday-Volatilität ist zyklisch. Und die gegenseitige Information hat das gezeigt.

Ihre gegenseitigen Informationen haben mir nichts gezeigt. Sie sollten sicherstellen, dass keine deterministischen Bestandteile im GP vorhanden sind, bevor Sie die Statistikverarbeitung durchführen. Wenn sie in BP präsent sind, werden sie die Statistiken "bewerten", und allen Erhebungen ist nicht zu trauen. Ich muss Sie enttäuschen, dass die Definition der Volatilität durch den ursprünglichen BP fehlerhaft ist. Es gelingt mir, Modelle mit den folgenden Parametern zu bauen: 44 Pips Volatilität und ihre Schwankung plus minus zwei Pips, d.h. ich kann sie als konstant betrachten. Die Volatilität, die für die Analyse übrig bleibt, hängt stark vom verwendeten Modell ab.

Und ich nähere mich den Zeitreihen noch nicht an, ich extrahiere Daten aus den Preisen, die es mir erlauben, die üblichen Preise aus einem etwas anderen Blickwinkel zu betrachten. Hier sehen Sie das Fehlen von Abhängigkeiten in den Inkrementen

Rauch vor der Lokomotive. Auf Lehrbuchniveau wird die Reihenfolge der BP-Analyse festgelegt: stationär/nicht-stationär - für nicht-stationär ist die Wahl der Transformationsmethode stationär. Dieser erste Schritt wird sicherlich darin bestehen, den Trend zu beseitigen. Weiter, mal sehen.

 

Ich verstehe nicht, was Sie hier tun. Ich beschloss, mein Wissen über die Informationstheorie (IT) aufzufrischen und schlug sie im Glossar nach:

TI betrachtet den Begriff der "Information" nur von der quantitativen Seite her, ohne Bezug auf ihren Wert oder gar ihre Bedeutung. Bei einem solchen Ansatz enthält eine Seite mit maschinengeschriebenem Text höchstens immer annähernd die gleiche Menge an Informationen, die nur durch die Anzahl der Zeichen und Leerzeichen (d. h. Buchstaben) auf der Seite bestimmt wird und nicht davon abhängt, was darauf gedruckt ist, einschließlich des Falles einer bedeutungslosen, chaotischen Menge von Zeichen. Für die Modellierung von Kommunikationssystemen ist dieser Ansatz gültig, da sie darauf ausgelegt sind, Informationen, die durch einen beliebigen Zeichensatz dargestellt werden, fehlerfrei über den Kommunikationskanal zu übertragen. In den Fällen, in denen es wesentlich ist, den Wert und die Bedeutung der Informationen zu berücksichtigen, ist der quantitative Ansatz nicht anwendbar. Dieser Umstand schränkt die Anwendungsmöglichkeiten der TK wesentlich ein. Die Nichtberücksichtigung dieses Aspekts führte in frühen Entwicklungsstadien zu einer Überschätzung der Bedeutung der Anwendung.

In diesem Zusammenhang habe ich drei mögliche Antworten:

1. Sie sind sicher, dass das Wörterbuch lügt, aber das ist nicht der Fall.

2. Sie befinden sich in einem "frühen Stadium der Entwicklung" und haben noch keine Bewertung der "Anwendungsrelevanz" vorgenommen.

3. Sie sind etwas anderes.

 
Mathemat:

Ich kenne mich mit modernen ökonometrischen Modellen überhaupt nicht aus...

Das macht vieles klar. Die Ökonometrie ist eine Wissenschaft (ich betone Wissenschaft), die sich seit mindestens 100 Jahren mit wirtschaftlichen Zeitreihen beschäftigt. Die Society of Econometricians in den USA wurde in den 30er Jahren gegründet. Nach Ihren Beiträgen zu urteilen, ist das eine Wissenschaft, in der Sie gut sind. Sie sind nicht allein in diesem Forum, und nebenbei bemerkt: Das Wort "Ökonometrie" und seine Ableitungen enthalten einen grammatikalischen Fehler, wie die Entwickler dieser Website festgestellt haben.

 
faa1947: Ihre gegenseitige Information hat mir nichts gezeigt. Sie sollten sich vergewissern, dass es keine deterministischen Komponenten gibt, bevor Sie eine statistische Verarbeitung des GP durchführen.

Wieder 25, ein Finger im Himmel. Die Studie wurde nicht in Bezug auf eine Reihe von Preisen durchgeführt, sondern auf deren Rendite. Das ist erstens.

Zweitens wird die Vorverarbeitung von Daten wie der von Ihnen genannten in erster Linie durch die Ziele der Analyse bestimmt, nicht durch dogmatische Anforderungen, die der Studie ohne Rücksicht auf die Ziele auferlegt werden.

Rauch vor der Lokomotive. In den Lehrbüchern wird die Reihenfolge der BP-Analyse festgelegt: stationär/nichtstationär - für nichtstationär ist die Wahl der Transformationsmethode stationär. Dieser erste Schritt wird sicherlich darin bestehen, den Trend zu beseitigen. Als nächstes werden wir sehen.

Siehe meinen obigen Einwand. Stimmen Sie die Forschungsmethoden auf die Ziele ab! Und hören Sie endlich auf, Ihre Sprüche über Stationarität, Detrendierung und andere Dinge zu murmeln, die für das Thema der Studie irrelevant sind.

2 HideYourRichess: Ich habe heute ein bisschen Urlaub, also kann ich vorübergehend sagen, was ich denke :) Haben wir es hier mit einer religiösen Auseinandersetzung darüber zu tun, was Information ist?

2 faa1947:

Die Ökonometrie ist eine Wissenschaft (ich betone Wissenschaft), die sich seit mindestens 100 Jahren mit wirtschaftlichen Zeitreihen beschäftigt.

OK, lassen Sie es eine Wissenschaft sein. Wenn ich mich recht erinnere, ist die Ökonometrie sehr versessen darauf, ihre Modelle auf Finanzdaten anzuwenden. Ich dränge sie nicht auf. Dann beschäftige ich mich nicht mit Ökonometrie. Haben Sie noch Fragen?

Grund der Beschwerde: