Abhängigkeitsstatistik in Anführungszeichen (Informationstheorie, Korrelation und andere Methoden der Merkmalsauswahl) - Seite 25

 
Candid:

Erinnere ich mich richtig, dass es sich bei den Eingabedaten um das inkrementelle Prozentmodul handelt?

Wenn dies jedoch der Fall ist, handelt es sich im Wesentlichen um dieselbe Volatilität (d. h. ihre monotone und eindeutige Funktion), und man würde erwarten, dass alle volatilitätsbedingten Effekte auch hier auftreten, wenn auch in etwas gefilterter Form. Und da die Auswirkungen der Volatilität alle anderen Marktphänomene bei weitem zu überwiegen scheinen, erscheint die Aussicht, "etwas anderes" in ihrem Hintergrund zu sehen, eher problematisch. Ich wiederhole: Ich halte es für vielversprechender, zu versuchen, bekannte, aber "nutzlose" Effekte konsequent aus den Rohdaten auszuschließen.

Übrigens, Alexei(Mathemat), haben Sie auch Quelldaten in Modulen?

Guten Tag!

Für alle Forex-Charts rechne ich in Pips (im Gegensatz zum Aktienmarkt).

Zweitens - ich spare die Vorzeichen, d.h. ich nehme nicht modulo. Alles, was Sie für D1, M5, H1 gesehen haben - wird auf der Grundlage der Renditen in Pips berechnet, diskretisiert auf 5 Symbole des Alphabets, das Vorzeichen der Preisänderung wird beibehalten.

Letztes Diagramm für H1 - ich habe die Renditen quadriert, um das Vorzeichen zu beseitigen.

 
HideYourRichess:

Tatsächlich gingen sowohl der große Bohr als auch der große Shannon bei der Lösung ihrer Probleme von der Essenz, der "Physik", zu den Zahlen über, im Unterschied zu dem, was hier geschieht.

Das zweite Problem ist, dass es nicht möglich ist, den Menschen, die glauben wollen, zu erklären, dass ihr Glaube falsch ist. Wie kann man den Menschen erklären, dass die Methode nicht anwendbar ist, da sie auf Stationarität und Unabhängigkeit ausgelegt ist? Lassen Sie sogar die Unabhängigkeit in Form von Markov-Ketten, in jedem Fall schließt es die Anwendbarkeit der Methode auf Daten mit dem Vorhandensein von "Speicher" länger als die betrachtet. Nicht-Stationarität und Abhängigkeit (ich möchte noch einmal betonen, dass diese Abhängigkeit ebenfalls nicht-stationär ist, weshalb weder CM noch bedingte Entropien funktionieren) ergeben sich direkt aus dem Verständnis der Marktprozesse, die einen Kursfluss erzeugen.

Nein, sie kamen nicht von der Sache, sondern von den Fakten :)) Das ist ein Scherz :).

Verlangen Sie von realen Prozessen strikte Stationarität? Ich hoffe nicht. Weiter geht's. Wir brauchen eine Regelmäßigkeit, d. h. einen Effekt, der lange genug anhält. Das heißt, wir sind an stationären (zumindest näherungsweise und zumindest für die durch unsere Stichprobe begrenzte Zeit) Prozessen auf dem Markt interessiert. Mit anderen Worten, das Gerät ist für den Zweck völlig ausreichend.

 
alexeymosc:

Guten Tag!

Für alle Forex-Charts zähle ich in Pips (im Gegensatz zum Aktienmarkt).

Zweitens - ich speichere die Zeichen, d.h. ich nehme sie nicht modulo. Alles, was Sie für D1, M5, H1 gesehen haben - wird auf der Grundlage der Renditen in Pips berechnet, diskretisiert auf 5 Symbole des Alphabets, das Vorzeichen der Preisänderung wird beibehalten.

Letztes Diagramm für H1 - ich habe die Renditen quadriert, um das Vorzeichen zu beseitigen.

Das Vorhandensein eines Schildes macht natürlich einen großen Unterschied. Es ist nur so, dass in Ihrem Artikel die Wahrscheinlichkeitsdichtefunktionen nur für positive Werte angegeben werden.
 
Candid:
Das Vorhandensein des Zeichens macht natürlich einen großen Unterschied. Es ist nur so, dass in Ihrem Artikel Wahrscheinlichkeitsdichtefunktionen nur für positive Werte angegeben sind.

Diese Funktionen richten sich nicht nach der Rendite, sondern nach dem Wert der berechneten gegenseitigen Information, und dieser Wert kann nicht negativ sein.

Im Habra-Artikel für Rücksendungen wurde das Zeichen ebenfalls beibehalten, aber dort habe ich prozentuale Abstufungen vorgenommen. Aber es macht keinen großen Unterschied.

Vergleichen Sie hier die letzten beiden Charts für EURUSD H1. Im ersten Fall wird das Vorzeichen für die Inkremente beibehalten, im zweiten Fall entfällt es. Die Informativität des zweiten Systems ist natürlich höher. Aber auch beim Vorzeichen der Bewegungsrichtung ist die Informativität nicht gering. Es ist schon interessant.

 
alexeymosc:
Diese Funktionen basieren nicht auf Renditen, sondern auf den Werten der berechneten gegenseitigen Informationen, und dieser Wert kann nicht negativ sein.

Ja, ich habe bereits festgestellt, dass ich mich geirrt habe.

In jedem Fall spricht es für die Methode, wenn sie die Auswirkungen der Volatilität selbst bei signifikanten Daten erkennt.

 
Candid:

Ja, ich habe bereits festgestellt, dass ich mich geirrt habe.

In jedem Fall spricht es für die Methode, wenn sie die Auswirkungen der Volatilität sogar bei den Richtwertdaten erkennt, imho eher für sie.

Ich habe hier die reale Berechnungstabelle unten angegeben - dies ist die reale EURUSD M5 Notierungen: https://www.mql5.com/ru/forum/135430/page22

Zustand 1 ist das untere Quantil (starke Abwärtsbewegung), Zustand 5 ist eine starke Aufwärtsbewegung. Die unabhängige Variable kehrt einen Schritt zurück, d. h. zur nächstgelegenen Verzögerung. Es ist zu erkennen, dass bei einem Quellwert = 1 der Empfänger eher den Wert 1 oder 5 annimmt, allerdings mit einer Tendenz von 5.

Wenn die Quelle einen Wert von 5 angenommen hat, ist der Empfänger entweder 1 oder 5 und damit eher 1. Diese Dinge verringern die Unsicherheit über den Zustand des Empfängers. Dabei spielen sowohl die Volatilität als auch die Schiefe zu bestimmten Werten eine Rolle. Indem die Volatilität separat isoliert wird, bleibt die informative Komponente für spezifische Werte (und nicht für polare Wertepaare von 1-5) erhalten.

Ich habe diesen Screenshot absichtlich veröffentlicht, um das Wesen der Forschung zu verdeutlichen. Alles basiert auf der Wahrscheinlichkeit und der Dichtefunktion.

 
joo:
Wie wird die Suche durchgeführt, nicht mit roher Gewalt?

Overkill ist eine Möglichkeit. Sie könnten einen genetischen Suchalgorithmus mit gegenseitiger Information als Fitnessfunktion verwenden.

Stellen Sie sich vor, Sie haben einen Satz von 100 Variablen, die alle gleichmäßig abgetastet werden. Wenn die Variable 5 den Wert 3 und die Variable 76 den Wert 1 annimmt, dann beträgt die Wahrscheinlichkeit, dass die abhängige Variable den Wert 4 annimmt, 75 %. Um dieses Paar unabhängiger Variablen zu stichprobenartig zu erfassen, müssen wir die gegenseitige Information zwischen den beiden unabhängigen Variablen und der abhängigen Variable 100 * 100 - 100 Mal messen. Und wenn wir uns die Kombinationen der drei unabhängigen Variablen ansehen wollen

 
Avals:
keine SBs auf der Grundlage von GARCH erzeugen. Sie müssen eine reale Reihe nehmen und eine SB auf der Grundlage der realen Volatilität erstellen. Ich habe hier ein Skript gepostet https://forum.mql4.com/ru/41986/page10, das die Offline-Historie eines realen Instruments durch eine SB mit Tick-Volumetrie ersetzt. Eine solche SB wird die reale Vol. zu fast 100 % nachbilden. GARCH usw. berücksichtigen sie viele Nuancen nicht, wie z. B. unterschiedliche Wellenzyklen und viele andere. Wenn es einen Unterschied zwischen dieser Zeile von SB und der Zeile, aus der sie erzeugt wurde, gibt, ist sie interessanter :)

Hier ist eine generierte Grafik von SB mit identischer Volatilität mit EURUSD. Alexey, bitte führen Sie eine Analyse durch. Wir wollen sehen, ob es Unterschiede gibt.
Dateien:
eurusd_r.zip  499 kb
 
Candid:

Nein, sie kamen nicht von der Sache, sondern von den Fakten :)) Das ist ein Scherz :).

Verlangen Sie von realen Prozessen strikte Stationarität? Ich hoffe nicht. Weiter geht's. Wir brauchen eine Regelmäßigkeit, d. h. einen Effekt, der lange genug anhält. Das heißt, wir sind an stationären (zumindest näherungsweise und zumindest für die durch unsere Stichprobe begrenzte Zeit) Prozessen auf dem Markt interessiert. Das heißt, das Gerät ist dem Ziel durchaus angemessen.

Genau, das hoffen Sie. Nach meinen Berechnungen unterscheiden sich die Prozesse, die zu verschiedenen Zeitpunkten auf dem Markt ablaufen, um ein Vielfaches, sagen wir. Nicht die Prozentsätze, die Sie sich erhoffen. Sie versuchen, Prozesse, die zu einem bestimmten Zeitpunkt stattfinden, mit einem Prozess zu einem anderen Zeitpunkt zu vergleichen - daher die Stationarität und Angemessenheit der Methoden. Diese Nicht-Stationarität spiegelt sich in den (sowohl zyklischen als auch sporadischen) Schwankungen der Volatilität wider, aber auch das ist nicht vollständig.

Es scheint, dass viele Menschen Schirjajews Vortrag über Pastuchows Werk gelesen haben, und wenn der Zähler sagt, dass "die Volatilität selbst unbeständig ist", sollte klar sein, dass nicht alles einfach ist und wir sorgfältig prüfen müssen, was wir tun. Aber nein, wir sehen wieder einmal einen Versuch, einige Formeln auf den Markt zu bringen.

Kurz gesagt, machen Sie, was Sie wollen, es ist Ihre Zeit und Ihre Verluste. Natürlich, wenn Sie den Prozess der Untersuchung der Zahlen genießen - das ist eine andere Sache, es ist nur der Spaß an dem Hobby.

 
HideYourRichess:

Genau, das hoffen Sie. Nach meinen Berechnungen unterscheiden sich die Prozesse, die zu verschiedenen Zeitpunkten auf dem Markt ablaufen, um ein Vielfaches, sagen wir. Nicht in den Prozentsätzen, die Sie sich erhoffen.

Zunächst einmal verstehen wir es. Die Nicht-Stationierung ist eine Gegebenheit, mit der Sie sich abfinden müssen, im schlimmsten Fall mit Ihrem Blutgeld.

Zweitens werden die Datenreihen durch die Diskretisierung nach 5 Quantilen vergröbert und das Rauschen wird zumindest teilweise innerhalb der Quantilsbereiche absorbiert. Die Dichtefunktion wird einheitlich.

Grund der Beschwerde: