Abhängigkeitsstatistik in Anführungszeichen (Informationstheorie, Korrelation und andere Methoden der Merkmalsauswahl) - Seite 31

 
Avals: Es ist nicht nötig, ständig Vorhersagen zu treffen :) Nur in diskreten Momenten.

Und öfter sollte das System sagen: "Lasst uns auf dem Zaun sitzen, ich habe eine Krise des Modells des Universums". Ich nehme an, dass dies eine nützliche Eigenschaft jedes intelligenten Handelssystems ist, die die chaotische Realität des Marktes widerspiegelt: Es erlaubt nur zu bestimmten Zeitpunkten einen kleinen Blick in die Zukunft.

Candid: Nach der Tatsache zu urteilen, dass die Beiträge weiterhin in der Luft hängen, ist meine Zeit in diesem Thread entweder vorbei oder noch nicht gekommen :). Es ist wahrscheinlich an der Zeit, dass sich der Brunnen ausruht :).

Wahrscheinlich noch nicht :).

Und ehrlich gesagt wollte ich das Thema noch nicht aktivieren, aber nachdem es aufkam, ging ich davon aus, dass es um diese Entwicklung gehen würde. Aber ich bereue es nicht, denn die Diskussion hat einige Dinge geklärt.

Candid: Ich bin von Anfang an davon ausgegangen, dass die Methodik jegliche Abhängigkeiten erkennt, die sowohl für Prognosen nützlich als auch nutzlos sind. Was die Volatilität betrifft, so gibt es eindeutige Anhaltspunkte, die eine solche Annahme stützen.

Die Volatilität ist ein ernstzunehmender Akteur in diesem Informationsspiel, aber ich denke, sie ist noch nicht der König und Gott.

 

Ich werde das Thema fortsetzen, eher für Ästheten. Vielleicht ist damit das Thema erledigt. Oder vielleicht wird eine andere eröffnet.

Ich werde die Ergebnisse meiner Experimente veröffentlichen.

 

Ein Diagramm, das die Menge an gegenseitiger Information auf den Lags von 1 bis 250 für den Nullbarren (genauer gesagt, die Preisinkremente p[0] - p[1]) für EURUSD D1 zeigt.




Als Nächstes wollen wir versuchen, die ursprüngliche Volatilität der Reihe beizubehalten (Beibehaltung der Inkrementmodule) und dabei die Vorzeichen der Inkremente zu vertauschen. Wir erhalten.



Ein ähnliches Diagramm und die Summe der wechselseitigen Informationen ist sehr ähnlich. Das bedeutet, dass die Streichung des Vorzeichens des Gradienten keine Auswirkungen auf die gegenseitige Information hatte. Um die Geringfügigkeit des Zeichens zu bestätigen, versuchen wir Folgendes. Wir belassen die Reihenfolge der Vorzeichen der Inkremente wie im ursprünglichen Format, mischen aber die Moduli der Inkremente, nachdem wir die Struktur der Volatilität aufgebrochen haben. Das haben wir jetzt.




Das Diagramm hat ein anderes Aussehen. Die Summe ist deutlich gesunken. Nachdem wir also die Volatilität entfernt haben, haben wir durch das Vorhandensein der ursprünglichen Folge von Inkrementzeichen viel weniger Informationen über den Null-Balken.


Jetzt mischen wir sowohl die Vorzeichen der Inkremente als auch die Modulusfolge der Inkremente, d. h. wir beseitigen die Volatilität und die Vorzeichenfolge, die in der ursprünglichen Reihe vorkommen.




Wir erhalten ungefähr dasselbe, auch wenn die Summe höher ist. Wir gehen davon aus, dass die volatilitätsfreie Reihe fast dasselbe ist wie eine völlig zufällige Reihe (bei der jedoch das Verteilungsgesetz erhalten bleibt).


Um zu vermeiden, dass jedes Experiment mehrfach durchgeführt wird, führen wir einen statistischen Test der Hypothese über den Unterschied zwischen den erhaltenen Werten der gegenseitigen Information für verschiedene Serien durch.

Kolmogorov-Smirnov-Test für die gegenseitige Information der ursprünglichen Reihen und der Reihen mit erhaltener Volatilität. p > 0,1. Die Hypothese des Unterschieds wird abgelehnt.

Für ursprüngliche Reihen und Reihen mit beibehaltenem Vorzeichen der Inkremente: p < 0,01. Die Hypothese eines Unterschieds wird bestätigt.

Test für die Reihe mit dem beibehaltenen Vorzeichen und die Zufallsreihe. p < 0,1. Ein zweideutiges Ergebnis, aber die Summe der gegenseitigen Informationen für die Zufallsreihen ist noch größer, so dass ich geneigt bin, die Hypothese eines Unterschieds oder zumindest keiner Überlegenheit gegenüber den Zufallsreihen zu akzeptieren.

Schlussfolgerung: Diese Methode, die mit Schlusskursinkrementen arbeitet, ermöglicht es, Abhängigkeiten von der Preisvolatilität zu erkennen, während Abhängigkeiten von Vorzeichen der Inkremente nicht oder nur in geringem Maße erkennbar sind. Es ist unmöglich, mit dieser Methode die Richtung der Preisbewegung vorherzusagen.

 

Im letzten Monat habe ich mich nicht mit dem Thema befasst: Ich war mit anderen Dingen sehr beschäftigt, so dass ich keine Zeit dafür hatte.

Ich stimme dem Urteil im Prinzip zu. Aber nur über die Tage. Ich habe schon früher vermutet und gesagt (und nicht nur ich), dass es an Tagen viel mehr Chaos gibt als in kürzeren Zeiträumen.

Es sollte auch berücksichtigt werden, dass Balken mit übermäßigen Informationen nicht ausgesondert worden sind. Ich vermute, dass dies einen großen Einfluss auf das Ergebnis hat.

Kurzum, die Auswahl der Daten, die dem neuronalen Netz möglicherweise als Input zur Verfügung gestellt werden, sollte viel ernster genommen werden. Es stellt sich also heraus, dass man das neuronale Netz nur dann nutzen kann, wenn man es mit extrem schmutzfreien Top-Leckereien füttert. Und im Moment ist es noch keine Delikatesse, sondern ein nicht gefangener Stör.

 
Mathemat:

Im letzten Monat habe ich mich nicht mit dem Thema befasst: Ich war mit anderen Dingen sehr beschäftigt, so dass ich keine Zeit dafür hatte.

Ich stimme dem Urteil im Prinzip zu. Aber nur über die Tage. Ich habe schon früher vermutet und gesagt (und nicht nur ich), dass es an Tagen viel mehr Chaos gibt als in kürzeren Zeiträumen.

Es sollte auch berücksichtigt werden, dass Balken mit übermäßigen Informationen nicht ausgesondert worden sind. Ich vermute, dass dies einen großen Einfluss auf das Ergebnis hat.

Kurzum, die Auswahl der Daten, die dem neuronalen Netz möglicherweise als Input zur Verfügung gestellt werden, sollte viel ernster genommen werden. Es stellt sich also heraus, dass man das neuronale Netz nur dann nutzen kann, wenn man es mit extrem schmutzfreien Top-Leckereien füttert. Und im Moment ist es noch keine Delikatesse, sondern ein nicht gefangener Stör.

Alexej, zunächst einmal freue ich mich, dich in diesem Thread zu sehen. Ich stimme mit Ihrer Meinung überein. Ich habe auch über das große Chaos in den Tagebüchern gehört und nachgedacht. Meiner Meinung nach ist die Zeitreihenfunktion bei großen TFs nicht so glatt wie bei 1-Minuten- und 5-Minuten-TFs, und noch weniger bei Ticks. Wenn man lernt, auf kleinen TFs mehrere Takte im Voraus zu prognostizieren, wird man stark sein. Natürlich kann ich die gegenseitige Information auch für Minuten berechnen, das wäre noch interessanter. Ich werde es vielleicht auch für Zecken tun, ich werde es von der Website von Gain Capital übernehmen. Aber das Problem der Verwendung von Informationen aus dem Ensemble der Balken ist noch nicht gelöst, da hänge ich noch fest. Entschuldigung.

Ich stimme voll und ganz zu, dass der "Starling" nicht gefangen wurde. In diesem Zusammenhang ist das Problem der redundanten Informationen von Bedeutung. Wenn wir Informationen über bestimmte Balken entnehmen, stellt sich grundsätzlich die Frage nach der Bedeutung der einzelnen Verzögerungen.

Alles in allem, aber wir sehen uns wieder in der Sendung.

 
alexeymosc: Natürlich kann ich auch gegenseitige Informationen für Minuten berechnen, das wäre sogar interessant. Ich kann das auch für Zecken tun, ich werde sie von der Website von Gain Capital übernehmen.

Für Minuten, geschweige denn für Ticks, ist es wahrscheinlich zu verschwenderisch, was Zeit und PC-Ressourcen angeht. Ich verlasse mich darauf, dass ich Uhren mitnehme und sie zähle. Wir werden sehen.

Das größte Problem liegt hier nicht an der Oberfläche, sondern im Inneren: Die Vergangenheit ist keine Konstante für die EZ. Die Balken erscheinen und verschwinden ständig. Und lokale Veränderungen in der Vergangenheit können das Ergebnis (oder vielmehr die Matrix) erheblich beeinflussen. Ich fühle mich dabei äußerst unwohl. Ich suche nach einer Möglichkeit, das Problem der Dauerhaftigkeit der Geschichte zu lösen und gleichzeitig die Anzahl der Berechnungen um eine Größenordnung zu reduzieren.

 
alexeymosc:

Alexej, zunächst einmal freue ich mich, dich in diesem Thread zu sehen. Ich stimme mit Ihrer Meinung überein. Ich habe auch gehört und darüber nachgedacht, wie viel Chaos es in diesen Tagen gibt. Meiner Meinung nach ist die Zeitreihenfunktion bei großen TFs nicht so glatt wie bei Minuten und fünf Minuten, und noch weniger bei Ticks. Wenn man lernt, auf kleinen TFs mehrere Takte im Voraus zu prognostizieren, wird man stark sein. Natürlich kann ich die gegenseitige Information auch für Minuten berechnen, das wäre noch interessanter. Ich werde es vielleicht auch für Zecken tun, ich werde es von der Website von Gain Capital übernehmen. Aber das Problem der Verwendung von Informationen aus dem Ensemble der Balken ist noch nicht gelöst, da hänge ich noch fest. Entschuldigung.

Ich stimme völlig damit überein, dass der "Star" nicht erwischt wurde. In diesem Zusammenhang ist das Problem der redundanten Informationen von Bedeutung. Wenn wir Informationen über bestimmte Balken entnehmen, stellt sich grundsätzlich die Frage nach der Bedeutung der einzelnen Verzögerungen.

Alles in allem, aber wir sehen uns wieder in der Sendung.

Bei großen TFs ist die Zeitreihenfunktion vielleicht nicht so glatt wie bei Minuten und Fünfminuten und erst recht nicht bei Ticks, aber sie ist besser vorhersehbar. Bei kleineren TFs, insbesondere bei Minuten, zeigt die Zeitreihenfunktion meines Erachtens innerhalb einiger Hundert oder sogar Tausend Balken ein Muster, während innerhalb von zehn (-s) Balken der Anteil der Zufallskomponenten eines möglichen allgemeinen Musters sehr hoch ist.
 
yosuf:
Auf großen Zeitskalen ist die Funktion der Zeitreihen vielleicht nicht so glatt wie auf 1-Minuten- und 5-Minuten-Zeitskalen und noch weniger auf Ticks, aber sie ist besser vorhersehbar. Auf kleineren Zeitskalen, insbesondere auf 1-Minuten-Zeitskalen, zeigt die Funktion der Zeitreihen innerhalb von mehreren Hundert oder sogar Tausend Balken Regelmäßigkeit, während innerhalb von zehn (-s) Balken der Anteil zufälliger Komponenten eines möglichen allgemeinen Musters sehr hoch ist.

Ich stimme zu, Yusuf. Auch diese Meinung gibt es. Deshalb habe ich übrigens die täglichen Riegel genommen. Interessanterweise ist die Summe der gegenseitigen Informationen für dieselbe Anzahl von Verzögerungen bei stündlichen Balken größer als bei Tagesbalken. Auch wenn es sich meist um Volatilität handelt, aber eine Tatsache ist eine Tatsache. Vielleicht sind also kleinere Zeiträume für ein bestimmtes Vorhersagemodell besser geeignet.

 
Mathemat:

Für Minuten, geschweige denn für Ticks, ist es wahrscheinlich zu verschwenderisch, was Zeit und PC-Ressourcen angeht. Ich verlasse mich darauf, dass ich Uhren mitnehme und sie zähle. Wir werden sehen.

Das größte Problem liegt hier nicht an der Oberfläche, sondern im Inneren: Die Vergangenheit ist keine Konstante für die EZ. Die Balken erscheinen und verschwinden ständig. Und lokale Veränderungen in der Vergangenheit können das Ergebnis (oder vielmehr die Matrix) erheblich beeinflussen. Ich fühle mich dabei äußerst unwohl. Ich suche nach einer Möglichkeit, das Problem der Geschichtskonstanz zu lösen und gleichzeitig die Anzahl der Berechnungen um eine Größenordnung zu reduzieren.

Das ist ein sehr guter Punkt. Zwar habe ich das Problem der flüchtigen Balken in der Geschichte nicht selbst ausgegraben, aber der Punkt ist mir klar, Alexey. Ich denke, wir sollten eher an einem von der Zeitreihe abgeleiteten Signal als an der Zeitreihe selbst messen. Vielleicht ist es sinnvoll, den gewichteten Durchschnittspreis innerhalb des Zeitrahmens zu nehmen, dann werden die Ausschläge geglättet. Übrigens habe ich das schon einmal gemacht: Ich habe den gewichteten Durchschnitt des Intraday-Kurses genommen, der durch den stündlichen Schlusskurs berechnet wurde (in Wirklichkeit handelt es sich um einen MA mit einer Periode von 24, aber die Werte dieses Wavelets, die 24 Schritte auseinander liegen, werden für die Berechnung verwendet). Und ich habe die gegenseitige Information berechnet. Ich war überrascht. Verzögerung Nr. 1 zeigte ein Maximum an Informationen, die anderen Verzögerungen zeigten 10 Mal oder mehr weniger Informationen. Ein deutlicher Unterschied zu den ursprünglichen täglichen Preisreihen...
 
Sie sind sich der Auswirkungen der Volatilitätshäufung in den unteren Zeitrahmen bewusst und ziehen dennoch die Schlussfolgerung, dass die höheren Zeitrahmen angeblich stärker verrauscht sind. Die einzige Grundlage dafür ist Ihr Glaube. Wenn Sie wirklich verschiedene Zeitskalen vergleichen wollen, dann vergleichen Sie sie nicht direkt, sondern ihre Residuen aus den Effekten der Volatilität, sonst ist das alles nur Ihr eigener Glaube.
Grund der Beschwerde: