Abhängigkeitsstatistik in Anführungszeichen (Informationstheorie, Korrelation und andere Methoden der Merkmalsauswahl) - Seite 30

 
faa1947:

Analyse der Residuen auf Autokorrelation und Art der Wahrscheinlichkeitsdichtefunktion. Natürlich auch R^2. Dies sind im Prinzip gängige Verfahren zur Vorhersage von Zeitreihen.

Dies ist nur ein Anfang, und im Sinne der allgemeinen Akzeptanz ist er nicht vollständig. Hier wird eine vollständige Abbildung gezeigt, die jedoch nur ein Anwendungsbeispiel darstellt. Drei Gruppen von Analysen: Koeffizienten, Residuen und Stabilität. Wenn man die Widersprüche in Einklang bringen kann, erhält man vielleicht eine Schätzung, die immer ein Vorhersagefehler ist, da das Ziel die Vorhersage und alles andere die Zwischenergebnisse sind.

Ja, ich glaube nicht, dass ich jemals eine VOLLSTÄNDIGE akademische Studie durchgeführt habe. In der Regel fehlt es an Zeit und Aufwand, daher wähle ich den kürzeren Weg: Ich erstelle mehrere (2 oder mehr) Vorhersagemodelle und führe eine Residuenanalyse durch, dann wähle ich ein Modell auf der Grundlage einer ausgewogenen Bewertung der Genauigkeit und Qualität der Residuenreihen. Ich stimme zu, dass man sich mit der Zeit tief in die Schätzung der Zuverlässigkeit der Prädiktoren vertiefen kann.

Ein guter und relativ kostengünstiger Test für die Genauigkeit und Stabilität der Prädiktoren ist übrigens die Kreuzvalidierung, bei der die Trainings- und Validierungszeiträume mehrfach gewählt werden, so dass schließlich die gesamte ursprüngliche Reihe in kleine Segmente unterteilt wird und jedes Segment in die Validierungsstichprobe aufgenommen wird.

 
alexeymosc:

Ja, ich glaube nicht, dass ich jemals eine vollständige akademische Studie durchgeführt habe. In der Regel sind Zeit und Aufwand bei meiner Arbeit knapp bemessen, so dass ich einen kürzeren Weg wähle: Ich erstelle mehrere (2 oder mehr) Vorhersagemodelle und führe eine Residuenanalyse durch und wähle dann ein Modell auf der Grundlage einer ausgewogenen Bewertung der Genauigkeit und Qualität der Residuenreihen aus. Ich stimme zu, dass man sich mit der Zeit eingehend mit der Einschätzung der Zuverlässigkeit der Prädiktoren befassen kann.

Ein guter und relativ kostengünstiger Test für die Genauigkeit und Stabilität der Prädiktoren ist übrigens die Kreuzvalidierung, bei der die Trainings- und Validierungszeiträume mehrfach gewählt werden, so dass schließlich die gesamte ursprüngliche Reihe in kleine Segmente unterteilt wird und jedes Segment in die Validierungsstichprobe aufgenommen wird.

Seit langem gebe ich die folgenden Ratschläge, die ich mir aus eigener Erfahrung hart erarbeitet habe. Seit etwa dreißig Jahren und vor allem heutzutage ist der produktivste Weg, sich ein Fachgebiet anzueignen, die Teilnahme an einem vorgefertigten Paket, das auf dieses Fachgebiet ausgerichtet ist. Ich habe EViews erwähnt, aber das ist nicht das einzige Paket. Es ist nur so, dass dieses Paket in der Lehre an unseren Universitäten verwendet wird. Durch die Nutzung des Pakets werden Sie profitieren:

Eine große Anzahl von spezialisierten Programmen, die von Millionen von Nutzern ausgeführt und überprüft wurden.

Analyseschema

Vollständigkeit der Analyse

Referenzen, aus denen die verwendeten Algorithmen entnommen wurden.

Mit der gewonnenen Erfahrung und dem Ausblick können Sie dann zu einigen Verbesserungen übergehen. Aber diese Verbesserungen werden auf einer systematischen Kenntnis des Fachgebiets beruhen, und es wird Ihnen nicht in den Sinn kommen, Peters oder jemand anderen wie Ptolemäus hinzuzuziehen, wie einige oben.

 
faa1947:

Seit langem gebe ich die folgenden Ratschläge, die ich mir aus eigener Erfahrung hart erarbeitet habe. Seit etwa dreißig Jahren und vor allem heutzutage ist der produktivste Weg, ein Fachgebiet zu erlernen, die Teilnahme an einem vorgefertigten Paket, das auf dieses Fachgebiet ausgerichtet ist. Ich habe EViews erwähnt, aber das ist nicht das einzige Paket. Es ist nur so, dass dieses Paket in der Lehre an unseren Universitäten verwendet wird. Mit dem Paket erhalten Sie:

eine große Anzahl von funktionellen und getesteten Fachprogrammen für Millionen von Nutzern

Ein Analyserahmen

Vollständigkeit der Analyse

Verzeichnisse der Referenzen, aus denen die verwendeten Algorithmen entnommen wurden.

Mit der gewonnenen Erfahrung und den gewonnenen Aussichten können Sie dann zu Verbesserungen übergehen. Aber diese Verbesserungen werden auf einer systematischen Kenntnis des Fachgebiets beruhen, und es wird Ihnen nicht in den Sinn kommen, Peters oder jemand anderen wie Ptolemäus hinzuzuziehen, wie einige Leute oben.


Es tut mir leid, aber das Wichtigste ist die richtige Problemstellung und die richtigen Schlussfolgerungen. Zum Beispiel das, was in dem Artikel über die "Diagnostik von Indikatoren" steht und die Schlussfolgerungen auf der Grundlage von Rückständen, dass der Indikator nützlich ist oder nicht usw. - ist nicht korrekt (imha). Genauso wenig wie es stimmt, dass der Indikator die gesamte Reihe vorhersagen oder überhaupt nützlich sein muss. Sie müssen die Preise nicht ständig vorhersagen, um Gewinne zu erzielen, sondern nur zu relativ seltenen Zeitpunkten. Vorhersage in gewissem Sinne, denn es geht nicht um eine einzelne Preisänderung, sondern um die Robustheit des Systems und die Wiederholung vergangener Statistiken. Und es sind nicht die Indikatoren, die Vorhersagen machen, sondern nur das System als Ganzes.

P.S. Der Artikel ist immer noch nützlich, danke :)

 
Avals:


Zum Beispiel das, was Sie in dem Artikel in Bezug auf die "Indikatordiagnose" und die Schlussfolgerungen auf der Grundlage der Residuen geschrieben haben, dass der Indikator nützlich ist oder nicht, usw. - ist nicht korrekt (imha). Es stimmt auch nicht, dass der Indikator für den gesamten Bereich Vorhersagen treffen oder überhaupt nützlich sein sollte.

Ich stimme zu, der Artikel ist etwas zögerlich geschrieben, denn er sollte den Ansatz im Allgemeinen, die Methodik in ihrer Gesamtheit, sozusagen, demonstrieren.

Sie müssen nicht ständig Preisprognosen machen, um Gewinne zu erzielen, sondern nur in relativ seltenen Momenten

Damit bin ich überhaupt nicht einverstanden. Jeder TS sagt immer etwas voraus, ob er es zugibt oder nicht. In regelmäßigen Abständen wird eine Analyse durchgeführt, um Entscheidungen für die Zukunft zu treffen : eine Position einnehmen, aussteigen, sich vom Markt fernhalten oder im Markt bleiben. Diese Entscheidungen beruhen auf Prognosen über das künftige Marktverhalten.

Es ist nicht eine einzelne Preisänderung, die vorhergesagt wird, sondern die Robustheit des Systems.

Die Robustheit wird nicht vorhergesagt, sie wird konstruiert, und das Ergebnis der Konstruktion wird anhand des Vorhersagefehlers bewertet - wenn die Fehlervarianz nahe einer Konstante liegt, ist das System stabil.

Und es sind nicht die Indikatoren, die Vorhersagen machen, sondern nur das System als Ganzes.

Natürlich. Der Artikel geht davon aus, dass das System aus einem einzigen Indikator besteht. Selbst mit dieser Vereinfachung ist der Artikel zu kompliziert geworden.

Wenn Sie den Artikel im Detail besprechen wollen, schlage ich vor, dass Sie in das entsprechende Thema wechseln, vielleicht schließen sich andere an. Dieser Thread hat ja ein anderes Thema.

 
faa1947:

Es besteht keine Notwendigkeit, ständig Preisprognosen zu erstellen, um Gewinne zu erzielen, sondern nur bei relativ seltenen Gelegenheiten.

Da bin ich völlig anderer Meinung. Jeder TS sagt immer etwas voraus, ob er es zugibt oder nicht. Mit der Periodizität des TS wird eine Analyse durchgeführt, um Entscheidungen für die Zukunft zu treffen : eine Position einnehmen, aussteigen, sich vom Markt fernhalten oder im Markt bleiben. Diese Entscheidungen beruhen auf Vorhersagen über das künftige Marktverhalten.


keine Vorhersage, aber auch keine ständige Vorhersage :) Nur zu diskreten Zeitpunkten, und die Überprüfung der Residuen des Indikators auf die gesamte Reihe testet tatsächlich seine Fähigkeit, die Reihe kontinuierlich vorherzusagen
faa1947:

Es ist nicht eine einzelne Preisänderung, die vorhergesagt wird, sondern die Robustheit des Systems

Die Robustheit wird nicht vorhergesagt, sondern konstruiert, und das Ergebnis der Konstruktion wird anhand des Vorhersagefehlers bewertet - wenn die Fehlervarianz nahe einer Konstante liegt, ist das System stabil.

Die Ergebnisse eines einzelnen Geschäfts sind nicht wichtig, wichtig ist die Statistik über viele Geschäfte. Sie muss zumindest teilweise den günstigen Statistiken der Backtests entsprechen. Wenn Sie also dem Systemmanagement Geld geben, setzen Sie genau darauf - dass unsere günstigen Statistiken erhalten bleiben (mit einem systematischen Ansatz). Und das ist die Robustheit
 
alexeymosc:

Es ist möglich, dass dies der Fall ist. Aber wenn wir eine Rücklaufreihe der Form X[t]-X[t-1] bilden, ist sie fast nicht zu erkennen. Ich verwende die Worte Renditen, Inkremente, Renditen, sie alle sind eine differenzierte Preisreihe.

Das ist leicht nachprüfbar, da braucht man keine philologischen Argumente :). Übrigens, Sie können versuchen, in diesem Forum etwas darüber zu erfahren.

Die Schieflage der Wahrscheinlichkeit in Richtung Vorzeichenwechsel ist minimal und unbedeutend. Berechnet man jedoch die bedingte Entropie zwischen der abhängigen Variable und den Renditen über zwei oder mehr Verzögerungen, dann werden alle Ungleichheiten in der resultierenden Zahl berücksichtigt, so dass die Entropie reduziert wird.

Noch einmal: Die Stärke des Effekts hängt von der TF ab, aber wird H1, das auf zufälligen Ticks erzeugt wird, ähnlich sein wie H1, das auf Ticks mit realer Rendite erzeugt wird?

Ich habe versucht, NS auf stündlichen Daten zu trainieren und habe nur die informativsten Lags genommen (42 Variablen, auf Lags 1, 2, 23, 23, 25,... 479, 480, 481). Leider ist das Ergebnis nicht sehr gut ausgefallen. Genauigkeit der Vorhersage der Quantilzahl - in der Größenordnung von 30-40%. Die Unregelmäßigkeiten konnte das neuronale Netz zwar in die Ausgabe übersetzen, aber die Abhängigkeiten sind für eine Vorhersage nicht ausreichend. Das ganze Problem ist, dass die unabhängigen Variablen bei Lag 1, 2, 24.... gegenseitig informativ sind. und die Gesamtmenge der Informationen über den Null-Balken ist sehr gering. Wir sollten die Möglichkeit in Betracht ziehen, tägliche und ältere Zeitrahmen zu nehmen.


Ich bin von Anfang an davon ausgegangen, dass die Technik alle Abhängigkeiten erfasst, die sowohl nützlich als auch nutzlos für die Vorhersage sind. Was die Volatilität betrifft, so gibt es eindeutige Anhaltspunkte, die eine solche Annahme stützen. Das heißt, Ihre "informativen" Lags können einfach mit dieser Art von nutzlosen Informationen für die Vorhersage verstopft werden.

Ich denke, meine Zeit in diesem Thread ist entweder vorbei oder noch nicht gekommen :). Es ist wohl an der Zeit, dass der Brunnen eine Pause einlegt :).

 
Candid:


Ich bin von Anfang an davon ausgegangen, dass die Methodik alle Abhängigkeiten erkennt, sowohl die für die Vorhersage geeigneten als auch die nutzlosen. Was die Volatilität anbelangt, so gibt es hier einige Anhaltspunkte, die eine solche Annahme stützen. Das heißt, Ihre "informativen" Lags können einfach mit dieser Art von nutzlosen Informationen für die Vorhersage verstopft werden.

Das habe ich auch sehr gut erkannt. Das Problem hat sich dahingehend verkompliziert, dass informative Anzeichen für eine Preisänderung gefunden werden müssen. Und wenn sich herausstellt, dass auf Intraday-Zeitrahmen die erforderlichen informativen Lags zyklisch sind (was ich vermute), dann wird ihre Gesamtinformation über die Richtung der Preisbewegung auf dem Null-Bar sehr gering sein...

Das werde ich überprüfen. Als Nächstes werden wir versuchen, die Tagesbalken zu untersuchen, und wahrscheinlich können Wochen noch statistisch zuverlässig sein. Aber wenn die informativen Verzögerungen auch dort zyklisch sind, denke ich leider, dass die Idee, nur Verzögerungen zu verwenden, nicht funktionieren wird. Dann können Sie Indikatoren ausprobieren.

Das hatte ich übrigens von Anfang an so geplant. Aber bis ich es getestet habe, wird die Fontäne nicht verschwinden.

"Diese "informativen" Verzögerungen könnten also mit dieser Art von nutzlosen Informationen für die Vorhersage verstopft sein."

Und was meinen Sie überhaupt mit "nutzlosen Informationen"? OK, nun, Volatilität ist nicht unser Freund. Es gibt auch Geräuschkomponenten. Ich glaube, Sie haben schon früh beschlossen, die Methode zu verwerfen. Man muss wissen, wie man ein Werkzeug benutzt, ich lerne es immer noch, also gibt es hier mehr Wasser als Kalorien.

Ich habe es bereits vorgeschlagen: Posten Sie jeden Indikator und das Ziel, das er anzeigt. Eine Bedingung ist, dass es sich um Formeln in Echel handelt und dass es die Möglichkeit gibt, mit den Parametern zu spielen. Das Ziel sollte auch spezifisch sein, z. B. der Preis wird in maximal 6 Balken nach unten gehen, oder der Preis wird den aktuellen Preis um 10 Punkte übersteigen. Ich werde die Daten prüfen und Ihnen eine Reihe optimaler Indikatorparameter im Hinblick auf die Informationsentropie nennen.

 
Avals:
In Wirklichkeit sollte sie zumindest teilweise mit den für uns günstigen Backtest-Statistiken übereinstimmen.
Hoffen Sie auf "günstig" oder haben Sie einen numerischen Ausdruck für dieses "günstig". Oben habe ich einen der geschätzten Werte genannt - die Varianzschwankung des Vorhersagefehlers sollte 5 % nicht überschreiten. Dies ist jedoch nicht die einzige Anforderung an ein robustes System. Und der Rückentest lässt nur hoffen, dass es dabei bleibt.
 
faa1947:
Auf "günstig" zu hoffen oder einen numerischen Ausdruck für dieses "günstig" zu haben. Oben habe ich einen der berechneten Werte genannt - die Streuung des Prognosefehlers sollte 5 % nicht überschreiten. Dies ist jedoch nicht die einzige Anforderung an ein robustes System. Und der Rückentest lässt nur hoffen, dass es dabei bleibt.


Ja, es gibt Methoden zur Bewertung der Robustheit.

Übertragen auf das Thema und auf Ihren Artikel: Der Weg, die gesamte Preisreihe in eine stationäre Form mit positivem MO zu bringen, besteht darin, ein profitables und robustes Umkehrsystem zu schaffen, das immer im Markt ist. Dies gilt auch für die Art und Weise, wie man eine echte Reihe von einer zufälligen Wanderung unterscheiden kann. Das ist in der Tat der Indikator, der Ihre Tests bestehen wird, und das Kriterium, das die echten Serien von den SB unterscheiden wird, ist der Algorithmus dieses Systems. Daher ist es naiv zu glauben, dass ein zufällig gewählter Indikator oder die Methode der gegenseitigen Information ein solcher Algorithmus für Marktnotierungen ist. Das kann nur rein zufällig geschehen.

 
faa1947:

Die Theorie des effizienten Marktes wird in der Ökonometrie nicht berücksichtigt. Alle seine Annahmen beruhen auf der Tatsache, dass der Markt nicht effizient ist. Zur Ökonometrie gehören nicht Markowitz und seine Apologeten und ihre effizienten Portfolios. Die Ökonometrie gibt es seit über 100 Jahren und sie wurde von Peters, Mandelbrot und anderen nie widerlegt, da sie ursprünglich auf der Annahme beruht , dass der Markt nicht stationär ist.

Es ist die Ökonometrie, die eine Vorhersage einen Schritt weiter rechtfertigt und die Gründe für eine fatale Verschlechterung der Vorhersage mehrere Schritte weiter aufzeigt.


das Problem besteht darin, dass Makroindikatoren ihre Gewichtung regelmäßig ändern können usw. + die kurze Zeitspanne, die für eine vollständige Analyse zur Verfügung steht...

Ich würde natürlich zustimmen - die Phase muss in der Analyse vorhanden sein...

Grund der Beschwerde: