Ein Artikel über die Messung des Informationsgehalts eines Indikators wurde veröffentlicht:
Autor: Francis Dube
Vielen Dank, dass Sie dieses Thema ansprechen.
Bitte nehmen Sie zu den etwas widersprüchlichen Informationen Stellung, indem Sie zwei Teile des Artikels zitieren:
"
Um die Entropiegleichung auf kontinuierliche Variablen anzuwenden, müssen wir die Indikatorwerte diskretisieren. Dies geschieht, indem man den Wertebereich in gleich große Intervalle unterteilt und dann die Anzahl der Werte zählt, die in jedes Intervall fallen. Mit dieser Methode wird die ursprüngliche Menge, die den maximalen Bereich aller Indikatorwerte umfasst, durch Teilmengen ersetzt, die jeweils ausgewählte Intervalle darstellen.
...
Intervalle - die Anzahl der Intervalle, für die eine Stichprobe gezogen werden soll. Der Autor von TTMTS gibt 20 Intervalle für einen Stichprobenumfang von mehreren tausend an, wobei 2 ein harter Mindestwert ist. Ich habe meine eigene Herangehensweise an einen geeigneten Wert hinzugefügt, indem ich die Möglichkeit implementiert habe, die Anzahl der Intervalle im Verhältnis zum Stichprobenumfang zu variieren, insbesondere 51 für jeweils 1000 Stichproben. Diese Option ist verfügbar, wenn der Benutzer einen beliebigen Wert kleiner als 2 eingibt. Wenn Sie also Intervall auf eine beliebige Zahl kleiner als 2 einstellen, variiert die Anzahl der verwendeten Intervalle je nach Anzahl der analysierten Balken.
"
Frage: Geht es hier um dieselbe Sache? Wenn ja, warum ist die Anzahl der Trennzeichen des Indikatorwertbereichs von der Anzahl der Balken abhängig? Was ist hier die Logik? Bisher kann ich davon ausgehen, dass es nur für Indikatoren sinnvoll ist, die eine kumulative Komponente haben.
Wenn nicht, wie hoch ist dann die Anzahl der Bereichstrenner?
In dem Artikel fehlt eine Tabelle, die den Nutzen der Umwandlung von Indikatorwerten deutlich machen würde.
Ein neuer Artikel zur Messung von Indikatorinformationen wurde veröffentlicht:
Autor: Francis Dube
Hallo Francis
Kannst du bitte erklären, wie man einen benutzerdefinierten Indikator für EntrophyAnalysis testet.
Ich versuche, wie unten zu verwenden:
input ENUM_TIMEFRAMES Timeframe=PERIOD_H1;
input ENUM_INDICATOR IndicatorType=IND_CUSTOM;
input string CustomIndicatorName="Indicators\\NKGold\\Regression\\iNonLinRegress.ex5";
input bool UseDefaults=true;
input string IndicatorParameterTypes="int,CENUM_APPLIED_PRICE";
input string IndicatorParameterValues="34,priceHA_WEIGHTED";
und erhalte die folgende Fehlermeldung
2025.03.26 19:53:11.282 EntropyIndicatorAnalysis (XAUUSD,H1) Benutzerdefinierter Indikator 'Indicators\NKGold\Regression\iNonLinRegress.ex5' kann nicht geladen werden [4802]
2025.03.26 19:53:11.282 EntropyIndicatorAnalysis (XAUUSD,H1) Ungültiges Indikator-Handle, Fehlercode: 4802
Warum gibt es so viele Briefe? Hat der Autor einen brauchbaren Indikator identifiziert? Mit anderen Worten: Hat er etwas zum Thema Geld gefunden? Die Frage ist einfach: Gibt es ein Instrument, mit dem man mit hoher Wahrscheinlichkeit Geld verdienen kann? Oder ist es wie beim Roulette: Entweder es funktioniert, oder es funktioniert nicht.
Der Artikel behauptet nicht, einen Gral entdeckt zu haben, der mit Sicherheit Geldscheine drucken würde. Sein Anliegen ist bescheidener: Er will zeigen, wie man die Informationsfülle messen kann, die ein Indikator in ein Lernmodell einbringt.
-
Ein hoher Entropiewert bedeutet lediglich, dass die Variable nicht trivial ist (sie variiert so stark, dass der Algorithmus lernen kann). Dies garantiert weder eine Richtung, noch ein Timing, noch ein erfolgreiches Money-Management.
-
Selbst ein sehr informativer Indikator kann sich als nicht vorhersagbar erweisen, wenn der Markt über den gewählten Zeithorizont bereits effizient ist, die Transaktionskosten das Signal absorbieren oder das Modell schlecht konzipiert ist.
-
In der Praxis werden mehrere Bausteine aufeinander gestapelt: Auswahl von Indikatoren mit guter Entropie, strenge Off-Sample-Tests, Risikomanagement, robuste Ausführung, Echtzeitüberwachung. Nur durch die Kombination all dieser Schritte hofft man, eine kleine Kante zu erzielen, und diese muss ständig überprüft werden, da sich der Markt anpasst.
-
Der Autor stellt ein akademisches Diagnoseinstrument zur Verfügung. Er übernimmt keine Erfolgsgarantie. Es steht jedem frei, es zu nutzen, um seine Features zu verfeinern oder im Gegenteil festzustellen, dass ein Fetischindikator nichts Neues bringt.
Zusammenfassend lässt sich sagen, dass die Entropie ein Thermometer ist, kein Elixier. Sie hilft, tote oder zu wenig genutzte Variablen schnell zu erkennen. Sie ist kein Ersatz für Strategie oder Risikokontrolle.
...
Intervalle - die Anzahl der zu beprobenden Intervalle. Der Autor von TTMTS gibt 20 Intervalle für eine Stichprobe von mehreren tausend Personen an, wobei 2 ein absoluter Minimalwert ist. Ich habe meinen eigenen Ansatz für einen angemessenen Wert hinzugefügt, indem ich die Möglichkeit implementiert habe, die Anzahl der Intervalle in Bezug auf die Stichprobengröße zu variieren, insbesondere 51 für 1000 Stichproben. Diese Option ist verfügbar, wenn der Benutzer einen Wert kleiner als 2 eingibt. Wenn Sie also Intervall auf eine Zahl kleiner als 2 setzen, wird die Anzahl der verwendeten Intervalle in Abhängigkeit von der Anzahl der analysierten Balken variieren.
"
Frage: Handelt es sich um das Gleiche? Wenn ja, warum hängt die Anzahl der Separatoren im Wertebereich des Indikators von der Anzahl der Balken ab? Welche Logik steckt dahinter? Bisher kann ich davon ausgehen, dass dies nur bei Indikatoren sinnvoll ist, die eine akkumulierende Komponente haben.
Wenn nicht, worauf bezieht sich dann die Anzahl der Teiler des Bereichs?
Dem Artikel fehlt eine Tabelle, die den Vorteil der Transformation der Indikatorwerte klar aufzeigt.
Um die Entropie einer kontinuierlichen Variable zu schätzen, schneidet man ihren Wertebereich in gleiche Intervalle und zählt die Beobachtungen in jedem Intervall. Das Skript lässt Sie diese Anzahl von Intervallen(Intervals) wählen. Wenn Sie < 2 eingeben (oder den Standardwert belassen), löst das Skript seine eigene Heuristik aus: 51 Intervalle pro 1000 Beobachtungen, d. h. eine Anzahl, die proportional zur Stichprobengröße ist. Wenn Sie einen Wert > 2 eingeben, verwendet es ihn so, wie er ist. Es handelt sich also nicht um zwei konkurrierende Methoden. Die eine beschreibt das Konzept, die andere erklärt, wie der Code den Parameter auswählt, wenn man ihn nicht selbst festlegt.
Wenn man zu wenige Intervalle hat, werden die Werte künstlich aneinandergeklebt. Die Entropie wird unterschätzt (Bias). Wenn man zu viele Intervalle für eine kleine Stichprobe hat, gibt es viele leere Behälter oder nur eine Beobachtung. Die Entropie ist stark verrauscht (Varianz). Es gibt mehrere automatische Regeln für Histogramme: Sturges, Quadratwurzel, Freedman-Diaconis, Scott, usw.). Sie haben alle die gleiche Idee: die Auflösung zu erhöhen, wenn man mehr Daten hat, weil man dann feinere Wahrscheinlichkeiten schätzen kann, ohne die Varianz zu sprengen.
Auf 1 000 Balken kommen 51 Intervalle => 20 Punkte pro Wanne, wenn die Verteilung gleichmäßig wäre. Dieses Verhältnis (zwischen 15 und 30 Obs / Klasse) ist ein klassischer Kompromiss, den der Autor aus der Literatur übernommen hat. Er hält also die durchschnittliche Anzahl der Beobachtungen pro Klasse in etwa konstant. Dies hat nichts damit zu tun, ob ein Indikator akkumulierend ist oder nicht. Die Logik ist rein statistisch. Man passt die Feinheit des Rasters an die Menge der verfügbaren Informationen an.
-
desto deutlicher wird die Feinverteilung des Indikators sichtbar,
-
desto mehr Details (Spitzen / Täler) kann die Entropieberechnung einfangen,
-
aber desto mehr Daten werden benötigt, um diese Häufigkeiten stabil zu halten.
Es stimmt, dass der Artikel davon profitiert hätte, wenn er beispielsweise die Entropie desselben Indikators vor und nach den Transformationen gezeigt hätte. Aber die Demonstration ist immer noch leicht selbst zu machen. Markieren Sie einfach ApplyTransform=true im Skript und lesen Sie die doppelte Ausgabe: before / after. Der Code hat diesen Teil absichtlich interaktiv gelassen, damit jeder seine eigenen Assets und Horizonte ausprobieren kann.
Je mehr vertikale Balken im Histogramm:
-
Je mehr vertikale Balken das Histogramm enthält, desto deutlicher wird die Feinverteilung des Indexes,
-
desto mehr Details (Spitzen und Täler) kann die Entropieberechnung erfassen,
-
aber desto mehr Daten werden benötigt, um diese Häufigkeiten zu stabilisieren.
So wie ich es verstehe, hat die Visualisierung von Indikatorwerten in einer Stichprobe durch ein Histogramm nichts mit den Datenumwandlungsmethoden des Autors zu tun. Liege ich da richtig?
Mich interessiert eher die Frage nach dem Trainingseffekt dieser Transformationen. Bei neuronalen Netzen kann ich das annehmen, aber nicht bei Baummethoden.
Wenn ich Sie richtig verstehe, hat die Visualisierung der Indikatorwerte in einer Stichprobe mithilfe eines Histogramms nichts mit den Datenumwandlungsmethoden des Autors zu tun. Habe ich Recht?
Mich interessiert vielmehr die Frage nach dem Spillover-Effekt dieser Transformationen. Bei neuronalen Netzen kann ich das vermuten, bei baumartigen Methoden jedoch nicht.
Das Histogramm, das das Skript zeichnet, ist lediglich ein visuelles Diagnoseinstrument. Es zeigt, wie sich die Werte eines Indikators vor oder nach der Transformation über die Stichprobe verteilen. Die Funktionen sqrt, log, tanh usw. wirken auf die Daten ein. Das Histogramm zeigt lediglich das Ergebnis an. Die beiden Schritte sind also unabhängig voneinander. Zuerst wird die Reihe transformiert (oder nicht), dann zeichnet man ihr Histogramm, um zu sehen, ob sich die Entropie verändert hat.
Einen Indikator umzuwandeln, der eher monoton geworden ist (log, sqrt), ändert oft nichts am Ergebnis. Die Reihenfolge bleibt gleich, auch wenn sich nur die Schwellenwerte verschieben. Dagegen ändern nicht-monotone Transformationen (tanh, der sättigt) die Reihenfolge einiger Punkte. Das bedeutet, dass bestimmte Transformationen den Boden für die Schaffung nichtlinearer Wechselwirkungen besser vorbereiten.
Das vom Skript erstellte Histogramm ist lediglich ein visuelles Diagnoseinstrument. Es zeigt, wie die Indikatorwerte in der Stichprobe vor oder nach der Transformation verteilt sind. Die Funktionen sqrt, log, tanh, etc. beeinflussen die Daten. Das Histogramm zeigt lediglich das Ergebnis an. Die beiden Schritte sind also unabhängig voneinander. Zuerst wird die Reihe transformiert (oder nicht), dann wird ihr Histogramm aufgezeichnet, um zu sehen, ob sich die Entropie verändert hat.
Ok, jetzt habe ich den Punkt verstanden. Ich hatte ursprünglich an etwas anderes gedacht.
Die Umwandlung eines Exponenten, der ziemlich monoton geworden ist (log, sqrt), ändert das Ergebnis oft nicht. Andererseits ändern nicht-monotone Transformationen (tanh, saturiert) die Reihenfolge bestimmter Punkte. Das bedeutet, dass bestimmte Transformationen besser geeignet sind, nichtlineare Wechselwirkungen zu erzeugen.
Wie ändert sich dadurch die Reihenfolge der Punkte? Können Sie ein Beispiel für eine solche Transformation nennen? Bisher habe ich die Aussage so verstanden, dass es ABC-Punkte mit Eigenwerten in aufsteigender Reihenfolge gab, und nach der Transformation wurde die Reihenfolge in aufsteigender Reihenfolge alternativ zu BAC.
Okay, ich habe den Gedanken jetzt verstanden. Ursprünglich hatte ich etwas anderes im Sinn.
Wie ändert sich dadurch die Reihenfolge der Punkte? Können Sie ein Beispiel für eine solche Transformation geben? Bisher habe ich verstanden, dass es Punkte ABC mit Eigenwerten in aufsteigender Reihenfolge gibt, und dass nach der Transformation die aufsteigende Reihenfolge alternativ zu BAC wurde.
Die Funktionen des Skripts (Wurzel, log, tanh usw.) sind alle monoton steigend. Sie behalten alle die Reihenfolge der Punkte bei. Mein vorheriger Satz war zweideutig. Die Reihenfolge wechselt nur dann von ABC nach BAC, wenn eine nicht-monotone Transformation verwendet wird. Wenn ich mich nicht irre, ist zum Beispiel die Funktion f(x)=∣x-50∣ nicht monoton, weil sie die Achse um x= 50 faltet. Die Reihenfolge wird also zu BAC. In seiner Einleitung weist der Autor des Artikels auf das Buch"Testing and Tuning Market Trading Systems (TTMTS) von Timothy Masters" hin. Was mich betrifft, so plane ich, mir das Buch zu besorgen, denn wie Sie habe ich noch einige Fragen. Außerdem kenne ich mich weder mit Lernmodellen noch mit neuronalen Netzen gut aus. Anscheinend ist es in Online-Shops recht leicht zu finden. Der Artikel, so interessant er auch sein mag, ist wahrscheinlich unvollständig und/oder in jedem Fall recht synthetisch.
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Neuer Artikel Messen der Information von Indikatoren :
Maschinelles Lernen hat sich zu einer beliebten Methode für die Strategieentwicklung entwickelt. Während die Maximierung der Rentabilität und der Vorhersagegenauigkeit stärker in den Vordergrund gerückt wurde, wurde der Bedeutung der Verarbeitung der Daten, die zur Erstellung von Vorhersagemodellen verwendet werden, nicht viel Aufmerksamkeit geschenkt. In diesem Artikel befassen wir uns mit der Verwendung des Konzepts der Entropie zur Bewertung der Eignung von Indikatoren für die Erstellung von Prognosemodellen, wie sie in dem Buch Testing and Tuning Market Trading Systems von Timothy Masters dokumentiert sind.
Als Beispiel untersuchen wir einige statistische Eigenschaften von zwei oben analysierten Indikatoren.
Die Verteilung der prozentualen Spanne von Williams zeigt, dass fast alle Werte über die gesamte Spanne verteilt sind; abgesehen davon, dass die Verteilung multimodal ist, ist sie ziemlich gleichmäßig. Eine solche Verteilung ist ideal und spiegelt sich im Entropiewert wider.
Dies steht im Gegensatz zur Verteilung des Market Facilitation Index, der einen langen „Rattenschwanz“ von Werten aufweist. Ein solcher Indikator wäre für die meisten Lernalgorithmen problematisch und erfordert eine Transformation der Werte. Die Umwandlung der Werte sollte zu einer Verbesserung der relativen Entropie des Indikators führen.
Autor: Francis Dube