Diskussion zum Artikel "Datenwissenschaft und ML (Teil 29): Wichtige Tipps für die Auswahl der besten Forex-Daten für AI-Trainingszwecke"
Hier, zum Beispiel, in diesem Artikel https://link.springer.com/article/10.1186/s40854-024-00622-6?utm_source
beweisen sie, dass OHLC nicht nur vier Zahlen, sondern ein einziges topologisches Objekt ist.
Wenn wir nur Close lassen, verlieren wir Informationen über die Volatilität innerhalb des Balkens. Eine hohe Korrelation von 99 % ist "Rauschen" für die lineare Regression, aber dieser 1 %ige Unterschied ist ein "Signal" für den Händler (Schattenlänge, Ausbruchsstärke). Wenn man die "korrelierten" Preise entfernt, wird ein Candlestick-Diagramm zu einem linearen Diagramm und zerstört damit das eigentliche Wesen der Candlestick-Analyse.
Der Autor selbst räumt die Grenzen der Methode ein, empfiehlt aber dennoch, sie für die Auswahl von Merkmalen zu verwenden.
Der Markt ist nicht linear. Im selben Artikel wird das Konzept der strukturellen Beschränkungen eingeführt (High ≥ Close). Die Pearson-Korrelation kennt diese Beschränkungen nicht. Folgt man der Logik des ersten Artikels und entfernt das "überflüssige" High/Low, versteht das Modell die Grenzen der akzeptablen Werte nicht mehr. Als Ergebnis erhalten wir einen Algorithmus, der den Unterschied zwischen einem "ruhigen Markt" und einem "Markt mit riesigen Ausschlägen" nicht versteht, wenn die Eröffnungskurse übereinstimmen.
Das ist "Sparen an Übereinstimmungen".
Sie können die Daten transformieren (Unconstrained Transformation), anstatt die Daten "wegzuwerfen", um sie zu vereinfachen. Anstatt High und Low aufgrund ihrer Korrelation mit Open zu entfernen, sollten Sie sie in relative Werte umwandeln (Candle Spread, enge Position relativ zu den Extremen). Auf diese Weise bleibt die Dimensionalität gleich (oder etwas geringer), aber die Informativität (Geometrie) bleibt bei 100 %, und das Korrelationsproblem verschwindet.
- 2024.03.05
- link.springer.com
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Neuer Artikel Datenwissenschaft und ML (Teil 29): Wichtige Tipps für die Auswahl der besten Forex-Daten für AI-Trainingszwecke :
In diesem Artikel befassen wir uns eingehend mit den entscheidenden Aspekten der Auswahl der relevantesten und hochwertigsten Forex-Daten, um die Leistung von KI-Modellen zu verbessern.
Mit allen Handelsdaten und Informationen wie Indikatoren (es gibt mehr als 36 integrierte Indikatoren in MetaTrader 5), Symbolpaaren (es gibt mehr als 100 Symbole), die auch als Daten für Korrelationsstrategien verwendet werden können, gibt es auch Nachrichten, die wertvolle Daten für Händler sind, usw. Was ich damit sagen will, ist, dass es für Händler eine Fülle von Informationen gibt, die sie beim manuellen Handel oder bei der Entwicklung von Modellen der künstlichen Intelligenz nutzen können, um intelligente Handelsentscheidungen für unsere Handelsroboter zu treffen.
Unter all den Informationen, die uns zur Verfügung stehen, muss es auch einige schlechte Informationen geben (das ist nur der gesunde Menschenverstand). Nicht alle Indikatoren, Daten, Strategien usw. sind für ein bestimmtes Handelssymbol, eine bestimmte Strategie oder eine bestimmte Situation nützlich. Wie ermitteln wir die richtigen Informationen für Handels- und maschinelle Lernmodelle, um maximale Effizienz und Rentabilität zu erzielen? Hier kommt die Merkmalsauswahl ins Spiel.
Autor: Omega J Msigwa