Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1383

 
elibrarius:

Ich wende nicht die Division (P[i] / P[0]), sondern die Subtraktion (P[i] - P[0]) an, d. h. nicht die relative Preisänderung, sondern die absolute. Ich entferne vorläufig Ausreißer (1 % vom größten und kleinsten Wert).

Bringt das Splitting irgendwelche Vorteile? Ich verwende derzeit einen Wald, der keine Normalisierung und Skalierung erfordert.

Sie übernehmen die Verschiebung, aber nicht die Skalierung
 
Yuriy Asaulenko:
Sie machen eine Verschiebung, aber keine Skalierung.
Ja. Bäume/Wälder müssen auch nicht skaliert werden.


D.h. es gibt keinen großen Vorteil beim Dividieren gegenüber dem Subtrahieren. Außer im Falle des Logarithmus, der die Daten einer Normalverteilung ähnlicher macht, wie Alexey Nikolaev sagte. D.h. die Dichte zwischen den Punkten wird sich ändern, aber nicht die Reihenfolge. Aber in diesem Fall sehe ich auch keine Vorteile - der Baum teilt nicht nach einer Ebene auf, sondern nach einer anderen - d.h. er passt sich jeder Verteilung an. Der Baum ist im Wesentlichen eine einfache Gedächtnisstütze.

 
Nehmen Sie den Preis als Prozentsatz der letzten 100 Preise. falsch?
 
Evgeniy Chumakov:
Nehmen Sie den Preis als Prozentsatz der letzten 100 Preise. falsch?
Dies ist vergleichbar mit der Division
 

Das Diagramm sollte in Ebenen, identische oder nicht identische Stücke vertikal unterteilt werden, und jedes Stück sollte in einem Bereich nomrrmmiert werden.

Das Diagramm sollte vertikal in gleiche oder auch ungleiche Abschnitte unterteilt werden, und jeder Abschnitt sollte auf eine Spanne normalisiert werden, d.h. analog zu normalen Kursniveaus. Wenn wir nicht die gesamte Reihe oder im gleitenden Fenster normalisieren, verlieren wir wieder einige sehr wichtige Informationen.

Bei der Unterteilung in Stufen ergibt sich jedoch ein anderes Problem: Wenn der Preis in den Randbedingungen liegt oder wenn wir viele aktuelle Preise für die Ausbildung nehmen, befinden sich einige von ihnen auf einer "Stufe", die anderen auf einer anderen. Ich habe noch nicht herausgefunden, wie man das macht.

Möglicherweise muss ich die Ebenen im Verhältnis zueinander spiegeln, um die Übergänge zwischen ihnen zu erleichtern.

ist es nur natürlich, dass das nicht umgewandelte Diagramm immer noch am informativsten ist. Daher sollten Sie bei allen Umbauten sehr vorsichtig sein - die Qualität des Modells wird im Verhältnis zu Ihrer Unwissenheit abnehmen. Daher das ganze Gerede, dass 50% Fehler normal sind und anderer Unsinn, das Modell lernt einfach nichts aus solchen "Merkmalen".

 

Es ist etwas Kompliziertes, ich weiß nicht, warum, und ich weiß wirklich nicht, wie man es macht.

Yuri kommt auch mit einfachen Schritten gut zurecht

 

x.append((SD.history[i-j][c.c]/SD.history[i][c.c]-1)*1000)

das macht keinen Sinn - jede nachfolgende Hotchain enthält die Hälfte der nützlichen Informationen der vorherigen, d.h. sie 1: korrelieren stark, 2: die Hotchain mit der größten Verzögerung enthält die gesamte Varianz der vorherigen Hotchain, d.h. sie geben keinen Informationszuwachs

Das Ergebnis ist folgendes: die Bedeutung der Rendite mit der größten Verzögerung ist am größten (mehr Varianz, mehr Informationsgewinn), und diese Rendite enthält die gesamte Varianz der anderen Merkmale

 
elibrarius:

Yuri kommt auch mit einfachen Schritten gut zurecht.

es kann nicht sein, weil es nie sein kann

 
elibrarius:

Etwas, das Sie sich ausgedacht haben, ist kompliziert, es ist nicht klar, warum, und es ist wirklich nicht klar, wie man es macht.

Stellen Sie sich die Situation vor.

Der Marktpreis spiegelt meist das Gleichgewicht von Angebot und Nachfrage zu verschiedenen historischen Zeitpunkten wider

Sie halten an einem begrenzten normalisierten Ausschnitt der Geschichte als Merkmal fest, der nur die aktuelle Situation widerspiegelt

Ihr Modell verschmilzt verschiedene historische Momente zu einem normalisierten unpersönlichen Strom (alle Marktsituationen werden einander gleichgesetzt), der keine historischen Abläufe oder einen fairen Preis mehr enthält.

Man hat einen Haufen identischer, musternormalisierter Muster, die sich bei zunehmender Tiefe der Historie überschneiden, was zu einem 50/50-Fehler führt. Man bringt dem Modell nichts bei und wirft die wichtigsten Informationen bereits bei der Vorverarbeitung weg, weil man alles falsch macht, d.h. Büchern folgt, die für völlig andere Aufgaben konzipiert sind und völlig andere Prozesse beschreiben.

Ein Angebot ist kein Signal, es ist ein völlig anderer Vorgang und sollte nicht auf diese Weise behandelt werden. Juri ist zum Beispiel Radiophysiker und hat daher nichts anderes zu tun.

Bei dieser Art von Ausbildung berücksichtigt man die Zeit, aber nicht den Preis. Das Preisniveau (oben/unten) auf dem Markt ist sogar noch wichtiger als die Zeit, da es das Gleichgewicht zwischen Angebot und Nachfrage widerspiegelt, das alle grundlegenden Marktinformationen wiedergibt.
 
Maxim Dmitrievsky:

Stellen Sie sich die Situation vor.

Der Preis auf dem Markt spiegelt das Gleichgewicht von Angebot und Nachfrage wider, meist zu verschiedenen historischen Zeitpunkten

Sie bleiben bei einem begrenzten normalisierten Ausschnitt der Geschichte als Merkmal, der nur die aktuelle Situation widerspiegelt

Ihr Modell verschmilzt verschiedene historische Momente zu einem normalisierten unpersönlichen Strom (alle Marktsituationen werden einander gleichgesetzt), der keine historischen Abläufe oder einen fairen Preis mehr enthält.

Man hat einen Haufen identischer, musternormalisierter Muster, die sich bei zunehmender Tiefe der Historie überschneiden, was zu einem 50/50-Fehler führt. Man bringt dem Modell nichts bei und wirft die wichtigsten Informationen schon bei der Vorverarbeitung weg, weil man alles falsch macht, d.h. Büchern folgt, die für völlig andere Aufgaben konzipiert sind und völlig andere Prozesse beschreiben.

Ein Angebot ist kein Signal, es ist ein völlig anderer Vorgang und sollte nicht auf diese Weise behandelt werden. Juri ist zum Beispiel Radiophysiker und hat daher nichts anderes zu tun.

Bei dieser Art von Ausbildung berücksichtigt man die Zeit, aber nicht den Preis. Das Preisniveau (oben/unten) auf dem Markt ist sogar noch wichtiger als die Zeit, da es das Gleichgewicht zwischen Angebot und Nachfrage widerspiegelt, das alle grundlegenden Marktinformationen wiedergibt.

Schade, dass Sie kein "Gefällt mir" geben können.