Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 803

 

Wie lassen sich die Klassen am besten ausbalancieren, wer verwendet welche Methoden?

Ich möchte Sie auch fragen, welche Prädiktoren Sie für interessant halten, darf ich das als persönliche Bemerkung auffassen?)

 
forexman77:
Wie lassen sich Klassen am besten ausbalancieren, wer nutzt welche Methoden?

Es gibt Funktionen

 caret:: downSample() - обрезает большой класс до меньшего

downSample nimmt eine Zufallsstichprobe aus einem Datensatz, so dass alle Klassen die gleiche Häufigkeit haben wie die

Minderheitenklasse. upSample Stichproben mit Ersetzung, um die Klassenverteilungen gleich zu machen

 caret:: upSample() - добавляет меньший класс до большего


Generell empfehle ich einen Blick auf caret: Es kann als "Was-wäre-wenn"-Tutorial verwendet werden - es enthält Werkzeuge für den gesamten Zyklus:

  • Aufbereitung der Rohdaten,
  • Auswahl der Prädiktoren (sehr coole Tools),
  • unter 200 Modellen (Regressions- und Klassifikationsmodelle) und
  • Modellbewertung (hat nichts mit einem Prüfer zu tun).

Sie können ziemlich industrielle Designs bekommen.



PS.

Ich glaube nicht, dass irgendjemand die Prädiktoren preisgeben wird - das ist das Wichtigste, und Modelle sind eine Frage der Technik und der Sorgfalt.

 
SanSanych Fomenko:


Ich glaube nicht, dass irgendjemand die Prädiktoren preisgeben wird - das ist das Wichtigste, und die Modelle sind eine Frage der Technik und des Fleißes.

Nun, ich habe nur eine dumme Frage gestellt. Immerhin schaffen sie dumme Zweige, "wie man die Einlage verdreifacht", "sag mir einen Expert Advisor, der Geld verdient", usw.

Aber, ich brauche einen Rat mit Indikatoren, es ist klar, es ist das erste, was in den Sinn kommt. Aber hier ist etwas Ungewöhnliches, wo nur wenige Menschen gegraben haben.

 
forexman77:

Nun, es war nur ein "dummer Versuch". Immerhin schaffen sie dumme Zweige, "wie man die Einlage verdreifacht", "sag mir einen Expert Advisor, der Geld verdient", usw.

Aber, ich brauche einen Rat mit Indikatoren, es ist klar, es ist das erste, was in den Sinn kommt. Aber hier ist etwas Ungewöhnliches, wo nur wenige Menschen gegraben haben.

Nehmen Sie die Digitalfilter aus dem letzten Teil des Artikels. Ich denke, es wird nützlich sein, auch alle vorherigen Teile zu lesen.

Viel Glück!

 
SanSanych Fomenko:

Es gibt Funktionen

downSample nimmt eine Zufallsstichprobe aus einem Datensatz, so dass alle Klassen die gleiche Häufigkeit haben wie die

Minderheitenklasse. upSample Stichproben mit Ersetzung, um die Klassenverteilungen gleich zu machen


Generell empfehle ich einen Blick auf caret: Es kann als "Was-wäre-wenn"-Tutorial verwendet werden - es enthält Werkzeuge für den gesamten Zyklus:

  • Aufbereitung der Rohdaten,
  • Auswahl der Prädiktoren (sehr coole Tools),
  • unter 200 Modellen (Regressions- und Klassifikationsmodelle) und
  • Modellbewertung (hat nichts mit einem Prüfer zu tun).

Sie können ziemlich industrielle Designs bekommen.



PS.

Ich glaube nicht, dass irgendjemand die Prädiktoren preisgeben wird - das ist das Wichtigste, und Modelle sind eine Frage der Technik und der Sorgfalt.

Modelle werden aus vorgefertigten Materialien erstellt, während man sie hier von Grund auf neu erstellen kann.

 
forexman77:

Nun, es war nur ein "dummer Versuch". Immerhin schaffen sie dumme Zweige, "wie man die Einlage verdreifacht", "sag mir einen Expert Advisor, der Geld verdient", usw.

Aber, ich brauche einen Rat mit Indikatoren, es ist klar, es ist das erste, was in den Sinn kommt. Aber hier ist etwas Ungewöhnliches, wo nur wenige gegraben haben.

Im einfachsten Fall verwende ich als Prädiktoren eine Reihe von Balken - Integralwerte, die nach einer bestimmten Formel berechnet werden, die beim Training als Eingabedaten festgelegt wird.


Der Abgleich erfolgt durch Stichproben vom Ende des Trainingsmarkers bis tief in die Historie, in einer Schleife, bis die Anzahl der Stichproben eine bestimmte Anzahl erreicht und verglichen wird.

 
Ivan Negreshniy:
Im einfachsten Fall verwende ich eine Reihe von Balken als Prädiktoren - einen nach einer bestimmten Formel berechneten Integralwert, der beim Training als Eingabedaten verwendet wird.

Der beste Prädiktor ist jedoch die Preisreihe selbst. Jede Verarbeitung bedeutet einen Verlust und eine Verzögerung von Informationen. Und wenn man bedenkt, dass wir nicht wirklich wissen, welche Art von Informationen wir brauchen, dann...

Ich arbeite mit 1m und selbst eine Verzögerung von 30s ist der Tod für das System. Und selbst sehr einfache Indikatoren geben eine Verzögerung von 1-3 m an.

Selbst wenn Sie mit einem stündlichen Zeitrahmen arbeiten, beträgt die Verzögerung bei den Indikatoren 1-3 Stunden). Auf jeden Fall 1-3 Kerzen, egal wie man es dreht und wendet.

ZSY2 Ein weiterer Vorteil von Zeitreihen - wir müssen keine Prädiktoren aufgreifen. Lernen Sie einfach, BP selbst als solches zu verwenden.

 
Yuriy Asaulenko:

Der beste Indikator ist die Preisspanne selbst. Jede Verarbeitung ist ein Verlust und eine Verzögerung von Informationen. Und wenn man bedenkt, dass wir nicht wirklich wissen, welche Art von Informationen wir brauchen, dann...

Ich arbeite mit 1m und eine Verzögerung von nur 30s ist der Tod für das System. Und selbst sehr einfache Indikatoren geben eine Verzögerung von 1-3 m an.

Selbst wenn Sie mit einem stündlichen Zeitrahmen arbeiten, beträgt die Verzögerung bei den Indikatoren 1-3 Stunden). Auf jeden Fall 1-3 Kerzen, egal wie man es dreht und wendet.

ZSY2 Ein weiterer Vorteil von Zeitreihen - wir müssen keine Prädiktoren aufgreifen. Lernen Sie einfach, BP selbst als solches zu verwenden.

Wie kann man nicht mit einem Satz wie diesem antworten? Die Stundentafel kann unter einem Vergrößerungsglas 15m, 5m 1m betrachtet werden. Meine Herren, es ist traurig.

 
Uladzimir Izerski:

Wie kann man nicht mit einem Satz wie diesem antworten? Die Stundentafel kann unter einem Vergrößerungsglas 15m, 5m 1m betrachtet werden. Traurig, meine Herren.

Sei nicht traurig, ich weiß.) Aber wenn Sie sich wohlfühlen, können Sie fortfahren.

 
Bitte sagen Sie mir, ob es ausreicht, in der Anfangsphase nach einer Korrelation mit den Zieldaten zu suchen, um die Daten auszuwählen, und wenn ja, welche Korrelationsschwelle sollte verwendet werden?
Grund der Beschwerde: