Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2427

 
Aleksey Vyazmikin:

Da ich ein Skript zur Aufbereitung der Daten erstelle, muss ich noch eine Datei erstellen, in der die ausgeschlossenen Spalten aufgelistet sind, darunter:

1. Spalten mit korrelierten Prädiktoren (wie wählt man übrigens aus, welche Spalte wegfallen soll, z. B. 5 korrelierte Prädiktoren?)

2. Spalten, die aus der ersten Dateitabelle verworfen werden, mit Ausnahme der Spalte mit dem Ziel.

Außerdem sollte die Spalte mit der Zielbezeichnung in die Datei geschrieben werden, wobei vorzugsweise nach dem Spaltennamen gesucht werden sollte.

Der Aufbau der Datei ist wie folgt

Lassen Sie dies zu Ihrer Hausaufgabe werden)...
Der Code hat alles, was dazu nötig ist.
Für Fragen gibt es die Stackowerflow-Website und andere ...
Quälen Sie den alten Mann nicht))
 
Aleksey Vyazmikin:

Ich muss die richtigen Prädiktoren in kürzerer Zeit auswählen. Die Prädiktoren noch einmal durchzugehen, würde die Verarbeitungszeit um das Hundertfache erhöhen. Meine Methode basiert auf der Logik, dass ein guter Prädiktor (einschließlich eines für eine bestimmte Lernmethode geeigneten) vom Modell in allen Stichprobenintervallen gefordert wird, wodurch eine Anpassung an den Stichprobenbereich entfällt.

Um sie für alle zu haben, müssen wir sie einer Kreuzvalidierung unterziehen. Und Sie prüfen nur durch einen Test oder eine Prüfung.
Wenn Sie eine Kreuzvalidierung bei 10 % einer Stichprobe durchführen, müssen Sie 10 Mal trainieren, nicht Hunderte. Und wenn man 20 % macht, muss man es 5 Mal unterrichten.

 
elibrarius:

Sie müssen eine Gegenprobe mit der Validierung machen, um alles machen zu können. Und das überprüft man nur mit einem Test oder einer Prüfung.
Wenn Sie eine Kreuzvalidierung bei 10 % der Stichprobe durchführen, müssen Sie 10 Mal trainieren, nicht Hunderte. Und wenn 20 %, dann 5 Mal.

Ich unterteile die Stichprobe in 8 Abschnitte und erstelle für jeden Abschnitt 100 verschiedene Modelle. Anschließend analysiere ich die Modelle und stelle fest, welche Prädiktoren gefragt waren - d. h., dass sie verwendet wurden, um ein Muster zu finden -, ich bilde den Durchschnitt des geschätzten Wertes und verwende dann die verbleibenden Prädiktoren für das Training der gesamten Stichprobe. Die Logik dahinter ist, dass das Modell, sobald Muster dieser Prädiktoren in einem bestimmten Bereich gefunden wurden, in der Lage sein wird, diese Prädiktoren gleichmäßig über die gesamte Stichprobe zu verallgemeinern, anstatt, wie es normalerweise der Fall ist, für bestimmte Bereiche der Stichprobe anzupassen.

Ihre Methode baut das Modell auf einem kleinen Teil der Stichprobe auf, die Modelle werden auf jedem Teil der Stichprobe anders aufgebaut, weil die besten Prädiktoren ausgewählt werden, die zu einem bestimmten Trainingsbereich passen, und in Anbetracht der Tatsache, dass die Stichprobe nicht perfekt (repräsentativ) ist, können wir sagen, dass auf diese Weise nur ein Teil der verfügbaren Informationen untersucht wird, die sich in der Zukunft wiederholen können oder auch nicht, meine Methode wird es erlauben, mehr Informationen über den Markt zu lernen und Übertraining wird weniger sein. Außerdem, wenn in CatBoost die Quantentabelle nicht fixiert wird, dann wird jedes Mal im Allgemeinen auf verschiedenen Prädiktoren trainiert, wegen der verschiedenen Konstruktionen der Quantentabellen für den konkreten Standort der Probe.

 
mytarmailS:

nun die Antwort auf die erste Frage

Ich weiß nicht, was los ist - es flucht.

Error in get.findCorrelation(data = df1, not.used.colums = c("Target_100_Buy",  : 
  could not find function "get.findCorrelation"
 
Aleksey Vyazmikin:

Ich weiß nicht, was los ist - es flucht.

Führen Sie den Code zum Erstellen einer Funktion aus, dann die Funktion selbst
 
mytarmailS:
Führen Sie den Code zur Funktionserstellung und dann die Funktion selbst aus

Es hat funktioniert, danke.

mytarmailS:
Lassen Sie es Ihre Hausaufgaben sein)...
Der Code hat alles, was es braucht...
Es gibt Stackowerflow und andere Seiten für Fragen...
Quälen Sie einen alten Mann nicht))

Ich konnte es nur anhand konkreter Beispiele herausfinden, sonst würde ich das Problem besser in MQL lösen.

 
Das mystischste Forumsthema jetzt mit telepathischer Kommunikation.
Schließlich haben sie die Maschine trainiert - die Maschine hat ihnen Superkräfte verliehen.


 
Account_:
Der mystischste Forenthread jetzt mit telepathischer Kommunikation.
Schließlich haben sie die Maschine trainiert - die Maschine hat ihnen Superkräfte verliehen.


Ja, ich dachte, ich bilde mir das nur ein :-) Nun, das war ein gutes Gespräch, und vor allem informativ :-)
 
Niemand hat zugegeben, welche Art von Maschine hier gelehrt wird oder was
 
Vladimir Baskakov:
Niemand hat zugegeben, welche Art von Maschine hier unterrichtet wird und welche

Ich frage mich auch, warum jede Vogelscheuche, die ihre erbärmliche Mittelwertbildungsmaschine verkauft, es für ihre Pflicht hält, in diesem Thread für sich zu werben, ist das eine Initiation oder was? ))

Grund der Beschwerde: