Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2130

 
Aleksey Vyazmikin:

Ich habe bereits mit dem Training begonnen, ohne Protokoll - wir werden sehen.

Ich verwende auch 1/4 Bar Zeit - Stunden, 4 Stunden, Tage.

Im Allgemeinen stellt sich heraus, dass Holzmodelle viele Eingaben benötigen, die so weit wie möglich vorverteilt sind, d.h. eine minimale Anzahl von möglichen eigenen Unterteilungen haben.

 
elibrarius:

Im Allgemeinen stellt sich heraus, dass Holzmodelle viele Eingaben benötigen, die so weit wie möglich vorsepariert sind, d. h. eine minimale Anzahl möglicher eigener Unterteilungen aufweisen.

Wenn Sie die Quantifizierung selbst vornehmen, dann ja, aber es gibt auch eine eingebaute Automatisierung.

Die obigen Histogramme zeigen nur die unterschiedliche Anzahl von Quanten pro Prädiktor, Sie können sehen, wie sie das Endergebnis beeinflussen.

Wenn man Adern mit wertvollen Informationen als separates Quantum des Prädiktors herausnehmen will, kann man diese Ader als binäres Merkmal kodieren und separat einspeisen.

 
elibrarius:

Im Allgemeinen stellt sich heraus, dass Holzmodelle mit einer Vielzahl von Eingaben gefüttert werden müssen, die so weit wie möglich vorverteilt sind, d. h. eine minimale Anzahl von möglichen eigenen Unterteilungen aufweisen.

Saldo - T1 mit Minuten und T2 ohne Minuten - Durchschnittsergebnis: 3384/3126/3890

Rückruf - durchschnittliches Ergebnis: 0,0459/0,0424/0,0458


Präzision - Durchschnittswert: 0,5216/0,5318/0,5389

Bei den Durchschnittswerten des T2-Aggregats hat sich die schlechteste Option durchgesetzt.

Ich öffnete die Tabelle für die Signifikanz der Prädiktoren und war überrascht



Die letzten Änderungen der Trainingsmethode scheinen mir nicht zu gefallen, vielleicht habe ich etwas falsch gemacht?

//день недели, час = ввести через 2 предиктора sin и cos угла от полного цикла 360/7,  360/24
   double tmp[4];
   int nInd=0;
   MqlDateTime dts;
   double pi=3.1415926535897932384626433832795;
   for(int buf=0; buf<2; buf++)
   {
      TimeToStruct(iTime(Symbol(),PERIOD_CURRENT,0),dts);
      //tmp[buf]=(double)(dts.hour*60+dts.min)*360.0/1440.0;
      tmp[buf]=(double)(dts.hour*60+dts.min)*360.0/24.0;
      tmp[buf]=(buf==0?MathSin(tmp[0]*pi/180.0):MathCos(tmp[0]*pi/180.0));

      TimeToStruct(iTime(Symbol(),PERIOD_CURRENT,0),dts);
      //tmp[buf+2]=(double)(dts.day_of_week*1440+dts.hour*60+dts.min)*360.0/10080.0;
      tmp[buf+2]=(double)dts.day_of_week*360.0/7.0;
      tmp[buf+2]=(buf==0?MathSin(tmp[0]*pi/180.0):MathCos(tmp[0]*pi/180.0));
   }


Ich habe die Probe geöffnet



Und ich habe gesehen, dass die Spalte TimeHG Stunden enthält - mein Fehler - ich muss alle Tests neu machen.


 
Aleksey Vyazmikin:

Gleichgewicht - T1 mit Minuten und T2 ohne Minuten - durchschnittliche Punktzahl: 3384/3126/3890

Erinnerungsvermögen - Durchschnittswert: 0,0459/0,0424/0,0458


Präzision - Durchschnittswert: 0,5216/0,5318/0,5389

Was die Durchschnittswerte des T2-Aggregats anbelangt, so ist das Worst-Case-Szenario eingetreten.

Ich öffnete die Tabelle für die Signifikanz der Prädiktoren und war überrascht



Die letzten Änderungen der Trainingsmethode scheinen mir nicht zu gefallen, vielleicht habe ich etwas falsch gemacht?


Ich habe die Probe geöffnet



Und ich habe gesehen, dass die Spalte TimeHG - Stunden sind - mein Fehler - ich muss alle Tests neu machen.


Und die Stunden blieben bei den Minuten.

 tmp[buf]=(double)(dts.hour*60+dts.min)*360.0/24.0;

Sie sollte folgendermaßen aussehen

 tmp[buf]=(double)(dts.hour)*360.0/24.0;
TimeHG - hat offenbar alles übernommen, weshalb die anderen Uhren nicht verwendet wurden.
 
elibrarius:

Und die Uhr wird mit den Minuten verlassen

Wir müssen dies tun.

GUT.

 

Training für 3 Monate - nur so zum Spaß - Training am Anfang. Der gesamte Zeitplan umfasst den Zeitraum 2014-2020.

Wenn man einen großen Zeitraum nimmt, erhält man ein mittelmäßiges Modell. Gleichzeitig können Sie verschiedene Zeiträume von 3 Monaten im gesamten Zeitraum nehmen.

Hier können Sie zum Beispiel die Ausbildungszeit sehen - vorher und nachher ist die Dynamik positiv.


Aktuelle Futures

Mat expectation zeigt 6,15 auf realen Ticks.

Ich habe ein neueres Modell genommen.


Interessanterweise sind sie unterschiedlich, was die Möglichkeit eröffnet, sie in einem Ausschuss zusammenzufassen. Die mathematische Erwartung ist 12,64.

Unten sehen Sie ein Histogramm mit dem geschätzten Saldo, einschließlich der Ausbildungsstichprobe, abhängig von der Anzahl der Ausbildungsfenster - je höher die Anzahl, desto näher an unserer Zeit, ich erinnere Sie daran, dass die Stichprobe von 2014 bis Oktober 2020 reicht.

Interessanterweise sinken die Gewinne mancherorts auf fast die Hälfte des Höchstwerts. Was könnte das bedeuten - lautere Bereiche beim Training?

 
elibrarius:

Und die Uhr wird mit den Minuten verlassen

Sie sollte folgendermaßen aussehen

TimeHG - hat offenbar alles übernommen, weshalb der Rest der Uhr nicht genutzt wurde.

Saldo - T1 mit Minuten und T2 ohne Minuten - Durchschnittsergebnis: 4209,70/2882,50/3889,90


Rückruf - durchschnittliches Ergebnis: 0,0479/0,0391/0,0458


Präzision - mittlere Punktzahl: 0,5318/0,5168/0,5389

Bedeutung der Prädiktoren



Im Durchschnitt geht die Option ohne Minuten (T2) auf.

 
Aleksey Vyazmikin:

Saldo - T1 mit Minuten und T2 ohne Minuten - Durchschnittswert: 4209,70/2882,50/3889,90


Erinnerungsvermögen - Durchschnittswert: 0,0479/0,0391/0,0458


Präzision - mittlere Punktzahl: 0,5318/0,5168/0,5389

Bedeutung der Prädiktoren



Im Durchschnitt geht die Option ohne Minuten (T2) auf.

Was ist die Schlussfolgerung?
Minuten geben eine Erhöhung.
Ich verstehe nicht, was besser ist: die Zeit als Sinus und Kosinus oder nur als Tages-, Stunden- und Minutenzahl?
 
elibrarius:
Wie lautet die Schlussfolgerung?
Minuten geben eine Erhöhung.
Was ist besser - Zeit als Sinus und Kosinus oder nur als Tages-, Stunden- und Minutenzahl?

Bisher können wir feststellen, dass T2 eindeutig die schlechtere Option ist und dass die Addition von Sinus und Kosinus nicht mit linearer Zeit gleichzusetzen ist. Ich denke, dass die Ergebnisse aufgrund der Darstellung der Zahlen, nämlich des Abstands zwischen ihnen, unterschiedlich sind. Der unterschiedliche Abstand wirkt sich auf die Bildung des Clustergitters aus - daher die Diskrepanz.

 
Aleksey Vyazmikin:

Bisher können wir feststellen, dass T2 eindeutig die schlechtere Option ist und dass die Addition von Sinus und Kosinus nicht mit linearer Zeit gleichzusetzen ist. Ich denke, dass die Ergebnisse aufgrund der Darstellung der Zahlen, nämlich des Abstands zwischen ihnen, unterschiedlich sind. Unterschiedliche Entfernungen wirken sich auf die Bildung des Clustergitters aus - daher die Diskrepanz.

Theoretisch sollte dies auch für den Baum gelten.
Die Anzahl der verschiedenen Wahlmöglichkeiten bei Tagen, Stunden und Minuten entspricht der Anzahl der Wahlmöglichkeiten bei Sinus und Kosinus. Sowohl dort als auch dort gibt es in 7 Tagen 10080 verschiedene Werte, die sich einmal pro Minute ändern.
Wenn es eine Randomisierung in der Ausbildung gibt, kann dies auf diesen Unterschied zurückzuführen sein.

Womit haben Sie trainiert, Catbust?

Für NS sind Sinus und Kosinus natürlich besser, denn 59 und 1 Minute liegen dann nebeneinander, bei der Zahlendarstellung sind sie so weit wie möglich entfernt. Wenn du willst, dass der Baum ihn versteht, musst du ein paar zusätzliche Splits machen, was vielleicht der Grund dafür ist, dass er nicht so tiefgründig ist.