Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2039

 
elibrarius:

Sie können innerhalb des Zuges oder der Prüfung mischen, aber es hat keinen Sinn, und Sie können nicht zwischen Zug und Prüfung mischen. Du hast sie dort nicht zufällig vermischt, was ein sehr gutes Ergebnis für einen Test mit einer Prüfung ist.

Ich habe sie nicht gemischt und das Ergebnis ist einfach nicht sehr gut für die Testprobe - der Rückruf ist gering.

Aber das Mischen ist in Ordnung, wenn wir glauben, dass das Muster stabil ist und gegen Ende der Stichprobe nicht abnimmt. Gerade hier könnte die Datei mit Hilfe einer Schleife geformt worden sein, und einige der Parameter sind einfach nicht in den Untersuchungsbereich gelangt.

 
Aleksey Vyazmikin:

Ich habe nicht gemischt und das Ergebnis ist einfach nicht sehr gut für die Testprobe - der Rückruf ist gering.

Eine Vermischung ist aber durchaus möglich, wenn wir davon ausgehen, dass das Muster stabil ist und am Ende der Stichprobe nicht abnimmt. Die Datei könnte mit einer Schleife geformt worden sein, und einige der Parameter sind einfach nicht in den Testbereich gelangt.

Wenn Sie es verwechseln, wird sich der Test sofort verbessern - Sie erhalten einen Blick auf den benachbarten Balken. D.h. ein Takt (10:00) wird in die Kurve aufgenommen, der daneben liegende (10:01) wird in den Test aufgenommen, während sie sich sowohl für den vorherigen als auch für den Zieltakt sehr ähnlich sind.
 
elibrarius:
Wenn Sie es verwechseln, wird sich der Test sofort verbessern - es wird einen Blick auf den benachbarten Balken geben. D.h. ein Takt (10:00) ist in der Spur, der benachbarte (10:01) ist im Test, und sie sind einander sehr ähnlich, sowohl in der Vergangenheit als auch im Ziel.

Wechseln sich die Stäbe in der Probe ab? Ich trainiere einfach nicht auf jedem Balken, ich nehme nur Signale und in diesem Fall glaube ich, dass es möglich ist, Stichproben zu mischen - es erhöht die Menge der zu trainierenden Informationen, ohne die Stichprobengröße zu erhöhen, was nach meinen Daten die Teststichprobe verbessert.

 
Aleksey Vyazmikin:

Sind die Balken in der Probe einzeln vorhanden?

Ich habe die Datei bereits gelöscht, überprüfen Sie Ihre eigene. Ich denke, dass es am logischsten ist, eine CSV-Datei nach der anderen zu erstellen.

 
elibrarius:

Ich habe die Datei bereits gelöscht, überprüfen Sie Ihre eigene. Ich denke, dass es am logischsten ist, eine CSV-Datei nacheinander zu erstellen.

Da ist etwas - ich weiß nicht, was es ist.

 2 6 0 4 2 6 57 57 100 100 -1
4 2 6 0 4 2 6 57 57 100 200 -1
4 2 6 0 4 2 6 57 57 100 300 -1
4 2 6 0 4 2 6 57 57 100 400 -1
4 2 6 0 4 2 6 57 57 100 500 -1
4 2 6 0 4 2 6 57 57 100 600 -1
4 2 6 0 4 2 6 57 57 100 700 -1
4 2 6 0 4 2 6 57 57 100 800 -1
4 2 6 0 4 2 6 57 57 100 900 -1
4 2 6 0 4 2 6 57 57 100 1000 -1
4 2 6 0 4 2 6 57 57 100 1100 -1
4 2 6 0 4 2 6 57 57 100 1200 -1
4 2 6 0 4 2 6 57 57 100 1300 -1
4 2 6 0 4 2 6 57 57 100 1400 -1
4 2 6 0 4 2 6 57 57 100 1500 -1
4 2 6 0 4 2 6 57 57 100 1600 -1
4 2 6 0 4 2 6 57 57 100 1700 -1
4 2 6 0 4 2 6 57 57 100 1800 -1
4 2 6 0 4 2 6 57 57 100 1900 -1
4 2 6 0 4 2 6 57 57 100 2000 -1
4 2 6 0 4 2 6 57 57 100 2100 -1
4 2 6 0 4 2 6 57 57 100 2200 -1
4 2 6 0 4 2 6 57 57 100 2300 -1
4 2 6 0 4 2 6 57 57 100 2400 -1
4 2 6 0 4 2 6 57 57 100 2500 -1
 
Aleksey Vyazmikin:

Da ist etwas - ich weiß nicht, was es ist.

Ich warte auf die Antwort des Besitzers der Datei.
 
elibrarius:
Ich warte auf eine Rückmeldung des Filehosters.

Übrigens habe ich eine 1%ige Probe genommen und einen C4.5-Baum trainiert - die Erkennungsrate lag bei 100% für die Trainings- und die Testprobe, so dass ich davon ausgehe, dass es sich um geordnete Schleifen handelt, die umgeschichtet werden müssen. Aber ich habe keinen guten Mischalgorithmus in MQL5 - ich kann einfach n Zeilen aus Test- und Kontrollstichproben ziehen und so eine Teststichprobe bilden - und dann habe ich wieder Glück mit dem Klassengleichgewicht, und Schleifen sind hier nicht gut.

 
Aleksey Vyazmikin:

Es ist nur so, dass ich nicht auf jedem Takt trainiere, sondern nur Signale nehme, und in diesem Fall denke ich, dass es möglich ist, Proben zu mischen - es erhöht die Menge an Informationen zum Trainieren, ohne die Stichprobengröße zu erhöhen, was meinen Daten zufolge die Prüfungsprobe verbessert.

Vielleicht kann man das, aber ich glaube nicht, dass man einen Teil der Zukunft in die Bahn werfen sollte, das kann man beim realen Handel nicht tun. Die Zukunft soll sowohl in der Ausbildung als auch in der Realität unbekannt bleiben.
Der Test und die Prüfung müssen immer besser und schlechter werden. Das ist normal. Die Hauptsache ist, dass wir auf der positiven Seite stehen.
Verwenden Sie die Kreuzvalidierung (vielleicht ist sie bereits integriert) oder noch besser: rollen Sie vorwärts.

 
Aleksey Vyazmikin:

Übrigens habe ich eine 1%ige Probe genommen und einen C4.5-Baum trainiert - er gab mir eine 100%ige Erkennung bei der Trainings- und Testprobe, also nehme ich an, dass es sich um geordnete Schleifen handelt, die umgeschichtet werden müssen. Aber ich habe keinen guten Mischalgorithmus in MQL5 - ich kann einfach n Zeilen aus Test- und Kontrollproben ziehen und so eine Testprobe bilden - und ich werde wieder Pech mit Klassengleichgewicht haben, und Schleifen werden hier nicht gut sein.

Diese Art von MNG kann man gut mit https://www.mql5.com/ru/blogs/post/735953 mischen.
Rand 0 ... Max Int с равномерным распределением
Rand 0 ... Max Int с равномерным распределением
  • www.mql5.com
Потребовалась функция ГСЧ с гнерацией числа Int от 0 до любого значения. Получилась такая функция. Думаю распределение получилось равномерным. На форуме посоветовали другую функцию из статьи. Отбросив лишнее, получилось: Сделал сравнение по скорости обоих функций, оригинальной из статьи и просто MathRand(): Оригинальная из статьи Rnd.Rand_01...
 
elibrarius:

Vielleicht können Sie das, aber ich glaube nicht, dass Sie einen Teil der Zukunft in den Auszubildenden stecken sollten, das können Sie im echten Handel nicht. Die Zukunft soll in der Ausbildung genauso unbekannt bleiben wie in der Realität.
Der Test und die Prüfung müssen immer besser und schlechter werden. Das ist normal. Die Hauptsache ist, dass wir auf der positiven Seite stehen.
Verwenden Sie eine Kreuzvalidierung (vielleicht gibt es eine eingebaute) oder noch besser eine Valedictorian Forward.

Wenn man das nicht tut und nicht so vorgeht wie Maxim, indem man vom Ende her lernt, lernen wir am Ende aus sehr veralteten Daten, und das ist nicht gut. Ich schlage nicht vor, die Prüfungsstichprobe anzufassen, aber die Ausbildungs- und Kontrollstichprobe können wir, denke ich, anfassen. Und dann, wenn wir eine stabile Leistung erreicht haben, können wir, wenn wir die Einstellungen des Basismodells kennen, lernen, das Modell in der Praxis anzuwenden.

Ich habe es noch nicht mit der Kreuzvalidierung geschafft - das muss automatisiert werden, aber ich bin noch nicht dazu gekommen.

Aber Nibble-Tests - ja, das ist der richtige Ansatz, aber mir fehlt immer die Geschichte, ich verwende diesen Ansatz bei der Auswahl von Blättern - da hilft er am besten, auch bei einer bereits trainierten Stichprobe, denn normalerweise sind die Reaktionen der Blätter in der Stichprobe ungleichmäßig, und ich brauche nur stabile.

elibrarius:
Das ist ein guter Weg, um es zu mischen https://www.mql5.com/ru/blogs/post/735953

Übrigens, haben Sie einen solchen Generator gesehen, der zufällig eine Zahl aus einer Reihe ohne Wiederholungen generiert - das ist genau das, was ich brauche.

Grund der Beschwerde: