Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 235

 
Eidechse_:
Wie ich sehe, haben sie bereits begonnen, Bücher über r))) zu schreiben.
allitebooks.com/automatisierter-handel-mit-r-2/
Wenn man anfängt, Bücher darüber zu schreiben, "wie man Geld verdient", dann funktioniert diese Methode entweder nicht mehr oder hat noch nie funktioniert. Aber ein Indikator. Das heißt, wenn mit der Beschreibung einer Methode in einem Buch mehr Geld verdient wird als mit der Methode selbst.
 
Eidechse_:
Um des Sports willen überholte ich ein wenig, und darauf werde ich anhalten. Mittel frei ein wenig, aber der Wunsch ist und war überhaupt nicht,

unterstützte lediglich die Idee einer "Eintrittskarte in die Branche". < 0,69, schätzungsweise kein großes Problem, mit dem man davonkommen könnte. < 0,68 weiß nicht, man muss darüber nachdenken)))

https://numer.ai


Bitte sagen Sie mir, welches Modell, wie haben Sie gelernt?
 
lucky_teapot:
Bitte sagen Sie mir, welches Modell, wie wurde es gelehrt?

Der Fehler bei der Klassenvorhersage beträgt weniger als 30 %. Sie kann viel weniger als 30 % betragen, aber weniger als 20 % sind nicht zu erreichen. Aber es gibt gute Gründe zu sagen, dass das Modell NICHT übertrainiert ist. Wichtig ist, dass es nicht übertrainiert ist - ein übertrainiertes Modell wird überhaupt nicht gebraucht, es ist gefährlicher Unsinn.

Modelle: random forest und ada. Im Allgemeinen hat die Wahl des Modells wenig Einfluss auf das Ergebnis, wenn es überhaupt trainiert wird. Für meine Prädiktoren wird nnet überhaupt nicht trainiert.

 
SanSanych Fomenko:

Der Fehler bei der Klassenvorhersage beträgt weniger als 30 %. Der Anteil liegt deutlich unter 30 %, aber weniger als 20 % konnten nicht erreicht werden. Es gibt jedoch gute Gründe für die Annahme, dass das Modell NICHT neu trainiert wird. Das Wichtigste ist, nicht übertrainiert zu sein - ein übertrainiertes Modell wird überhaupt nicht gebraucht, es ist gefährlicher Unsinn.

Modelle: random forest und ada. Im Allgemeinen hat die Wahl des Modells wenig Einfluss auf das Ergebnis, wenn es überhaupt trainierbar ist. Auf meine Prädiktoren wird nnet überhaupt nicht trainiert.

Welche Art von Logloss haben Sie dort?
 
lucky_teapot:
Welche Art von Logloss haben Sie dort?
Was ist Logloss?
 
SanSanych Fomenko:

Der Fehler bei der Klassenvorhersage beträgt weniger als 30 %. Der Anteil liegt deutlich unter 30 %, aber weniger als 20 % konnten nicht erreicht werden. Es gibt jedoch gute Gründe für die Annahme, dass das Modell NICHT neu trainiert wird. Das Wichtigste ist, nicht übertrainiert zu sein - ein übertrainiertes Modell wird überhaupt nicht gebraucht, es ist gefährlicher Unsinn.

Modelle: random forest und ada. Im Allgemeinen hat die Wahl des Modells wenig Einfluss auf das Ergebnis, wenn es überhaupt trainiert wird. Auf meine Prädiktoren wird nnet überhaupt nicht trainiert.

SanSanych Fomenko:
Was ist Logloss?

Ich vermute, du sprichst von deiner Punktzahl beihttps://numer.ai, aber nicht in loglose, sondern in Form von Hashing (% Fehler). Aberloglose ist eine knifflige Sache, du solltest nicht nur die Klasse, sondern auch die Wahrscheinlichkeit schätzen.

 
lucky_teapot:

Ich verstehe, dass Sie über Ihr Messgerät aufhttps://numer.ai sprechen, aber nicht in logloss, sondern in der Säumung (%-Fehler), aberlogloss ist eine knifflige Sache, Sie müssen nicht nur die Klasse, sondern auch die Wahrscheinlichkeit schätzen.

Ich schreibe über meine EA. Sie hat ein Modell.

Ich verwende Pakete und sie haben eine grobe Schätzung, die nichts mit Logloss zu tun hat. Außerdem können die Ergebnisse von Paketen mit anderen Mitteln geschätzt werden.... Ich erinnere mich nicht an Loglos.

Und die Klasse wird in den Paketen, die ich gesehen habe, von der Wahrscheinlichkeit abgeleitet, d. h. in Wirklichkeit wird die Wahrscheinlichkeit gezählt und dann kalibriert. Er ist standardmäßig in zwei Klassen unterteilt, aber man kann einsteigen und lenken.

 
SanSanych Fomenko:

Ich schreibe über meinen EA. Sie enthält ein Modell.

Ich verwende Pakete, und es gibt darin eine Bewertung, die auf den ersten Blick nichts mit Loglos zu tun hat. Außerdem können die Ergebnisse von Paketen mit anderen Mitteln ausgewertet werden.... Ich erinnere mich nicht an Loglos.

Und die Klasse wird in den Paketen, die ich gesehen habe, von der Wahrscheinlichkeit abgeleitet, d. h. in Wirklichkeit wird die Wahrscheinlichkeit gezählt und dann kalibriert. Er ist standardmäßig in zwei Klassen unterteilt, aber man kann einsteigen und lenken.

Dazu kann ich nichts sagen, aber Sie brauchen zumindest einen Datensatz, auf dem Sie solche Ergebnisse erhalten haben. Loglos Ich stimme zu, für unseren Fall ist es nicht wirklich die richtige Wahl, es ist ein Tribut an kaggle, nicht neu trainiert 20-30% Fehler in der Genauigkeit, das klingt sehr mächtig zu mir, ehrlich gesagt finde ich es schwer zu glauben.

Bei Loglos besteht der Trick darin, dass die Antwortwahrscheinlichkeiten bei zwei Klassen mit 0% Fehler nahe bei 100% und 0% liegen, {0,1,0,1....} Wenn der Fehler 10 % beträgt, wirkt er sich nicht nur auf die Wahrscheinlichkeit falscher Antworten aus, sondern auch auf die Wahrscheinlichkeit richtiger Antworten, so dass die richtigen Antworten, die vorher 1 und 0 waren, jetzt z. B. 0,8 und 0,2 sein sollten. Wenn der Fehler 45 % beträgt, sollte sich alles um 0,5 +- 0,1 bewegen, so dass der Logloss optimal wäre, eine solche Alchemie ....

 
Dr. Trader:

Ich habe gerade zufällig auf das Profil von lucky_teapot geschaut, dort gab es einen Thread im Forum mit einem Link zu einem Artikel darin. Ich glaube, das Ganze wurde vom mql4.com-Forum übertragen, das ich kaum studiert habe, danke MetaQuotes, wenn es wirklich von dort übertragen wurde.
Der Artikel ist fast 9 Jahre alt, aber ich habe viele nützliche Dinge gefunden, die ich auch jetzt noch ausprobieren kann. Ich glaube, ich habe sogar verstanden, was es mit dem dimensionalen Lag-Raum auf sich hat, über den Alexej in diesem Thread schon ein paar Mal gesprochen hat.
Den Artikel selbst finde ich sehr nützlich -https://www.mql5.com/ru/articles/1506

Ich habe es gelesen... Eine Sache hat mich interessiert: Der Autor sagt, dass man die Daten ein wenig verändern kann, wodurch die Stichprobe vergrößert wird und das Modell dann besser funktioniert, da die Wissensbasis des Modells breiter ist...

Ich arbeite mit Streuungen, und die Streuungen sind im Vergleich zur Gesamtstichprobe immer noch gering.

Ich denke, wenn wir eine Multimillionen-Stichprobe ziehen und dem Modell beibringen, Umkehrungen zu erfassen, wird es viele Beispiele geben, und ich denke, das Muster der Umkehrungen ist in beiden Märkten gleich(ich meine viele Muster)

Und hier habe ich eine weitere Frage, oder vielmehr eine Idee, aber noch keine Lösung...

Ich denke, wenn wir alle Umkehrungen von diesen vielen Millionen Werten trennen und nur diese als Trainingsmuster belassen, wird das Modell nur die Umkehrungen selbst lernen, so schnell ist es, aber wenn wir eine Umkehrung von einer Nicht-Umkehrung in den neuen Daten unterscheiden müssen, wie wird das Modell es tun, wenn es keine Ahnung hat, was eine Nicht-Umkehrung ist? ((.

 
mytarmailS:

Ich habe es gelesen... Eine Sache hat mich interessiert: Der Autor sagt, dass man die Daten ein wenig verändern kann, wodurch die Stichprobe vergrößert wird und das Modell dann besser funktioniert, da die Wissensbasis des Modells breiter ist...

Ich arbeite mit Umkehrungen, und die Zahl der Umkehrungen ist im Vergleich zur Gesamtstichprobe noch gering.


Was ist ein Pivot? Ein Takt wie in ZZ?

Mir gefällt die Idee (die hier im Thread geäußert wurde), dass eine Umkehrung als eine bestimmte Abfolge von Balken betrachtet wird, nach der es in der Zukunft einen vorbestimmten Gewinn geben wird. Dieser Ansatz würde das Ungleichgewicht zwischen den Klassen erheblich verringern. Das ist die eine. Zweitens hätte die Klasse selbst eine eindeutige prädiktive Eigenschaft.

Grund der Beschwerde: