Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1193

 
Maxim Dmitrievsky:

auch auf mql5... Aber es gibt einen guten Tester und eine Basis hier :)

Das Problem ist, dass ich es leid bin, alles zu lesen, wenn ich Zeit habe.

Wenn der Zweck ist, das Produkt auf dem Markt zu verkaufen, ach, dann ist alles in MQL, wenn der Zweck ist die persönliche Nutzung oder Verteilung über dieses Forum, dann kommt das Problem auf die Möglichkeit, .dll und die Verknüpfung mit MT bekommen

 
Igor Makanu:

Das ist das Problem, ich bin selbst am Durchdrehen, ich bin es leid, alles zu lesen, wenn ich Zeit habe.

Ich habe die Ziele zu definieren - Gedanken laut )))), wenn der Zweck ist ein Produkt auf dem Markt, ach, dann alle auf MQL, wenn der Zweck der persönlichen Nutzung oder Verteilung über dieses Forum, dann die Aufgabe kommt auf die Fähigkeit, .dll und die Verknüpfung mit MT bekommen

Ich werde es als ausgezeichneten MQL-Bot verwenden, alles andere ist Quatsch. Wenn du für den Markt schreibst, dann ist die Werbung dort wichtiger als die Handelsleistung, und dumme Käufer werden dich umhauen (habe Erfahrung). Ich habe Erfahrung. Sie können fast jeden Indikator oder Expert Advisor aus der Codebasis nehmen und ihn auf dem Markt verkaufen... oder 200 von ihnen wie Gribachev einstellen, jeden Tag einen neuen, aber das ist nicht der Weg der Samurai.

Sie müssen Ihre Frau oder eine angeheuerte Sklavin an den Computer setzen, um mit den Kunden zu kommunizieren, aber Sie werden Ihre Zeit nicht verschwenden :)
 
Maxim Dmitrievsky:

Das Ziel ist ein genialer Bot auf der MO, der Rest ist Quatsch. Wenn Sie für den Markt schreiben, ist die Werbung dort wichtiger als die Handelsleistung, und dumme Käufer werden Sie umhauen (das habe ich erlebt). Ich habe keine Code-Basis-Indikator oder Expert Advisor, und sie werden sie im Markt zu verkaufen... Oder Sie können 200 von ihnen wie Gribachev setzen, jeden Tag ein neues, aber das ist nicht der Weg der Samurai.

Wenn Sie das tun wollen, schicken Sie besser Ihre Frau oder einen angeheuerten Sklaven, um mit den Käufern zu kommunizieren, denn Sie werden keine Zeit damit verschwenden :)

Ich habe es bereits vorhergesehen, so dass ich nicht denke, es ist notwendig, "hecheln" und dass etwas Sinnvolles in den Markt zu setzen - ich kann nicht bieten Produkt-Support, weil es eine lange Zeit dauern wird, und Sachen dort gespeichert, mit der Hoffnung, dass es Leute, die $ 30 geben will, wie das Gewissen nicht erlaubt)))

ZS: Raster von Aufträgen durch einen einfachen Indikator... Es funktioniert für immer und ewig (nach oben oder unten) und wird von den Nutzern immer nachgefragt ))))

 
Igor Makanu:

Ich habe es bereits vorhergesehen, so dass ich nicht glaube, es ist notwendig, "hecheln" und etwas auf dem Markt wert - ich werde nicht in der Lage sein, das Produkt zu unterstützen, weil es eine lange Zeit dauern wird, und Sachen dort gespeichert, in der Hoffnung, Leute, die $ 30 geben will, ich nicht zulassen)))

ZS: Raster von Aufträgen durch einen einfachen Indikator... Es wird immer funktionieren (nach oben oder unten) und wird von den Nutzern immer nachgefragt ))))

Martins, Grids ja ... Geeks aller Art, es ist ewig :)

 

Da kam mir die Idee, Übertraining mit Hilfe von MO zu ermitteln. Ich halte graben catbust, dort können Sie eine Vorhersage in probabilistischen Begriffen zu bekommen - ich habe in Gruppen von 0 bis 9 Wahrscheinlichkeiten verstreut - für die Leichtigkeit der Wahrnehmung und weitere Analyse - sah Verteilungen, Standardabweichung, Kurtosis, Asymmetrie, einschließlich einer Aufschlüsselung nach Ziel und Verteilung der Fehler, die Richtigkeit der Antworten in jeder Gruppe. Jetzt werde ich verschiedene Standardindikatoren zur Bewertung des Modells heranziehen, wie AUC F1 und andere, an denen man die Lerndynamik erkennen kann, aber bisher weiß ich nicht, wie ich sie besser beschreiben soll.

Es gibt zwei Modelle im Diagramm - die Verteilungsgruppe * die Gruppe der richtigen Klassifizierung. Das blaue Modell eignet sich besser für das Prüfungsmuster.


Welche anderen Prädiktoren können Sie sich vorstellen, um das Modell zu bewerten?

 
Aleksey Vyazmikin:

Da kam mir dieIdee ,Übertraining mit Hilfe von MO zu ermitteln . Ich halte graben catbust, dort können Sie eine Vorhersage in probabilistischen Begriffen zu bekommen - ich habe in Gruppen von 0 bis 9 Wahrscheinlichkeiten verstreut - für die Leichtigkeit der Wahrnehmung und weitere Analyse - sah Verteilungen, Standardabweichung, Kurtosis, Asymmetrie, einschließlich einer Aufschlüsselung nach Ziel und Verteilung der Fehler, die Richtigkeit der Antworten in jeder Gruppe. Jetzt werde ich verschiedene Standardindikatoren zur Bewertung des Modells heranziehen, wie AUC F1 und andere, an denen man die Lerndynamik erkennen kann, aber bisher weiß ich nicht, wie ich sie besser beschreiben soll.

Es gibt zwei Modelle im Diagramm - die Verteilungsgruppe * die Gruppe der richtigen Klassifizierung. Das blaue Modell ist bei der Prüfungsprobe besser.


Welche anderen Prädiktoren können Sie sich vorstellen, um das Modell zu bewerten?

cool, das machen eigentlich alle

Metriken werden zur Schätzung des Modells verwendet, nicht als Prädiktoren, Standardmetriken sind in der Regel ausreichend, aber Sie können auch Ihre eigenen erfinden

Je größer der Fehler im Wald ist, desto geringer ist in der Regel die Streuung (Dispersion) der Werte, d. h. nur weißes Rauschen um 0,5; in diesem Sinne ist die blaue Linie schlechter als die rote.
 
Maxim Dmitrievsky:

Toll, das macht eigentlich jeder.

Metriken werden zur Schätzung eines Modells verwendet, nicht als Prädiktoren. Standardmetriken sind in der Regel ausreichend, aber Sie können auch eigene erfinden.

Je größer der Fehler im Wald ist, desto geringer ist in der Regel die Streuung der Werte, d. h. weißes Rauschen um 0,5; in diesem Sinne ist die blaue Linie schlechter als die rote.

Ha, es geht also darum, ein Schätzkriterium zu finden und nicht nur mit verschiedenen Berechnungsformeln zu schätzen! Alle diese Ansätze mit Formeln bewerten das Modell stationär, sagen aber nichts über seine Fähigkeit aus, weiter zu arbeiten, und genau das will ich erreichen, deshalb generiere ich Prädiktoren, damit es möglich ist, mit Hilfe von MO ein Muster aus einer Menge verschiedener Indikatoren zu finden.

Was die Streuung betrifft, so ist Ihre Aussage sehr seltsam. Vielleicht berücksichtigt sie nur die Tatsache, dass Werte gefunden wurden, ohne deren Klassifizierungswert und den Prozentsatz der richtigen Antworten zu berücksichtigen. Auf dem Diagramm von Null bis 5 auf der x-Achse ist das Produkt einer Gruppe von Nullen und ihrer korrekten Zuordnung, und von 5 gegenüber ist das Produkt von Einheiten.

Hier ist ein Diagramm dieser Modelle, das jedoch die Verteilung des Ziels "1" zeigt

Wie Sie sehen können, hat das rote Modell einen verschobenen Prozentsatz der Verteilung über 5, was bedeutet, dass "Einsen" keine Chance haben, richtig klassifiziert zu werden, und diejenigen, die eine Chance haben, sind geringer als beim blauen Modell - 23 % bzw. 28 %.

Und so ändert sich die Klassifizierungstreue

Natürlich ist es auch möglich, ein solches abgeflachtes Modell zu verwenden, aber es ist notwendig, die Klassifikationsteilung z.B. von 0,5 auf 0,7 zu verschieben, aber es bleibt nicht viel Material für die Bearbeitung übrig, aber andererseits können solche abgeflachten Modelle kombiniert werden...

 
Aleksey Vyazmikin:

Ha, es geht also darum, ein Schätzkriterium zu finden und nicht nur mit verschiedenen Berechnungsformeln zu schätzen! Alle diese Formelansätze bewerten das Modell stationär, sagen aber nichts über seine Fähigkeit aus, weiter zu arbeiten, was genau das ist, was ich erreichen möchte, weshalb ich Prädiktoren generiere, damit ich mit Hilfe von MO ein Muster aus einer Reihe verschiedener Indikatoren finden kann.

Was die Streuung betrifft, so ist Ihre Aussage sehr seltsam. Vielleicht berücksichtigt sie nur die Tatsache, dass Werte gefunden wurden, ohne deren Klassifizierungswert und den Prozentsatz der richtigen Antworten zu berücksichtigen. Auf dem Diagramm von Null bis 5 auf der x-Achse ist das Produkt einer Gruppe von Nullen und ihrer korrekten Zuordnung, und von 5 gegenüber ist das Produkt von Einheiten.

Hier ist ein Diagramm dieser Modelle, das jedoch die Verteilung des Ziels "1" zeigt

Wie Sie sehen können, hat das rote Modell einen verschobenen Prozentsatz der Verteilung jenseits von 5, was bedeutet, dass "Einsen" keine Chance auf eine korrekte Klassifizierung haben, und diejenigen, die eine Chance haben, sind geringer als beim blauen Modell - 23 % bzw. 28 %.

Und so ändert sich die Klassifizierungstreue

Natürlich können wir auch ein solches abgeflachtes Modell verwenden, aber es ist notwendig, die Teilung der Klassifikation von z.B. 0,5 auf 0,7 zu verschieben, aber es bleibt nicht viel Material für die Verarbeitung übrig, aber andererseits können solche abgeflachten Modelle kombiniert werden...

die Tatsache, dass sie verzerrt ist, spricht für eine bestimmte Klasse, es könnte sich um einen Trendmarkt handeln, d. h. um eine Lernstichprobe (ungefähr).

Und wenn Sie die blaue nehmen, haben Sie eine starke Abnahme der Wahrscheinlichkeiten, d.h. wenn die Wahrscheinlichkeit eines Signals idealerweise 1 sein sollte, dann haben Sie ein Maximum von 0,6-0,7, d.h. beide Klassen drehen sich um 0,5, mit kleinen Abweichungen in Richtung der einen oder anderen Klasse, in der Tat, es gibt Rauschen und keine Signale, oder das Modell ist stark reguliert

die Fähigkeit, an einem Testmuster mit Fehlern weiterzuarbeiten... wenn man es schafft, sich den Fehlern auf einem Tablett zu nähern, ist das Modell in der Regel gut

 
Maxim Dmitrievsky:

die Tatsache, dass sie verzerrt ist, spricht einfach für eine bestimmte Klasse, es könnte sich um einen Trendmarkt handeln, d. h. um eine Ausbildungsstichprobe (ungefähr).

Wir vergleichen das Modell unter den gleichen Bedingungen, hier sind die gleichen Modelle auf andere Daten Ziel Einheiten fielen unter die Klassifizierung 1 - 35% vs. 39%

Klassifikationstreue

und da die Häufung aller Werte näher am Zentrum liegt, ergibt sich das Produkt

Maxim Dmitrievsky:

Und wenn man Blau nimmt, erhält man eine starke Abnahme der Wahrscheinlichkeiten, d.h. wenn die Wahrscheinlichkeit eines Signals idealerweise 1 sein sollte, dann hat man maximal 0,6-0,7, d.h. beide Klassen drehen sich um 0,5, mit kleinen Abweichungen in Richtung der einen oder anderen Klasse, in der Tat gibt es Rauschen, aber keine Signale

die Fähigkeit, an einem Testmuster von Fehlern weiterzuarbeiten... wenn es Ihnen gelingt, sich den Fehlern auf einem Tablett anzunähern, dann ist das Modell in der Regel gut

Warum muss diese Wahrscheinlichkeit "1" sein - das ist eher Selbstüberschätzung, im Gegenteil, ich denke, dass ein korrektes (ideales) Modell zwei Höcker zwischen 0,1 und 0,3 und 0,7 und 0,9 haben muss - weil das auf Stabilität und Angemessenheit hinweist, aber solche Modelle werden in der Tat noch nicht beobachtet.

Was die Annäherung der geschätzten Koeffizientenwerte betrifft, so stimme ich zu. Ich werde mir Delta ansehen und weitere Messungen zur Dynamik vornehmen - bei catbust kann man sehen, wie sich die Werte ändern, wenn dem Modell Bäume hinzugefügt werden.
 
Aleksey Vyazmikin:

Wir vergleichen das Modell unter den gleichen Bedingungen, hier sind die gleichen Modelle auf andere Daten Ziel-Einheiten fiel unter die Klassifizierung 1 - 35% vs. 39%

Klassifikationstreue

und da die Akkumulation aller Werte näher an der Mitte liegt, ergibt sich das Produkt

Warum sollte diese Wahrscheinlichkeit "1" sein - es ist eher Selbstgefälligkeit, denn ich denke, dass ein richtiges (ideales) Modell zwei Höcker zwischen 0,2 und 0,4 und 0,7 und 0,9 haben sollte - dies würde Stabilität und Angemessenheit anzeigen, aber ich sehe solche Modelle in der Realität noch nicht.

Was die Annäherung der geschätzten Koeffizientenwerte angeht - ja, ich stimme zu - werde ich mir Delta ansehen und einige weitere Messungen zur Dynamik vornehmen - bei catbust kann man sehen, wie sich die Indikatoren ändern, wenn dem Modell Bäume hinzugefügt werden.

je höher die Wahrscheinlichkeit des Ereignisses, desto genauer das Signal, das ergibt sich schon aus der Definition :) 2 Bei verrauschten Daten wird es keinen Buckel geben, und zwar zumindest deshalb, weil es Übergangszustände geben wird, aber das Modell sollte zumindest die Extremwerte in einem angemessenen Umfang erfassen, sonst ist es nie sicher über die Eingaben

Grund der Beschwerde: