Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading

YURY_PROFIT 2021.07.16 21:00 #24231

transcendreamer:

Eigentlich liegt die Beweislast bei der Staatsanwaltschaft, so dass es an Ihnen liegt, zu beweisen, dass das Produkt minderwertig ist (nicht wie behauptet)

Nun, das ist nur ein Appell an die Logik und den gesunden Menschenverstand 🧐.

Nun, Sie sind auch kein Angeklagter))) Mehr wie ein Experte) Dann machen Sie Ihre Expertenmeinung

הטרנסצנדנטלי בעל-חזון 2021.07.16 21:04 #24232

YURY_PROFIT:

Nun, Sie sind auch kein Angeklagter))) Mehr wie ein Experte) Dann machen Sie Ihre Expertenmeinung

Ich werde Sie um Beweise bitten 😉 denn Sie sind der Staatsanwalt.

Oder vielleicht haben Sie dort bereits eine Million verdient und es reicht Ihnen nicht.

Evgeni Gavrilovi 2021.07.16 21:04 #24233

Igor Makanu:

Das ist albern, es gibt Nutzer und Hersteller von Produkten/Waren/Dienstleistungen.

Sie haben Ihr Auto nicht selbst gebaut, sondern ein fertiges Auto von einem Autohersteller gekauft.

SZZ: Sie können es wissenschaftlich machen ... haben Sie schon mal den Satz des Pythagoras gehört? Wo ist Ihrer?)))

der Humor ist auf Profilressourcen, hier von gerade gelesen: "die 3 Elemente kamen zusammen, Bullshit-Fotograf, Bullshit-Model und Bullshit-Cosplay"

darüber... als ob der Markt die Veröffentlichung neuer Produktversionen zuließe, ganz zu schweigen davon, dass einige Produktautoren ihre EAs einfach anhand neuer historischer Daten reoptimieren...... "im Allgemeinen kamen die Elemente zusammen" - hier, nebenbei bemerkt, eines der "Elemente" - imho, niedrige Kundenschulung, nur wenige sind in der Lage, die Qualität des Produkts zu überprüfen, aber es ist so überall - einschließlich der Käufer der oben genannten Autos - sozusagen Marketing

Wo haben Sie Dummheit gesehen? Dieser Beitrag implizierte erstens intellektuelle Arbeit und zweitens, dass "NICHT gelernt wurde, zu benutzen".

Um Textveröffentlichungen zu kritisieren, muss man sich auf EINER Ebene mit dem Autor befinden. Es wurde ein lächerlicher Vergleich mit Pythagoras gezogen. Was ist der Sinn der Sache?

Ein passenderes Beispiel könnte das folgende sein: Sie haben einen Quantencomputer gekauft, können ihn aber nicht bedienen, auch wenn Sie die ausführliche Anleitung gelesen haben.

Ich hoffe, Sie verstehen, worin der grundlegende Unterschied besteht.

Ich werde einen Stadtrat Avalanche [ARCHIV] Alle Fragen von

Vladimir Karputov 2021.07.16 21:10 #24234

Heiße Chilenen - habt ihr zufällig die Branche verwechselt?

[Gelöscht] 2021.07.16 21:24 #24235

Das Niveau lässt sich unmittelbar an der Wahrnehmung bestimmter Themen (Links) und anderer Dinge ablesen. Zwei oder drei Leute sind beim Thema, der Rest ist wie üblich nur zum Flusen

Maxim Kuznetsov 2021.07.16 21:27 #24236

mytarmailS:

Was ist der grundlegende Unterschied zwischen "Spiel \Spiel beenden" und "öffnen \nicht öffnen" oder "kaufen \nicht kaufen"?

Ich glaube nicht, dass es etwas gibt, die übliche Klassifizierung...

Der Start/Stopp eines anderen Roboters soll einfacher sein als der eigene Kauf/Verkauf...

Es gibt weniger Marktrauschen (das Rauschen wird durch den kontrollierten Roboter gefiltert), die Lösung ist leichter zu finden - weil es weniger Invarianten gibt

Fehler, Irrtümer, Fragen Mt4 Ende der Unterstützung. Diskussion zum Artikel "Die

[Gelöscht] 2021.07.16 21:40 #24237

Maxim Kuznetsov:

Start/Stopp eines anderen Roboters - sollte einfacher sein als eigener Kauf/Verkauf...

weniger Marktrauschen (das Rauschen wird durch einen kontrollierten Roboter gefiltert), die Lösung ist leichter zu finden - weil es weniger Invarianten gibt

Es gibt keinen Unterschied, Start/Stopp wird durch andere Zeichen gesteuert, bei denen es Lärm gibt

mytarmailS 2021.07.16 22:21 #24238

Maxim Kuznetsov:

Start/Stopp eines anderen Roboters - sollte einfacher sein als eigener Kauf/Verkauf...

weniger Marktrauschen (das Rauschen wird durch den kontrollierten Roboter gefiltert), die Lösung ist leichter zu finden - weil es weniger Invarianten gibt

Hmmm...

Ich bin immer noch skeptisch, ich habe das Netz mit einem anderen gefiltert, aber du filterst ein paar TS-Spiele und es ist ok?

Aleksey Vyazmikin 2021.07.17 00:35 #24239

Ich habe also die erste Phase der Forschung durchgeführt, die ich bereits angekündigt habe, und wir wollen nun versuchen, die tatsächlichen Ergebnisse zu ermitteln. Ich schreibe und denke auf einen Blick, ich kenne das Ergebnis nicht bis zum Ende, es gibt eine Menge Informationen, und wie man sie richtig analysiert, ist auch eine Frage.

Ich habe eine Stichprobe von 2014 bis zur ersten Hälfte des Jahres 2021 genommen (60% train, 20% test, 20% Prüfung), 5336 Prädiktoren, alle Parameter festgelegt - 6 Tiefenbäume und 100 zufällig gesäte Bäume, Lernrate 0,03 und 1000 Iterationen (Bäume) mit automatischem Stoppen im Falle keiner Verbesserung nach neuen 100 Bäumen auf der Kontrollstichprobe, andere Einstellungen sind nicht wichtig, aber variable Parameter sind Quantisierungstyp und Anzahl der Quantengrenzen. Die Anzahl der Quantengrenzen steigt schrittweise von 8 bis 512 und die Art der Quantisierung - 6 verschiedene Varianten, wir bewahren die Quantisierungstabellen in einer separaten Datei auf.

Nachdem wir alle Modelle trainiert haben, erhalten wir eine Tabelle mit 42 Modellen, geordnet nach der Spalte "Balans_Exam" - unabhängige Auswahl.

Der Screenshot zeigt eine Tabelle mit ausgeblendeten Mittelwerten, aber die ersten fünf besten und fünf schlechtesten Werte werden angezeigt, und der Durchschnittswert der Indikatoren wurde für die gesamte Stichprobe berechnet.

Am Ende werden zwei Modelle ausgewählt - hellgrün hervorgehoben, sie unterscheiden sich in der Anzahl der Quanten - 8 bzw. 128 und in der Art der Quantisierung - Median und UniformAndQuantiles.

Dann teilte ich Stichprobe innerhalb des Tests in 8 Teile, so dass jeder Teil hatte 6 Monate, und trainierte Modelle mit dem ersten und zweiten festen Quantentabelle getrennt, und für jeden, nennen wir es ein Projekt, verwendet 5 Optionen für die Ausbildung, in dem der Parameter random-seeded - 100 Optionen von 8 bis 800 mit Schritt 8:

Trainieren Sie 1000 Bäume ohne Haltekontrolle auf der Testteilstichprobe;
Trainieren Sie 1000 Bäume auf der Teilstichprobe mit Stoppkontrolle auf der Testteilstichprobe nach 100 Iterationen ohne Verbesserung;
Trainieren Sie 100 Bäume ohne Stopp-Kontrolle bei der Unterstichprobe;
Trainieren Sie 50 Bäume ohne Haltestellenkontrolle in der Testteilstichprobe;
Trainieren Sie 5 Bäume, ohne die Kontrolle über die Unterstichprobe zu stoppen.

Nachdem das Training abgeschlossen war, wurden die resultierenden Modelle auf die folgenden Optionen analysiert, um Statistiken über CatBoost-Prädiktoren zu erhalten:

VorhersageWerteÄndern;
LossFunctionChange;
InternalFeatureImportance.

Anschließend habe ich die Ergebnisse für jedes 1/8 der Stichprobe getrennt gemittelt und in einer Gesamttabelle zusammengefasst, die nach dem Mittelwert der Signifikanzwerte der Prädiktoren in jedem Segment geordnet war, wobei ich in jedem Segment gesondert auf das Vorhandensein eines signifikanten Prädiktors geprüft und die Tabelle ebenfalls nach diesem Wert geordnet habe. Das beschriebene Verfahren wurde für jedes Projekt und jeden Statistiktyp im Modell durchgeführt.

Nachfolgend ein Auszug aus der Tabelle für Variante 5 Training und Variante 1 Modellanalyse

Dann habe ich Einstellungen vorgenommen, um die Prädiktoren, die nicht in die n ersten Prädiktoren passen, vom Training auszuschließen. Wenn es nicht genügend Prädiktoren gab, die die Kriterien erfüllen, wurde keine Einstellungsdatei erstellt. Die Einstellungen wurden für jede statistische Variante und jedes Projekt vorgenommen. Für die Anzahl der Prädiktoren, die für das Training verwendet wurden, galten die folgenden Grenzen: 5/25/50/100/300/500/1000/2000/3000. Auf diese Weise erhalten wir eine Reihe von Einstellungen.

Als nächstes habe ich die Ausbildung mit einer festen Einstellung der Quanten-Tabelle auf der Probe - 60% Test - 20% Prüfung - 20% mit einem Maximum von 1000 Bäumen und Stop-Training auf der Probe-Test wurde die Ausbildung für alle Einstellungen und zwei Versionen der Quanten-Tabellen, 100 Modelle mit zufällig gesät - 100 Optionen von 8 bis 800 in Schritten von 8. Darüber hinaus wurde für die beiden Quantentabellen ein separates Training ohne Prädiktorausschluss, aber mit zufallsgesteuerter Aufzählung durchgeführt - 100 Varianten von 8 bis 800 in 8er-Schritten.

Unten ist die Tabelle mit derMedian 8-boundary partitioning setup- die ersten und letzten 5 besten Entscheidungen.

Nachfolgend finden Sie eine Tabelle mit 128 Grenzen, die mit der Methode UniformAndQuantiles erstellt wurden - die ersten und die letzten 5 besten Auswahlen.

Die erste Schlussfolgerung, die gezogen werden kann, ist, dass das Modell über Potenzial verfügt, das von den verwendeten Prädiktoren abhängt, deren Verwendungdurch den Zufallsgenerator beeinflusst wird.Und wenn ich laut nachdenke, würde ich vorschlagen, dass das Ziel der Auswahl der Einstellungen/Methoden nicht das beste Ergebnis sein sollte, sondern das durchschnittliche Ergebnis des Gewinns oder anderer Indikatoren. Ich möchte darauf hinweisen, dass der Durchschnittswert des Finanzergebnisses in der Stichprobe außerhalb der Ausbildung (Spalte Balans_Exam) in der ersten Variante 2222,39 und in der zweiten Variante 1999,13 beträgt.

Als Nächstes erstellen wir eine Tabelle mit den durchschnittlichen metrischen Werten der Modelle mit einer Aufschlüsselung der Einstellungen für ihr Training.

Esfolgt eine Tabelle mit einer Aufschlüsselung in 8 Grenzen nach derMedian-Methode für verschiedene Einstellungen, die für den Ausschluss von Prädiktoren verantwortlich sind- die ersten Top-10-Varianten sind die Durchschnittswerte.

Nachfolgend finden Sie eineTabelle mit 128 Grenzenfür die verschiedenen Einstellungen, die für den Ausschluss von Prädiktoren verantwortlich sind,unter Verwendung der UniformAndQuantiles-Methode - dieersten Top-10-Auswahlen sind die Durchschnittswerte.

Um zu entziffern, was wir hier in der Spalte "File_Name" haben, schlage ich vor, die folgende Tabelle zu verwenden

Versuchen wir, Schritt für Schritt zu analysieren und die Anzahl der beobachteten Kombinationen zu reduzieren.

In der nachstehenden Tabelle wird berechnet, welche "Projekte" in den beiden Quantentabellen unter den ersten zehn sind.

Und hier sehen wir, dass in beiden Tabellen gibt es gute Vertreter des ersten Projekts (Exp_000) und der fünften(Exp_004), die besser ist und von denen zu verlassen, ist nicht klar, aber die Tatsache, dass sie beide in den Top Ten Grund zu denken bekam. Vielleicht sollten Sie Statistiken mit allen Koeffizienten auf der gesamten Tabelle - ich weiß nicht - vorschlagen Optionen. Ich möchte jedoch anmerken, dass die Variante Exp_004 gut ist, weil sie am wenigsten Zeit für die Vorbereitung der Daten zur Erstellung der Setup-Dateien benötigt, was logisch ist, da es nur 5 Bäume gibt. Ich denke, es ist noch zu früh, um endgültige Schlüsse über die Anzahl der Bäume für die Erstausbildung zu ziehen, meinen Sie nicht auch?

In der nachstehenden Tabelle für die Zehnergruppe von zwei Quantentabellen sehen wir uns die Art der Prädiktoranalyse und die Grenzzahl der im Modell verwendeten Prädiktoren an.

Aus der Tabelle ist ersichtlich, dass die erste Analysemethode eine höhere Anzahl von Antworten ergibt und dass die meisten Einstellungen für die Anzahl der im Modell verwendeten Prädiktoren 50 Einheiten nicht überschreiten.

Ich schlage vor, dass wir uns nun die Ergebnisse der Modelle selbst ansehen, indem wir die Stichproben der Projekte nehmen, deren Einstellungen sich als mehrheitlich erwiesen haben, für die erste quantitative Tabelle - CB_Svod_Exp_000_x_000000002 , und für die zweite - CB_Svod_Exp_004_x_000000002.

Nachfolgend finden Sie eine Tabelle mit der Median-Methode zur Einstellung der Prädiktorenauswahl CB_Svod_Exp_000_x_0000002 - die ersten 5 besten und 5 schlechtesten Varianten - in 8 Schranken.

Nachfolgend finden Sie eine Tabelle mit einer 128-Grenzen-Aufteilung nach der UniformAndQuantiles-Methode der Prädiktorenauswahl mit der Einstellung CB_Svod_Exp_004_x_000000002 - die ersten 5 besten und 5 schlechtesten Varianten.

Die erste Zeile enthält die Daten aus der ursprünglichen quantitativen Tabelle, die zweite Zeile enthält die Daten nach der Aufzählungmit Zufallsauswahl, und die dritte Zeile enthält die Ergebnisse der Auswahl nach dem Prädiktorenauswahlverfahren:

1.8-Grenzen-Median-Tabelle

2. Tabelle mit 128 Grenzen, die gemäß der MethodeUniformAndQuantiles festgelegt wurden

Die Schätzungen aus den beiden Tabellen zeigen einen Rückgang der Ergebnisse für die Trainings- und die Teststichprobe und eine Verbesserung der Leistung für die unabhängige Stichprobe, d. h. der Effekt der Anpassung hat sich durch die Verbesserung der Merkmale der Prädiktoren und die Verringerung ihrer Anzahl verringert.

Welche vorläufigen Schlussfolgerungen können gezogen werden?

1. Es ist möglich, die CatBoost-Stichprobe einfach zu füttern, aber die Manipulation der Prädiktoren kann das Modell erheblich verbessern, einschließlich des finanziellen Ergebnisses.

2. Es ist nicht immer notwendig, eine große Anzahl von Prädiktoren in der Stichprobe zu verwenden, um ein gutes Ergebnis zu erzielen - es hat sich gezeigt, dass die Verwendung von nur 1 % aller Prädiktoren ausreicht, um die guten Ergebnisse zu erzielen, die wir anhand des Mittelwerts schätzen.

Um diese Idee weiterzuentwickeln, müssen wir Experimente mit anderen Proben durchführen, und wenn sich das Ergebnis wiederholt, können wir darüber nachdenken, die Anzahl der Kombinationen zu reduzieren, um vielversprechende Ergebnisse zu finden. Ziel ist es, eine Blindmethode zu entwickeln, die es ermöglicht, bessere Durchschnittswerte zu finden, ohne Test- und Prüfungsproben zu betrachten, was die Stichprobe für das Training um 40 % erhöhen würde, und dennoch die Identifizierung von Prädiktoren mit einer stabilen Reaktion ermöglicht.

Man könnte über eine zusätzliche Filterung der Prädiktoren zum Zeitpunkt der Schätzung nachdenken und einen Anpassungsfaktor für ihre Nützlichkeit/Effizienz im Hinblick auf das erzielte finanzielle Ergebnis hinzufügen.

Warum ich mir Finanzwerte ansehe - der Punkt ist, dass verschiedene Ereignisse auf dem Markt auftreten können, und wenn das Modell Ereignisse mit höherer Rendite bevorzugt auswählen kann, dann gefällt mir dieser Ansatz des Modells, während ich mir die geschätzten statistischen Indikatoren des Modells und die Grafik selbst ansehe.

Ich hoffe, Sie fanden den Beitrag interessant, ich freue mich auf Ihre Kommentare!

Ich habe eine Datei mit allen Tabellen angehängt - wer Interesse hat und wer nachdenken möchte.

Dateien:

CB_Svod_Si_Q.zip 697 kb

Gibt es ein Muster Diskussion zum Artikel "Der Auf der Suche nach

[Gelöscht] 2021.07.17 02:47 #24240

Und dann kann man die 5-15-Schritte nehmen, und es ist genauso gut.

Oder sortieren Sie zuerst alle Prädiktoren nach Korrelation aus (Sekunden Zeit) und nehmen Sie dann die verbleibenden 5-15 (wenn Sie so viele bekommen können)

So spart man mit Ökonometrie Zeit.

EURUSD - Trends, Prognosen Gedanken über die Absurdität Fragen von Neueinsteigern zu

Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2424