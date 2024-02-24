Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2424
Eigentlich liegt die Beweislast bei der Staatsanwaltschaft, so dass es an Ihnen liegt, zu beweisen, dass das Produkt minderwertig ist (nicht wie behauptet)
Nun, das ist nur ein Appell an die Logik und den gesunden Menschenverstand 🧐.
Nun, Sie sind auch kein Angeklagter))) Mehr wie ein Experte) Dann machen Sie Ihre Expertenmeinung
Nun, Sie sind auch kein Angeklagter))) Mehr wie ein Experte) Dann machen Sie Ihre Expertenmeinung
Ich werde Sie um Beweise bitten 😉 denn Sie sind der Staatsanwalt.
Oder vielleicht haben Sie dort bereits eine Million verdient und es reicht Ihnen nicht.
Das ist albern, es gibt Nutzer und Hersteller von Produkten/Waren/Dienstleistungen.
Sie haben Ihr Auto nicht selbst gebaut, sondern ein fertiges Auto von einem Autohersteller gekauft.
SZZ: Sie können es wissenschaftlich machen ... haben Sie schon mal den Satz des Pythagoras gehört? Wo ist Ihrer?)))
der Humor ist auf Profilressourcen, hier von gerade gelesen: "die 3 Elemente kamen zusammen, Bullshit-Fotograf, Bullshit-Model und Bullshit-Cosplay"
darüber... als ob der Markt die Veröffentlichung neuer Produktversionen zuließe, ganz zu schweigen davon, dass einige Produktautoren ihre EAs einfach anhand neuer historischer Daten reoptimieren...... "im Allgemeinen kamen die Elemente zusammen" - hier, nebenbei bemerkt, eines der "Elemente" - imho, niedrige Kundenschulung, nur wenige sind in der Lage, die Qualität des Produkts zu überprüfen, aber es ist so überall - einschließlich der Käufer der oben genannten Autos - sozusagen Marketing
Wo haben Sie Dummheit gesehen? Dieser Beitrag implizierte erstens intellektuelle Arbeit und zweitens, dass "NICHT gelernt wurde, zu benutzen".
Um Textveröffentlichungen zu kritisieren, muss man sich auf EINER Ebene mit dem Autor befinden. Es wurde ein lächerlicher Vergleich mit Pythagoras gezogen. Was ist der Sinn der Sache?
Ein passenderes Beispiel könnte das folgende sein: Sie haben einen Quantencomputer gekauft, können ihn aber nicht bedienen, auch wenn Sie die ausführliche Anleitung gelesen haben.
Ich hoffe, Sie verstehen, worin der grundlegende Unterschied besteht.
Was ist der grundlegende Unterschied zwischen "Spiel \Spiel beenden" und "öffnen \nicht öffnen" oder "kaufen \nicht kaufen"?
Ich glaube nicht, dass es etwas gibt, die übliche Klassifizierung...
Der Start/Stopp eines anderen Roboters soll einfacher sein als der eigene Kauf/Verkauf...
weniger Marktrauschen (das Rauschen wird durch einen kontrollierten Roboter gefiltert), die Lösung ist leichter zu finden - weil es weniger Invarianten gibt
Hmmm...
Ich bin immer noch skeptisch, ich habe das Netz mit einem anderen gefiltert, aber du filterst ein paar TS-Spiele und es ist ok?
Ich habe also die erste Phase der Forschung durchgeführt, die ich bereits angekündigt habe, und wir wollen nun versuchen, die tatsächlichen Ergebnisse zu ermitteln. Ich schreibe und denke auf einen Blick, ich kenne das Ergebnis nicht bis zum Ende, es gibt eine Menge Informationen, und wie man sie richtig analysiert, ist auch eine Frage.
Ich habe eine Stichprobe von 2014 bis zur ersten Hälfte des Jahres 2021 genommen (60% train, 20% test, 20% Prüfung), 5336 Prädiktoren, alle Parameter festgelegt - 6 Tiefenbäume und 100 zufällig gesäte Bäume, Lernrate 0,03 und 1000 Iterationen (Bäume) mit automatischem Stoppen im Falle keiner Verbesserung nach neuen 100 Bäumen auf der Kontrollstichprobe, andere Einstellungen sind nicht wichtig, aber variable Parameter sind Quantisierungstyp und Anzahl der Quantengrenzen. Die Anzahl der Quantengrenzen steigt schrittweise von 8 bis 512 und die Art der Quantisierung - 6 verschiedene Varianten, wir bewahren die Quantisierungstabellen in einer separaten Datei auf.
Nachdem wir alle Modelle trainiert haben, erhalten wir eine Tabelle mit 42 Modellen, geordnet nach der Spalte "Balans_Exam" - unabhängige Auswahl.
Der Screenshot zeigt eine Tabelle mit ausgeblendeten Mittelwerten, aber die ersten fünf besten und fünf schlechtesten Werte werden angezeigt, und der Durchschnittswert der Indikatoren wurde für die gesamte Stichprobe berechnet.
Am Ende werden zwei Modelle ausgewählt - hellgrün hervorgehoben, sie unterscheiden sich in der Anzahl der Quanten - 8 bzw. 128 und in der Art der Quantisierung - Median und UniformAndQuantiles.
Dann teilte ich Stichprobe innerhalb des Tests in 8 Teile, so dass jeder Teil hatte 6 Monate, und trainierte Modelle mit dem ersten und zweiten festen Quantentabelle getrennt, und für jeden, nennen wir es ein Projekt, verwendet 5 Optionen für die Ausbildung, in dem der Parameter random-seeded - 100 Optionen von 8 bis 800 mit Schritt 8:
Nachdem das Training abgeschlossen war, wurden die resultierenden Modelle auf die folgenden Optionen analysiert, um Statistiken über CatBoost-Prädiktoren zu erhalten:
Anschließend habe ich die Ergebnisse für jedes 1/8 der Stichprobe getrennt gemittelt und in einer Gesamttabelle zusammengefasst, die nach dem Mittelwert der Signifikanzwerte der Prädiktoren in jedem Segment geordnet war, wobei ich in jedem Segment gesondert auf das Vorhandensein eines signifikanten Prädiktors geprüft und die Tabelle ebenfalls nach diesem Wert geordnet habe. Das beschriebene Verfahren wurde für jedes Projekt und jeden Statistiktyp im Modell durchgeführt.
Nachfolgend ein Auszug aus der Tabelle für Variante 5 Training und Variante 1 Modellanalyse
Dann habe ich Einstellungen vorgenommen, um die Prädiktoren, die nicht in die n ersten Prädiktoren passen, vom Training auszuschließen. Wenn es nicht genügend Prädiktoren gab, die die Kriterien erfüllen, wurde keine Einstellungsdatei erstellt. Die Einstellungen wurden für jede statistische Variante und jedes Projekt vorgenommen. Für die Anzahl der Prädiktoren, die für das Training verwendet wurden, galten die folgenden Grenzen: 5/25/50/100/300/500/1000/2000/3000. Auf diese Weise erhalten wir eine Reihe von Einstellungen.
Als nächstes habe ich die Ausbildung mit einer festen Einstellung der Quanten-Tabelle auf der Probe - 60% Test - 20% Prüfung - 20% mit einem Maximum von 1000 Bäumen und Stop-Training auf der Probe-Test wurde die Ausbildung für alle Einstellungen und zwei Versionen der Quanten-Tabellen, 100 Modelle mit zufällig gesät - 100 Optionen von 8 bis 800 in Schritten von 8. Darüber hinaus wurde für die beiden Quantentabellen ein separates Training ohne Prädiktorausschluss, aber mit zufallsgesteuerter Aufzählung durchgeführt - 100 Varianten von 8 bis 800 in 8er-Schritten.
Unten ist die Tabelle mit derMedian 8-boundary partitioning setup- die ersten und letzten 5 besten Entscheidungen.
Nachfolgend finden Sie eine Tabelle mit 128 Grenzen, die mit der Methode UniformAndQuantiles erstellt wurden - die ersten und die letzten 5 besten Auswahlen.
Die erste Schlussfolgerung, die gezogen werden kann, ist, dass das Modell über Potenzial verfügt, das von den verwendeten Prädiktoren abhängt, deren Verwendungdurch den Zufallsgenerator beeinflusst wird.Und wenn ich laut nachdenke, würde ich vorschlagen, dass das Ziel der Auswahl der Einstellungen/Methoden nicht das beste Ergebnis sein sollte, sondern das durchschnittliche Ergebnis des Gewinns oder anderer Indikatoren. Ich möchte darauf hinweisen, dass der Durchschnittswert des Finanzergebnisses in der Stichprobe außerhalb der Ausbildung (Spalte Balans_Exam) in der ersten Variante 2222,39 und in der zweiten Variante 1999,13 beträgt.
Als Nächstes erstellen wir eine Tabelle mit den durchschnittlichen metrischen Werten der Modelle mit einer Aufschlüsselung der Einstellungen für ihr Training.
Esfolgt eine Tabelle mit einer Aufschlüsselung in 8 Grenzen nach derMedian-Methode für verschiedene Einstellungen, die für den Ausschluss von Prädiktoren verantwortlich sind- die ersten Top-10-Varianten sind die Durchschnittswerte.
Nachfolgend finden Sie eineTabelle mit 128 Grenzenfür die verschiedenen Einstellungen, die für den Ausschluss von Prädiktoren verantwortlich sind,unter Verwendung der UniformAndQuantiles-Methode - dieersten Top-10-Auswahlen sind die Durchschnittswerte.
Um zu entziffern, was wir hier in der Spalte "File_Name" haben, schlage ich vor, die folgende Tabelle zu verwenden
Versuchen wir, Schritt für Schritt zu analysieren und die Anzahl der beobachteten Kombinationen zu reduzieren.
In der nachstehenden Tabelle wird berechnet, welche "Projekte" in den beiden Quantentabellen unter den ersten zehn sind.
Und hier sehen wir, dass in beiden Tabellen gibt es gute Vertreter des ersten Projekts (Exp_000) und der fünften(Exp_004), die besser ist und von denen zu verlassen, ist nicht klar, aber die Tatsache, dass sie beide in den Top Ten Grund zu denken bekam. Vielleicht sollten Sie Statistiken mit allen Koeffizienten auf der gesamten Tabelle - ich weiß nicht - vorschlagen Optionen. Ich möchte jedoch anmerken, dass die Variante Exp_004 gut ist, weil sie am wenigsten Zeit für die Vorbereitung der Daten zur Erstellung der Setup-Dateien benötigt, was logisch ist, da es nur 5 Bäume gibt. Ich denke, es ist noch zu früh, um endgültige Schlüsse über die Anzahl der Bäume für die Erstausbildung zu ziehen, meinen Sie nicht auch?
In der nachstehenden Tabelle für die Zehnergruppe von zwei Quantentabellen sehen wir uns die Art der Prädiktoranalyse und die Grenzzahl der im Modell verwendeten Prädiktoren an.
Aus der Tabelle ist ersichtlich, dass die erste Analysemethode eine höhere Anzahl von Antworten ergibt und dass die meisten Einstellungen für die Anzahl der im Modell verwendeten Prädiktoren 50 Einheiten nicht überschreiten.
Ich schlage vor, dass wir uns nun die Ergebnisse der Modelle selbst ansehen, indem wir die Stichproben der Projekte nehmen, deren Einstellungen sich als mehrheitlich erwiesen haben, für die erste quantitative Tabelle - CB_Svod_Exp_000_x_000000002 , und für die zweite - CB_Svod_Exp_004_x_000000002.
Nachfolgend finden Sie eine Tabelle mit der Median-Methode zur Einstellung der Prädiktorenauswahl CB_Svod_Exp_000_x_0000002 - die ersten 5 besten und 5 schlechtesten Varianten - in 8 Schranken.
Nachfolgend finden Sie eine Tabelle mit einer 128-Grenzen-Aufteilung nach der UniformAndQuantiles-Methode der Prädiktorenauswahl mit der Einstellung CB_Svod_Exp_004_x_000000002 - die ersten 5 besten und 5 schlechtesten Varianten.
Die erste Zeile enthält die Daten aus der ursprünglichen quantitativen Tabelle, die zweite Zeile enthält die Daten nach der Aufzählungmit Zufallsauswahl, und die dritte Zeile enthält die Ergebnisse der Auswahl nach dem Prädiktorenauswahlverfahren:
1.8-Grenzen-Median-Tabelle
2. Tabelle mit 128 Grenzen, die gemäß der MethodeUniformAndQuantiles festgelegt wurden
Die Schätzungen aus den beiden Tabellen zeigen einen Rückgang der Ergebnisse für die Trainings- und die Teststichprobe und eine Verbesserung der Leistung für die unabhängige Stichprobe, d. h. der Effekt der Anpassung hat sich durch die Verbesserung der Merkmale der Prädiktoren und die Verringerung ihrer Anzahl verringert.
Welche vorläufigen Schlussfolgerungen können gezogen werden?
1. Es ist möglich, die CatBoost-Stichprobe einfach zu füttern, aber die Manipulation der Prädiktoren kann das Modell erheblich verbessern, einschließlich des finanziellen Ergebnisses.
2. Es ist nicht immer notwendig, eine große Anzahl von Prädiktoren in der Stichprobe zu verwenden, um ein gutes Ergebnis zu erzielen - es hat sich gezeigt, dass die Verwendung von nur 1 % aller Prädiktoren ausreicht, um die guten Ergebnisse zu erzielen, die wir anhand des Mittelwerts schätzen.
Um diese Idee weiterzuentwickeln, müssen wir Experimente mit anderen Proben durchführen, und wenn sich das Ergebnis wiederholt, können wir darüber nachdenken, die Anzahl der Kombinationen zu reduzieren, um vielversprechende Ergebnisse zu finden. Ziel ist es, eine Blindmethode zu entwickeln, die es ermöglicht, bessere Durchschnittswerte zu finden, ohne Test- und Prüfungsproben zu betrachten, was die Stichprobe für das Training um 40 % erhöhen würde, und dennoch die Identifizierung von Prädiktoren mit einer stabilen Reaktion ermöglicht.
Man könnte über eine zusätzliche Filterung der Prädiktoren zum Zeitpunkt der Schätzung nachdenken und einen Anpassungsfaktor für ihre Nützlichkeit/Effizienz im Hinblick auf das erzielte finanzielle Ergebnis hinzufügen.
Warum ich mir Finanzwerte ansehe - der Punkt ist, dass verschiedene Ereignisse auf dem Markt auftreten können, und wenn das Modell Ereignisse mit höherer Rendite bevorzugt auswählen kann, dann gefällt mir dieser Ansatz des Modells, während ich mir die geschätzten statistischen Indikatoren des Modells und die Grafik selbst ansehe.
Ich hoffe, Sie fanden den Beitrag interessant, ich freue mich auf Ihre Kommentare!
