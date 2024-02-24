Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3190
Setzen Sie ihn zumindest annähernd mit dem Gewinn in Beziehung und vergleichen Sie den tatsächlichen Gewinn mit einer Stichprobe von Zufallsgewinnen. Die Überprüfung, dass keine Fehler vorliegen, besteht darin, dass der durchschnittliche Gewinn der Stichprobe gleich Null ist. Prüfen Sie die Signifikanz der Positivität des realen Gewinns im Verhältnis zur Stichprobe - die Drei-Sigma-Regel.
Ich bin nicht bereit, auf die Einzelheiten Ihrer Aufgabe einzugehen, da meine eigenen Aufgaben zu umfangreich sind.
Was hat der Gewinn damit zu tun, wenn wir über die Vorverarbeitung von Daten für die weitere Klassifizierung sprechen?
Sind Ihre Quanten für die Profitextraktion ausgelegt? Gibt es ein Schema dafür? Vereinfachen Sie es extrem, um auch nur annähernd, aber schnell eine Stichprobe zu berechnen und zu prüfen, ob das tatsächliche Ergebnis in den Schwanz dieser Stichprobe fällt.
Ihre Bereitschaft, von den Leuten zu verlangen, sich in Ihre Denkweise zu vertiefen, begleitet von Ihrem völligen Unwillen, sich mit einfachen und allgemein bekannten Ideen wie Monte Carlo zu befassen, ist ermüdend.
Ich denke, ich habe genug.
Jeder hat das Recht, seine Zeit selbst einzuteilen.
Aber offensichtlich haben Sie die Frage, zu der Sie einen Ratschlag gegeben haben, nicht verstanden.
Danke, dass Sie versucht haben, zu helfen.
Ich habe verstanden.
Ich habe noch einen anderen Vorschlag: Wie wäre es, wenn Sie den Prozess der Waldkonstruktion überschaubarer machen und als Wurzel für jeden Baum eine konkrete Teilprobe des ausgewählten Quantensegments nehmen würden?
Die Tiefe sollte 2-3 Splits betragen, so dass die Beispiele der klassifizierbaren Klasse pro Blatt nicht weniger als 1% betragen würden.
Ich denke, das Modell wird stabiler sein.
D.h. wenn Sie 10 Quanten/Splits auswählen und dann 10 Bäume auf Beispiele aus diesen Splits trainieren? Das scheint einfach zu sein.
Über die Stabilität bei OOS - das Experiment wird es zeigen. Meine Stabilität wird verletzt, wenn ich die Größe des Datenfensters ändere (2 Monate und 4) und wenn ich es sogar um 2% verschiebe (Training am Dienstag statt am Samstag). Die Bäume fallen unterschiedlich aus.
Ich habe ein Experiment mit der Stichprobe durchgeführt, auf der ich die Gifs veröffentlicht habe, es gibt bereits 47% Einheiten in der Stichprobe, die Daten wurden in der Tabelle zusammengefasst....
es stellte sich heraus, dass die Qualität (Nützlichkeit) dieser Quantum-Segmente ist schlechter (weniger) als die ursprünglichen um 10 mal.
Über eine solche Verschlechterung (in Zeiten) nahm ich an, als ich mit fxsaber kommunizierte, über das Mischen durch seinen Algorithmus. Er hat keinen so starken Unterschied in seinen Daten. Offenbar, weil er nicht alle Balken in einer Reihe im Markup hat (oder Reihen, die in einer Reihe stehen), sondern mit großen Lücken. Wenn Ihre Balken dicht beieinander liegen, haben sie eine sehr ähnliche Vergangenheit und Zukunft, d. h. es können 20 Beispiele der Klasse 1 in einer Reihe stehen. Indem Sie sie randomisieren, machen Sie aus ihnen einen Durchschnitt von 0101010...., und Sie sollten die ganze Reihe von 20 "1en" in 20 "0en" ändern. Da sie nahe beieinander liegen, können sie als ein Beispiel gezählt werden. Wenn es bei Ihnen nicht so ist, dann ist es bei mir so (ich werte alle Balken hintereinander aus, deshalb diese Idee).
Generell denke ich, dass man bei einem so starken Unterschied von 10 mal nicht 10000 Tests machen kann. Der Unterschied in den ersten 10 Tests (alle schlechter) ist zu deutlich, als dass man davon ausgehen könnte, dass weitere 10000 Tests das Ergebnis auf Gleichheit mit dem Original anheben würden. Wenn es 3 schlechtere, 3 bessere und 4 annähernd gleiche Ergebnisse gab, dann ja - sammeln Sie weiter Statistiken.
Wenn die Daten seriell sind, besteht das Problem darin, dass eine Serie von 20 1en irgendwo in der Geschichte eine Serie von 20 0en mit einer ähnlichen Vergangenheit finden wird. Hier geht es um Marktzufälligkeit. Es geht nicht darum, aus 111111111 010101010 zu machen.
UPD Ich denke also, dass Monte Carlo in der Form von 01010101 für Marktdaten nicht funktioniert (wenn sie in Serie gehen). Das ist so, als würde man ein Rechteck und ein Quadrat in gleiche Quadrate unterteilen und dann versuchen zu bestimmen, zu welcher Primärzahl das Quadrat gehört).
Ich habe über die strenge Sequenz nur als Beispiel zur Verdeutlichung geschrieben. Und ich habe geschrieben, dass die Lösung dieses Problems die Stabilität des Modells verbessern kann. Aber die Lösung kann auch anders aussehen.
Auch ohne Lösung des oben genannten Problems verbessert die Auswahl der richtigen Quantentabelle das Lernen, was ich an Dutzenden von Beispielen getestet habe.
Dann habe ich gezeigt, wie man schnell eine Vorverarbeitung für das Training durchführen kann, indem man die Probe von inkonsistenten Daten bereinigt. Sie können auf den Gifs sehen, dass Sie mit dieser Methode sogar ein profitables Modell auf neuen Daten erhalten können.
Letztendlich funktioniert der Ansatz, und seine Weiterentwicklung ist mein Ziel.
Zu sagen, dass es nicht funktioniert, bedeutet daher, die Realität zu leugnen.
Ich glaube nicht, dass es sich bei dem Preis um einen reinen SB handelt, dessen Wesen sich nicht zumindest teilweise demontieren lässt. Wenn es reine SB ist, dann ist der ganze Thread ein Fehler.
Was hat der Gewinn mit der Vorverarbeitung von Daten für die weitere Klassifizierung zu tun?
Welchen Sinn hatten Ihre zahlreichen Gifs mit immer steiler werdenden Bilanzen? Vielleicht haben Sie die Antwort auf Ihre Frage einfach nicht verstanden?
Ich denke, wir sollten eine Maschinenkonferenz veranstalten. Sie müsste ein Buffet beinhalten und irgendwo in den Vereinigten Arabischen Emiraten stattfinden. Und dort in einer formellen und dann in einer informellen Atmosphäre alles besprechen. Ansonsten ist es unpraktisch, das über das Forum zu machen.
Die Idee, das Geld von Saber zu verwenden, um sich mit seinen Strategien vertraut zu machen, scheint großartig und gut durchdacht. Ich weiß gar nicht, was da schiefgehen könnte 🤔.
D.h., wenn Sie 10 Quanten/Segmente auswählen, dann trainieren Sie 10 Bäume mit Beispielen aus diesen Segmenten? Das scheint einfach zu sein.
Über die Stabilität bei OOS - das Experiment wird es zeigen. Meine Stabilität wird verletzt, wenn ich die Größe des Datenfensters ändere (2 Monate und 4) und wenn ich es sogar um 2% verschiebe (Training am Dienstag statt am Samstag). Die Bäume fallen unterschiedlich aus.
Ja, das ist alles so - man kann den Ansatz natürlich komplizierter machen, aber nur, wenn man es will.
Wenn ich mich richtig erinnere, trifft der Prädiktor im Baum gerade mal die Hälfte des Bereichs, ohne nach der besten Stelle für die Aufteilung zu suchen?
Was den Erfolg der Idee angeht - da stimme ich absolut zu, aber Wasser fließt auch nicht unter einem liegenden Stein.
Leider ist mir bei der Verarbeitung der Daten ein Fehler unterlaufen (ich habe das Skript für diese Tests schnell umgestaltet und dabei eine Nuance nicht berücksichtigt), so dass die Tabelle nun folgendermaßen aussieht
Die Schlussfolgerung ist, dass die Daten zufällig in die Bereiche der Quantentabellen fallen können und den verfügbaren Stabilitätstest bestehen. Es wurden Standardeinstellungen/Kriterien verwendet - jetzt werde ich versuchen, sie zu verschärfen und das Ergebnis zu sehen.
Ich habe jedoch schon früher geschrieben, dass nur etwa 30 % der Quanten-Cutoffs bei den beiden anderen Stichproben ihre Effizienz zeigen, so dass das Ergebnis im Allgemeinen zu erwarten war. Es war nur seine Seltsamkeit, die mich veranlasste, alles noch einmal zu überprüfen. Die Herausforderung besteht darin, wie man das Auswahlergebnis verbessern kann.
Der Zweck der Quantifizierung besteht jedoch darin, eine Gruppe mit einer Wahrscheinlichkeitsverschiebung auszuwählen. Es ist möglich, dass durch die Aufspaltung ein stabiles Blatt innerhalb der Gruppe gefunden wird, obwohl sich die Gruppe selbst bei neuen Daten zu einem anderen Ziel verschiebt.
In der Stichprobe, mit der ich das Experiment durchgeführt habe, gibt es im Durchschnitt ein Signal pro Tag, also sind die Balken weit auseinander.
Ich denke, es wäre interessanter, die Ergebnisse des Experiments zu betrachten, das ich oben vorgeschlagen habe - es sollte zeigen, wie oft zufällig generierte Zielantworten in die abgetasteten Quantensegmente fallen. Genau das werden die "Kisten" mit festen Abständen sein, wie Aleksey Nikolayev in seiner Abstraktion vorgeschlagen hat.
Sie können Ihre Probe schicken, ich werde Quantensegmente auswählen, und mit diesen Daten können Sie mit der Erstellung eines modifizierten Waldes experimentieren, oder ich kann Ihnen meine Probe geben.
Fourchette - klingt nicht schlecht, aber das Bedürfnis nach Gewalt - nun, ich habe nicht für mich bemerkt. Ich bin traurig, dass ich nicht verstanden werde, aber es ist nicht so starke Aggression an sich verursachen.
Ich wollte etwas über maschinelles Lernen lesen, und hier feilen die Humoristen an ihren Fähigkeiten.
Ich würde gerne Witze und andere Dinge, die nichts mit dem Thema zu tun haben, anderswo sehen.
Nun zum Thema.
Sie schreiben, dass Sie glauben, der Markt sei zufällig, worauf stützt sich diese Aussage?
Haben Sie irgendwelche soliden Gründe, um die Zufälligkeit der Marktpreisbewegung zu beweisen?