Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2727

 
Aleksey Nikolayev #:

Ihre Annahmen scheinen zu stark zu sein. In dem Sinne, dass es praktisch ein Gral wäre, wenn es möglich wäre, sie umzusetzen. Ich würde gerne ein bescheideneres und spezifischeres Problem lösen - einen allgemeinen Weg finden, um einen Kompromiss zwischen ausreichender Länge der Trayne und dem Fehlen veralteter Beispiele darin zu finden.

Meiner Meinung nach ist diese Frage von grundlegender Bedeutung für die Anwendung von MO und Matstat in unserem Bereich.

Haben Sie es nicht experimentell versucht? Nach Ihrem theoretischen Ansatz zu dieser Frage werden die Muster in der Stichprobe nach einer kritischen Vergrößerung der Stichprobe alt sein und nicht mehr funktionieren, was bedeutet, dass sich das Lernen in einem qualitativen Sinne verschlechtern sollte und die Ergebnisse bei neuen Daten schlechter sein werden, wenn die Stichprobe vergrößert wird.

 
Aleksey Nikolayev #:

Wir erhalten eine A-posteriori-Analyse eines bereits trainierten Modells. Ich möchte sie durch eine A-priori-Analyse für die Phase der Auswahl der Trainingsstichprobe ergänzen.

Das denke ich auch. Der Einfachheit halber habe ich mich für die zuletzt gebildete Spitze des Zickzacks entschieden, aber ich hätte gerne etwas Ausgefeilteres.

Ich fange an, nur funktionierende Teile aus den neuen Daten herauszuziehen und wende einen Filter in Form eines zweiten Modells an, das sowohl auf alten als auch auf neuen Daten funktioniert, und dann überprüfe ich es auf anderen neuen Daten, wie im Artikel beschrieben.

Das ist auch eine Art von Anpassung, aber auf der Grundlage von Modellfehlern. Als ob wir zumindest die Varianten auswählen, die es gut klassifizieren kann, so dass etwas anderes als Zufall in ihnen steckt (zumindest beim Training und bei der Validierung und einigen anderen Validierungen).

Wenn man a priori etwas festlegt, ist es wahrscheinlich sinnvoll, eine Langzeitbeobachtung zu machen, die zumindest eine adäquate Markierung ergibt. Nehmen Sie die Zeichen auf.


Ich habe mir einen neuen Spammer mit Merkmalen und Zielen ausgedacht (er scheint informativ zu sein, und das ist er auch, verglichen mit den üblichen Stichproben). Aber es gibt ein paar Varianten, ich habe sie noch nicht getestet.

 
Aleksey Vyazmikin #:

Haben Sie es nicht experimentell versucht? Denn Ihrem theoretischen Ansatz in dieser Frage zufolge werden die Muster in der Stichprobe nach einer kritischen Vergrößerung der Stichprobe alt und nicht mehr funktionstüchtig sein, so dass sich das Lernen in einem qualitativen Sinne verschlechtern sollte und die Ergebnisse bei neuen Daten schlechter werden, wenn die Stichprobe vergrößert wird.

Wahrscheinlich ist Ihnen klar, dass es eine gewaltige Rechenaufgabe ist, eine große Anzahl von Varianten für eine große Anzahl von Zeitpunkten zu trainieren, und zwar über die gesamte Dauer der Geschichte. Selbst wenn es Ihnen wie durch ein Wunder gelingen sollte, all diese Statistiken zu sammeln, stellt sich die Frage nach einer sinnvollen Systematisierung dieses Informationshaufens. Sicherlich wird sich für jeden Zeitpunkt eine andere Länge der Geschichte als optimal erweisen. Und wie soll man das interpretieren und vor allem, wie soll man das in die Zukunft extrapolieren?

Ich würde gerne den umgekehrten Weg gehen und einige Heuristiken entwickeln, um die Anzahl der Varianten für die Länge der Trainingshistorie drastisch zu reduzieren (buchstäblich bis auf einige wenige Varianten).

 
Maxim Dmitrievsky #:

Ich fange damit an, nur funktionierende Teile aus neuen Daten zu ziehen und wende den Filter als zweites Modell an, um sowohl mit alten als auch mit neuen Daten zu arbeiten, dann überprüfe ich ihn an anderen neuen Daten wie im Artikel.

Das ist auch eine Art von Anpassung, aber auf der Grundlage von Modellfehlern. Als ob wir zumindest die Varianten auswählen, die es gut klassifizieren kann, so dass etwas anderes als der Zufall in ihnen steckt (zumindest bei Training und Validierung und einigen anderen Validierungen).

Wenn man a priori etwas festlegt, ist es wahrscheinlich sinnvoll, eine Langzeitbeobachtung zu machen, die zumindest eine adäquate Markierung ergibt. Nehmen Sie die Zeichen auf.


Ich habe mir einen neuen Spammer mit Merkmalen und Zielen ausgedacht (er scheint informativ zu sein, und so ist er auch im Vergleich zu den üblichen Stichproben). Aber es gibt ein paar Varianten, ich habe sie noch nicht getestet.

Ich werde darüber nachdenken müssen. Ich verstehe nicht wirklich, wie ich es in meine eigenen Ideen und Konzepte umsetzen kann.

 
Aleksey Nikolayev #:

Ich muss darüber nachdenken. Ich verstehe nicht wirklich, wie ich es in die Sprache meiner Wahrnehmungen und Konzepte übersetzen kann.

Außerdem verringert der Wechsel von Ticks zu Balken die Vorhersagekraft erheblich.

aber beseitigt potenzielle Konflikte mit dem dts.)

 
Maxim Dmitrievsky #:

Auch der Wechsel von Ticks zu Balken verringert die Vorhersagekraft erheblich.

beseitigt aber mögliche Konflikte mit dts :)

Nebenbei bemerkt ist dies auch eine wichtige praktische und interessante theoretische Frage. Man kann sie als Abhängigkeit der realen Geld-Brief-Spanne vom Volumen (Liquidität, Volatilität) formulieren, die entsprechende Regression berechnen, Devisen mit Börseninstrumenten vergleichen usw. Eine andere Sache ist, dass sie nur für diejenigen interessant ist, deren TSs große Volumina handeln)

 
Aleksey Nikolayev #:

Wahrscheinlich ist Ihnen klar, dass es eine gewaltige Rechenaufgabe ist, eine große Anzahl von Varianten für eine große Anzahl von Zeitpunkten für die Länge der Geschichte zu trainieren. Selbst wenn es Ihnen wie durch ein Wunder gelingen sollte, all diese Statistiken zu sammeln, stellt sich die Frage nach einer sinnvollen Systematisierung dieses Informationshaufens. Sicherlich wird sich für jeden Zeitpunkt eine andere Länge der Geschichte als optimal erweisen. Und wie kann man sie interpretieren und vor allem in die Zukunft extrapolieren?

Ich würde gerne den umgekehrten Weg gehen und einige Heuristiken entwickeln, um die Anzahl der Varianten für die Länge der Trainingsgeschichte drastisch zu reduzieren (buchstäblich auf einige wenige Varianten).

Das Problem mit dem Experiment ist lösbar, ich habe etwas Ähnliches gemacht.

Damals kam ich auf die Idee, dass ich mich mit Methoden zur Schätzung der Vergleichbarkeit der Stichprobe beschäftigen sollte. Aber ich konnte es nicht umsetzen - ich habe die Formel nicht verstanden.

 
Aleksey Vyazmikin #:

Das Problem mit dem Experiment ist lösbar, ich habe etwas Ähnliches gemacht.

Wahrscheinlich ist es technisch durchaus lösbar. Die Frage ist nur, wie man die Ergebnisse eines solchen Experiments interpretiert.

Aleksey Vyazmikin #:

Ich kam damals auf die Idee, dass wir uns mit Methoden zur Bewertung der Vergleichbarkeit einer Stichprobe befassen sollten. Aber ich konnte es nicht realisieren - ich habe die Formel nicht verstanden.

Matstat hat eine Menge Tests, um z. B. die Homogenität von Stichproben zu überprüfen. Natürlich nur, wenn ich Ihre Terminologie richtig verstehe.

 
Aleksey Nikolayev #:

Übrigens ist dies auch eine wichtige praktische und interessante theoretische Frage. Man kann sie als Abhängigkeit der realen Geld-Brief-Spanne vom Volumen (Liquidität, Volatilität) formulieren, die entsprechende Regression berechnen, Devisen mit Börseninstrumenten vergleichen usw. Eine andere Sache ist, dass es nur für diejenigen interessant ist, deren TS große Volumina handeln).

Es ist ein solches Durcheinander, dass nichts klar ist. Woher bekommen sie diese Kurse mit Volumina, welche Anbieter gibt es, ob es sie überhaupt gibt und so weiter. Am Ende, selbst wenn sie Erfolg haben, werden sie so ein giftiges Zeug wie alle anderen nach ähnlichen Prinzipien verbieten. Oder mit einem Hut zu verschiedenen Orten laufen und sammeln, was vor dem magischen Pendel hineinfällt

Willkommen TS von einer Stunde Transaktionslänge, ist es möglich, auf mehreren Instrumenten, scheinen sie niemand besonders belasten in Bezug auf die Toxizität, aber es ist schwierig, eine solche schwierig zu machen, wahrscheinlich, weil sie nicht belasten.
 
Maxim Dmitrievsky #:
Das ist ein solches Durcheinander, dass es unverständlich ist. Woher sie diese Mengenangaben nehmen, welche Lieferanten sie benutzen, ob es sie überhaupt gibt, und so weiter und so fort. Am Ende, selbst wenn es klappt, werden sie so einen giftigen TS wie alle anderen nach ähnlichen Prinzipien verbieten

Ich glaube, fxsaber schrieb, dass die Probleme mit einigen großen Umsätzen beginnen. Vielleicht sind eure TSs Opfer einer zu großen Beliebtheit bei den Kopisten geworden)