Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2569

 
mytarmailS #:
Wer weiß, ob es einen Test für Trenddeterminismus gibt...
Sie müssen wissen, ob dies wirklich ein Trend oder eine zufällige Fluktuation ist...

Vielleicht derselbe Hearst?


Tests für verschiedene Arten von Trends, die sofort einsatzbereit sind

R best!!!!

Es gibt ein gutes Trendpaket in R. Für einen linearen Trend ist sens.slope() von dort aus gut geeignet.

 
mytarmailS #:

Was gibt es über Finanzmathematik und IR zu verstehen, Sie müssen die Mechanismen des Marktes und seiner Akteure kennen

Die Masse wird in den meisten Fällen verlieren, weil ihr Gegenspieler ein "großer Spieler" ist.

1) Sie müssen ein Ungleichgewicht zwischen Einzelhandelskäufern und -verkäufern feststellen: Wenn es viele Verkäufer gibt, dann ist der "große Spieler" (der Käufer) auf der anderen Seite des Geschäfts

Wie jetzt zum Beispiel beim Juden, viele Verkäufer

2) Es gibt auch den Handel im Moment gegen die Masse, das ist ein Market Maker

Es ist immer zu beobachten, dass sich der Preis gegen die Menge bewegt (inverse Korrelation).

Solange die Masse kauft und an das Wachstum glaubt, wird der Preis fallen und umgekehrt...

Das ist der ganze Markt...


p.s. Und ich werde mir das Video auf jeden Fall ansehen.

Auch hier gibt es Probleme, und zwar nicht wenige. Wir haben nur einen kleinen Ausschnitt des Marktes zur Verfügung, von dem nicht bekannt ist, wie repräsentativ und zuverlässig er ist. Das zweite Bild (allgemeine Stimmung) ist völlig nutzlos. Erstens kommt es regelmäßig zu Umkehrungen an Extremwerten, an denen sich der Trend "gegen die Masse" hätte fortsetzen müssen. Zweitens wiederholt die Sanktion einfach den Preis (auf den Kopf gestellt und abzüglich des Trends) - drehen Sie einen beliebigen Oszillator um, und Sie erhalten ein sehr ähnliches Bild. Nun, wenn der Indikator den Preis wiederholt, bedeutet das, dass seine Vorhersage nicht einfacher ist als das Preisdiagramm selbst, richtig? Das erste Bild (das Glas und die offenen Positionen) und der Wert der Gewinnquote sind wertvoller, aber es ist auch so... höchst fragwürdig.


 
Aleksey Nikolayev #:

Es macht keinen großen Unterschied (aus kombinatorischer Sicht), wie genau es kodiert ist. Der Punkt ist derselbe - jede Linie hat als Merkmal, welche Regeln durchgesetzt werden und welche nicht. Es sind immer 2^N Varianten, wobei N die Anzahl der Regeln ist. Danach wird jede dieser Regeln in die endgültige Menge von 2^(2^N) Varianten aufgenommen. Es ist klar, dass es unmöglich ist, eine so große Anzahl von Varianten nur formal auszuprobieren. Deshalb ist es sinnvoll, sie sinnvoll zu ordnen. Wir nehmen zum Beispiel zuerst alle Varianten, die durch nur eine Regel beschrieben werden, dann alle Varianten, die durch nur zwei Regeln beschrieben werden, und so weiter. Oder so ähnlich.

Vielleicht erkläre ich es nicht gut, aber ich möchte noch einmal betonen, dass wir mit einer ersten Stichprobe arbeiten, die im Rahmen des CatBoost-Lernalgorithmus einmal quantisiert wird, d.h. Nehmen wir an, wir haben 1000 Prädiktoren, die wir jeweils in 10 Segmente quantisiert haben, als Ergebnis haben wir 10000 Segmente - weiter zieht der CatBoost-Algorithmus nach dem Zufallsprinzip Prädiktoren und führt durch die Kanten/Quanten einen Split/Split durch, um ein Quantum auszuwählen, das in der Mitte liegt, muss er 3 Ungleichungen bilden oder 8 Blätter erstellen, wobei 7 Blätter Müll und ein Blatt wertvolle Informationen enthalten. Ob der Algorithmus einen solchen Baum aufbauen wird, ist ebenfalls nicht sicher, da es eine Liebe zum Zufall gibt und ein Nachbarquant in ein Blatt gelangen kann. Und es soll nur ein Baum sein. Bei meiner Methode reicht eine Ungleichheit aus - 2 Blätter. Selbst wenn alle Prädiktoren verwendet werden und jeder ein nützliches Blatt hat, wird die Anzahl der Kombinationen bei der Erstellung des Modells viel geringer sein. Wichtig ist aber auch, dass es weniger Rauschen gibt, da nicht so viele fehlerhafte Probenpartitionen zu stabilisieren sind, die einen neuen Baum bilden müssen (Boosting-Prinzip).

Aleksey Nikolayev # :

Früher oder später werden viele andere Spieler sie zum Beispiel finden.

Vielleicht sollte man diese Theorie dann irgendwie testen? Demnach gibt es eine Mindesthäufigkeit des Wiederauftretens eines Vorteils, nach deren Erhöhung er eher verschwindet, als dass er weiter besteht?

Zum Beispiel messen wir jedes halbe Jahr, es gibt einen Vorteil von 1,5 Jahren - wir denken, dass ein halbes Jahr funktionieren wird, und wenn es schon 2,5 Jahre sind, hat es keinen Sinn, es zu nehmen - die Wahrscheinlichkeit ist größer, dass es aufhört zu funktionieren.

Ich bin nicht gut in wissenschaftlichen Formeln. Können Sie mir sagen, wie ich diese Berechnung durchführen und die Hypothese überprüfen kann?

 
Aleksey Nikolayev #:

Es gibt ein schönes Trend-Paket in R. Für einen linearen Trend ist sens.slope() von dort aus gut geeignet.

danke

vladavd #:

Auch hier gibt es Probleme, und zwar eine ganze Reihe. Wir haben nur einen kleinen Ausschnitt des Marktes zur Verfügung, von dem wir nicht wissen, wie aussagekräftig und zuverlässig er ist. Das zweite Bild (allgemeine Stimmung) ist überhaupt nicht nützlich. Erstens kommt es regelmäßig zu Umkehrungen an Extremwerten, an denen sich der Trend "gegen die Masse" hätte fortsetzen müssen. Zweitens wiederholt die Sanktion einfach den Preis (auf dem Kopf stehend und abzüglich des Trends) - drehen Sie einen beliebigen Oszillator um, und Sie erhalten ein sehr ähnliches Bild. Nun, wenn der Indikator den Preis wiederholt, bedeutet das, dass seine Vorhersage nicht einfacher ist als das Preisdiagramm selbst, richtig? Das erste Bild (das Glas und die offenen Positionen) und der Wert der Gewinnquote sind wertvoller, aber es ist auch so... höchst fragwürdig.

Du verlierst dich in vielen Dingen, du bist zu oberflächlich und nimmst die Informationen unreflektiert wahr.

 
Aleksey Vyazmikin #:

Vielleicht erkläre ich es nicht gut, aber ich möchte noch einmal betonen, dass wir mit dem ursprünglichen Sample arbeiten, das im Rahmen des CatBoost-Lernalgorithmus einmal quantisiert wird, d.h. Nehmen wir an, wir haben 1000 Prädiktoren, die wir jeweils in 10 Segmente quantisiert haben, als Ergebnis haben wir 10000 Segmente - weiter zieht der CatBoost-Algorithmus nach dem Zufallsprinzip Prädiktoren und führt durch die Kanten/Quanten einen Split/Split durch, um ein Quantum auszuwählen, das in der Mitte liegt, muss er 3 Ungleichungen bilden oder 8 Blätter erstellen, wobei 7 Blätter Müll und ein Blatt wertvolle Informationen enthalten. Ob der Algorithmus einen solchen Baum aufbauen wird, ist ebenfalls nicht sicher, da es eine Liebe zum Zufall gibt und ein Nachbarquant in ein Blatt gelangen kann. Und es soll nur ein Baum sein. Bei meiner Methode reicht eine Ungleichheit aus - 2 Blätter. Selbst wenn alle Prädiktoren verwendet werden und jeder ein nützliches Blatt hat, wird die Anzahl der Kombinationen bei der Erstellung des Modells viel geringer sein. Wichtig ist aber auch, dass es weniger Rauschen gibt, da nicht so viele fehlerhafte Probenpartitionen zu stabilisieren sind, für die ein neuer Baum erstellt werden muss (Boosting-Prinzip).

Vielleicht sollten Sie Ihren Ansatz anhand eines Beispiels für einen einzelnen Entscheidungsbaum beschreiben. Dennoch baut das Boosten an sich schon eine recht komplexe Struktur auf - eine Veredelungsbaumfolge. Und Siemachen noch etwas anderes damit).

Aleksey Vyazmikin #:

Vielleicht müssen Sie diese Theorie dann irgendwie überprüfen? Gibt es demnach eine Mindesthäufigkeit des Wiederauftretens des Vorteils, nach deren Erhöhung die Wahrscheinlichkeit seines Verschwindens größer ist als die des Fortbestehens?

Wenn wir zum Beispiel jedes halbe Jahr messen, haben wir einen Vorteil von 1,5 Jahren - wir gehen davon aus, dass ein halbes Jahr noch funktioniert, und wenn es schon 2,5 Jahre sind, macht es keinen Sinn, es zu nehmen - die Wahrscheinlichkeit ist höher, dass es nicht mehr funktioniert.

Ich kenne mich mit wissenschaftlichen Formeln nicht aus. Können Sie mir sagen, wie ich eine solche Berechnung durchführen und die Hypothese überprüfen kann?

So etwas wie die Formel für Radioaktivität mit Halbwertszeit) Ich glaube nicht, dass die menschliche Aktivität durch solch einfache Formeln beschrieben wird) Ihre "Häufigkeit des Vorteils" wird sich ändern, höchstwahrscheinlich auf eine sehr unvorhersehbare Weise.

 
Aleksey Nikolayev #:

Vielleicht hätten Sie Ihren Ansatz anhand eines einzelnen Entscheidungsbaums als Beispiel erläutern sollen. Das Boosten selbst baut jedoch bereits eine recht komplexe Struktur auf - eine sich verfeinernde Folge von Bäumen. Und Siemachen noch etwas anderes damit).

Ja, ich verstehe, dass es nicht leicht ist, die Methode sofort zu verstehen. Ich habe vor, sie ausführlicher zu beschreiben. Und die Daten werden verarbeitet, bevor sie an CatBoost weitergeleitet werden, aber ich möchte meinen eigenen Algorithmus entwickeln, der die sich ändernde Dynamik des "Zerfalls", wie Sie es nannten, beim Aufteilen berücksichtigt.

Aleksey Nikolayev #:

Ich glaube nicht, dass die menschliche Aktivität durch eine solch einfache Formel beschrieben wird. Ihre "Häufigkeit des Vorteils" wird sich wahrscheinlich auf höchst unvorhersehbare Weise ändern.

Vielleicht gibt es nichts, aber wie kann man das überprüfen?

 
mytarmailS #:

danke

Du verlierst dich in vielen Dingen, bist zu oberflächlich und unreflektiert, um diese Informationen zu verarbeiten.

Ja, ich arbeite schon seit Jahren mit diesem Tool und habe noch nie wirklich darüber nachgedacht.

Womit genau sind Sie nicht einverstanden?

 
Aleksey Vyazmikin #:

Ja, sagen wir es so.

Nein, jetzt nehmen wir die Ausführung der Ungleichheitsregel als eine und betrachten den Durchschnittswert des Ziels (sagen wir für die binäre Klassifizierung), wenn die Regel durch die Stichprobe ausgelöst wird, wenn der anfängliche Durchschnittswert in der Stichprobe, sagen wir, 0,45 ist und nach der Auswertung nur durch Antworten 0,51 ist, dann betrachten wir, dass der Prädiktor (sein Plot/Quantum) eine Vorhersagekraft von 0,06 hat, d.h. 6%.

Wir sammeln eine Menge solcher Prädiktoren mit Abschnitten, die bereits unabhängige binäre Prädiktoren sind, und verwenden sie zur Erstellung eines Modells.

Die Kombination all dieser Quanten mit allen (mit oder ohne Vorhersagekraft) ist in der Tat keine schnelle Aufgabe, aber sie ist vielleicht nicht unvernünftig, wenn sie mit einem Basisprädiktor durchgeführt wird, auf dem ein Quant mit Vorhersagekraft identifiziert wird.

Aber selbst in der Theorie wäre diese Umschulung geringer, da es weniger mögliche Kombinationen gibt als in der gesamten Stichprobe.

Es bleibt zu klären, warum solche Quantenmuster 7 Jahre lang funktionieren können und dann plötzlich aufhören...

Verstehe ich richtig, was Sie tun?:


1) Wir bekommen 1 Baum.
2) Jeder Knoten kann bis zu 10 Verzweigungen geben (im Bild haben wir weniger gefunden, sagen wir 10 Verzweigungen), jede Verzweigung wird durch 1 Quantum erzeugt (ein Quantum ist ein Stück Prädiktor in 10%: entweder Perzentil oder 10% in Amplitude, hängt davon ab, welche Quantisierungsmethode verwendet wurde).
3) nach dem ersten Split finden wir 3 Quanten, die anschließend zu einem erfolgreichen Blatt führen
4) nachfolgende Splits finden weitere gute Splits/Quanten, die zu erfolgreichen Blättern führen
5) wir merken uns erfolgreiche Quanten vor erfolgreichen Blättern
6) erstellen einen neuen Baum, der als Prädiktoren nur die von uns ausgewählten Quanten verwendet

Mit der gleichen Methode, mit der wir den ersten Baum quantifiziert haben, quantifizieren wir die Prädiktoren mit unserem Skript. Wir erhalten 1000 Prädiktoren aus 100, die bereits binär 0 oder 1 sind. Wenn der Wert des Prädiktors in diesem Bereich liegt, ist er = 1, wenn nicht, ist er = 0.
Da wir nur erfolgreiche Pfade/Quants auswählen, sind alle Werte der ausgewählten Quants = 1. Sind alle Prädiktoren = 1, so kann der neue Baum nicht lernen. Die Antwort ist bereits bekannt.

Oder ist es nicht mehr nötig, einen neuen Baum zu bauen? Wenn der Wert des Prädiktors innerhalb des gewählten Quantums liegt, werden wir das sofort tun?

 
vladavd #:

Ja, ich arbeite schon seit Jahren mit diesem Werkzeug, deshalb habe ich mir darüber noch keine Gedanken gemacht.

Womit genau sind Sie nicht einverstanden?

Mit welchem Werkzeug genau?

 
mytarmailS #:

mit welcher Art von Werkzeug?

Nun, was ist auf dem Bild zu sehen? Das Glas und die Sanktion.

Grund der Beschwerde: