Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 2730

 
Aleksey Nikolayev #:

Hier geht es offenbar um multivariate Stichproben (jedes Element ist eine Zeile einer Tabelle, ein Vektor), während es bei den Homogenitätskriterien in Ihren drei Links um numerische Stichproben geht. Multivariate Homogenitätskriterien in Matstat sind ein eigenes Lied und für mich nicht ganz klar.

Jeder Prädiktor ist für sich genommen eine numerische Stichprobe, warum werden sie also nicht getrennt ausgewertet und die Ergebnisse gemittelt? Wenn es bei den meisten Prädiktoren eine Dynamik der Verschlechterung gibt, ist die Stichprobe überflüssig.

Aleksey Nikolayev #:

Es sieht aus wie die Aufgabe der Suche nach vielen Änderungspunkten Erkennung. Auch hier stellt sich heraus, dass wir mit einem multivariaten (Vektor-)Fall arbeiten müssen, was die Sache sehr verkompliziert.

Nun, und im Allgemeinen gefällt mir die Abhängigkeit von den für die Studie gewählten Attributen nicht. Wenn wir verschiedene Sätze von ihnen nehmen, können die Ergebnisse unterschiedlich ausfallen.

Vielleicht sollten wir die Varianten finden, die die besten Ergebnisse im Hinblick auf die Identifizierung der Zugehörigkeit von Segmenten zu einer bestimmten Gruppe und die Effizienz des Trainings auf einer gruppierten Population liefern.

 
Aleksey Vyazmikin #:

Man kann nur innerhalb einer Stichprobe mischen, wenn man zwei Stichproben mischt, leugnet man, dass sich der Markt verändert.

Können Sie die Logik nicht wieder erkennen?
Es ist sinnlos, Serien zu vergleichen, um die optimale Länge der Trainingsstichprobe zu bestimmen, denn der Markt ändert sich

Sie können die beiden Stichproben jederzeit mischen, es wird nichts ändern.
 
Maxim Dmitrievsky #:
Können Sie die Logik nicht noch einmal erkennen?
Es ist sinnlos, Serien zu vergleichen, um die optimale Länge der Trainingsstichprobe zu bestimmen, denn der Markt ändert sich

Sie können an jedem beliebigen Punkt mischen, es wird nichts ändern.

Wie können Sie beweisen, dass sich der Markt verändert? Wie lange dauert dieser Prozess? Oder ist er ständig im Wandel?

 
Aleksey Vyazmikin #:

Wie können Sie die Veränderlichkeit des Marktes nachweisen? Wie lange dauert dieser Prozess? Oder ist er ständig im Wandel?

Das war's, der herrliche Argumentator ist dran.
Zumindest Nicht-Stationarität. Ständig im Wandel, manchmal mit einer Rauchpause.
 
Maxim Dmitrievsky #:
Das war's, der herrliche Streithahn ist an.
Zumindest unruhig. Ständig wechselnd, manchmal für eine Rauchpause anhaltend.

Und wie groß sollte die Stichprobe sein, um Stationarität/Nicht-Stationarität zu bestimmen?

Ihrer Meinung nach lebt ein Muster nicht länger als die Lebensdauer der Stichprobenänderung, aber was ist, wenn ich in meiner Stichprobe ein Muster habe, das sich 8 Jahre lang wiederholt? Handelt es sich dann um eine Anomalie, oder ändern sich die Muster nicht alle, oder sind die in einem kleinen Bereich festgestellten Muster fehlerhaft und auf andere Faktoren zurückzuführen?

 
Aleksey Vyazmikin #:

Jeder einzelne Prädiktor ist eine numerische Stichprobe, warum sollte man sie also nicht einzeln schätzen und das Ergebnis mitteln?

Das funktioniert nur im Falle unabhängiger Merkmale, und da sie zum gleichen Preis gezählt werden, ist das nicht möglich. Im Falle von Abhängigkeiten ist alles viel komplizierter - nehmen wir als Beispiel Kopulas, wo univariate Verteilungen immer gleich sind, aber bivariate Verteilungen sehr unterschiedlich sein können.

Aleksey Vyazmikin #:

Vielleicht sollten wir die Varianten finden, die die besten Ergebnisse in Bezug auf die Identifizierung der Zugehörigkeit von Segmenten zu einer bestimmten Gruppe und die Effizienz des Trainings auf einer gruppierten Population liefern.

Wir werden (zu der bereits beträchtlichen Menge an Aufzählungen) die Aufzählung nach Merkmalstypen und wahrscheinlich auch nach Merkmalsparametern hinzufügen müssen.

Nichtsdestotrotz scheint mir, dass Ihr Ansatz einen rationalen Kern hat, über den man nachdenken kann.

 
Aleksey Vyazmikin #:

Habe ich nicht geschrieben, dass es darum geht, Stichproben (Training und Anwendung) zu vergleichen, dass, wenn Ihre Theorie richtig ist, die Stichprobe mit zunehmender Größe aufhört, ähnlich zu sein, und dass wir, um dies zu verstehen, Kriterien für die Bewertung ihrer Veränderung brauchen, die von den Methoden zur Bewertung der Ähnlichkeit abgeleitet sind?

Vielleicht sollten Sie anstelle von statistischen Kriterien für die Homogenität der Stichprobe einfach die Veränderung der Merkmalsbedeutung des Modells in der Dynamik (in einem gleitenden Fenster) beobachten.

Wenn es eine starke Diskrepanz zwischen dem aktuellen Zustand und dem vorherigen Zustand gibt, bedeutet das, dass wir uns bereits in einer anderen Stichprobe befinden.....

Vorteile:
1. man muss keine stat. Tests programmieren, alles ist sofort einsatzbereit.
2. Es berücksichtigt nicht nur die zeitliche Veränderung der Stichprobe, sondern auch die Veränderung der Zielstichprobe, was meiner Meinung nach nicht weniger wichtig ist.

 
Aleksey Vyazmikin #:

Und wie groß sollte die Stichprobe sein, um Stationarität/Nicht-Stationarität zu bestimmen?

Ihnen zufolge lebt ein Muster nicht länger als die Lebensdauer einer Stichprobenänderung, aber was ist, wenn ich ein Muster in meiner Stichprobe habe, das sich 8 Jahre lang wiederholt? Handelt es sich dabei um eine Anomalie, oder ändern sich die Muster nicht alle, oder sind die in einem kleinen Bereich festgestellten Muster falsch und auf andere Faktoren zurückzuführen?

Ich würde sagen, nicht mehr als die Lebensdauer eines bestimmten Trends auf einer willkürlichen Zeitskala.
Aber das ist eine ungenaue Beschreibung.

Vom Punkt zum Bifurkationspunkt.
 

Unterschiedliche Modelle, aber ähnlich, unterschiedlich und nicht ähnlich, wie unterscheiden sie sich? Der Bifurkationspunkt führt nicht unbedingt zu einer Änderung des Modells, es ist möglich, die gleichen Bereiche visuell manuell zu markieren, aber es gibt keinen prädiktiven Teil am Ende, das Ziel ist es, die minimale Länge der Probe zu finden, die den Zustand oder die Einhaltung des Modells bestätigt.

Komplexität des Modells, hier gibt es natürlich auch einen Widerspruch, ein einfaches Modell wird keinen ausreichend langen Abschnitt beschreiben, sondern wird sich wiederholen, ein komplexes Modell kann einen ausreichend langen Abschnitt beschreiben, kann aber einzigartig sein. Wie immer wird etwas in der Mitte benötigt))))))

 
Valeriy Yastremskiy die minimale Stichprobenlänge zu finden, die den Zustand oder die Modellanpassung bestätigt.

Komplexität des Modells, hier gibt es natürlich auch einen Widerspruch, ein einfaches Modell wird keinen hinreichend langen Abschnitt beschreiben, sondern wird sich wiederholen, ein komplexes Modell kann einen hinreichend langen Abschnitt beschreiben, kann aber einzigartig sein. Wie immer wird etwas in der Mitte benötigt))))))

Im Allgemeinen unterscheiden sich die verschiedenen Modelle in ihrer Umsetzung der Zufälligkeit und sind aus dem gleichen Grund ähnlich

Vor allem, wenn Dutzende und Hunderte von Merkmalen verwendet werden. Einige von ihnen funktionieren in der Vorwärtsrichtung, andere nicht. Aber es gibt keine Möglichkeit, sie auszuwählen.

Nur mit Hilfe einer guten Mondscheinanlage, wie oben vorgeschlagen.
Grund der Beschwerde: