Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1188

 
Dmitrij Skub:
Juri, Sie sind einfach vom Thema abgekommen - das Schlüsselwort ist Gabel. Es hat nichts mit MO zu tun)

Nicht mehr auf dem Laufenden, so viel steht fest. Aber es ist ein interessantes Thema. Zusammenfassung.

 
Yuriy Asaulenko:

Die Automatisierung ist dort nicht so einfach, imho. Soweit ich weiß, ist es schwierig, typische Lösungen zu finden - es gibt zu viele mögliche Lösungen.

Das Einzige, was mir dazu einfällt, ist eine DB über Mannschaften und Spieler, von denen es Hunderte gibt.)

Verschiedene Buchmacher eine Mannschaft kann anders genannt werden: Olympique, Marseille + in Latein, mindestens 4 Varianten. Verschiedene Präfixe FK - Fußballverein, PFC - Profifußballverein.

Die Automatisierung der Gabeln ist eine lästige Angelegenheit.

 

das ist ein bisschen zu einfach.

Eigentlich geht es bei RL nicht einmal um die Pakete, sondern um die Annäherung, d. h. um die Überschreitung. Wird anstelle von Genetik verwendet, aber durch einen NS-Approximator

die Hauptschwierigkeit besteht darin, aus den richtigen Verteilungen zu wählen

 
Maxim Dmitrievsky:

es ist zu einfach.

Eigentlich geht es bei RL nicht einmal um die Pakete, sondern um die Annäherung, d. h. um das Überschießen. Wird anstelle von Genetik verwendet, aber durch einen NS-Approximator

die Hauptschwierigkeit besteht darin, aus den richtigen Verteilungen zu wählen

Nun, das einfache Beispiel ist irgendwie normal, weil das Beispiel nicht kompliziert sein muss, und die Tatsache, dass es bereits fertige Pakete gibt, ist gut.... Ich verstehe nicht einmal dieses einfache Beispiel (( Ich verstehe nicht, warum Matrizen mit Wahrscheinlichkeiten gefüllt werden sollten und warum diese Wahrscheinlichkeiten benötigt werden und wie sie berechnet werden

 
mytarmailS:

Nun, das einfache Beispiel ist irgendwie normal, denn das Beispiel sollte nicht kompliziert sein, und die Tatsache, dass es bereits fertige Pakete gibt, ist gut.... Ich verstehe nicht einmal dieses einfache Beispiel (( Ich verstehe nicht, warum Matrizen mit Wahrscheinlichkeiten gefüllt werden sollten und warum diese Wahrscheinlichkeiten überhaupt benötigt werden und wie sie berechnet werden

Wahrscheinlichkeiten von Zustandsübergängen, Markov-Ketten

wie die Wahrscheinlichkeit eines Kaufs unter bestimmten Bedingungen oder eines Verkaufs

die Matrix wird mit allen möglichen Zuständen gefüllt, dann wird der aktuelle Zustand daraus ausgewählt und das Signal betrachtet... es ist ein Tabellenprimitiv :)

 
Maxim Dmitrievsky:

Wahrscheinlichkeiten von Zustandsübergängen, Markov-Ketten

Nun, ich habe das....

Ich verstehe ihre Rolle im Kodex nicht

 
mytarmailS:

Ich habe das....

Ich verstehe ihre Rolle im Kodex nicht.

Was meinen Sie mit Rollen? Es ist eine Tabelle mit Zustandsübergängen und Wahrscheinlichkeiten

 
Maxim Dmitrievsky:

Es handelt sich um eine Tabelle mit Zustandsübergängen und Wahrscheinlichkeiten.

Ich weiß nicht, woher die Übergangswahrscheinlichkeiten kommen, wir haben 4 Richtungen - links, rechts, oben, unten. Der Algorithmus muss den Weg "irgendwo" durch die richtige Kombination von Richtungen finden. Noch bevor der Algorithmus mit der Suche nach der richtigen Kombination von Wahrscheinlichkeiten begann, wurde eine Matrix mit Übergangswahrscheinlichkeiten erstellt, woher kamen diese Wahrscheinlichkeiten?

Ich bin wahrscheinlich sehr dumm, aber trotzdem, wenn ich fragen darf, warum erklären Sie es nicht?

 
mytarmailS:

Ich verstehe nicht, woher die Übergangswahrscheinlichkeiten kommen, wir haben 4 Richtungen - links, rechts, oben, unten. Der Algorithmus muss den Weg "irgendwohin" durch eine korrekte Kombination von Richtungen finden. Noch bevor der Algorithmus mit der Suche nach der richtigen Kombination von Wahrscheinlichkeiten begann, wurde eine Matrix mit Übergangswahrscheinlichkeiten erstellt, woher kamen diese Wahrscheinlichkeiten?

Wahrscheinlich bin ich einfach nur ein Dummkopf, aber trotzdem, wenn es Ihnen nichts ausmacht, das zu erklären.

Lesen Sie die Grundlagen, nicht bei R, nur im Internet.

Am Anfang werden die Wahrscheinlichkeiten zufällig gewählt, dann werden sie während der Iterationen durch verschiedene Methoden aktualisiert, hauptsächlich durch die TD-Methode. Am Ende konvergieren sie zu einem Optimum, d.h. sie lösen das ursprüngliche Problem, z.B. auf dem schnellsten Weg aus der Wohnung zu kommen, in der es mehrere Räume gibt, ohne in andere Räume zu gehen. Dazu werden eine Matrix von Zuständen (Wertmatrix) und eine Matrix von Übergängen (Policy-Matrix) festgelegt, d.h. für jeden Zustand (Aufenthalt in einem bestimmten Raum) kann es mehrere Übergänge zu anderen Räumen und deren Wahrscheinlichkeiten geben. Nach jeder Aktion wird eine numerische Belohnung (gut-schlecht) zurückgegeben. Der Kern der Methode ist die Maximierung der Belohnung, d.h. ein Agent wird für falsche Übergänge bestraft und für richtige belohnt

 
Maxim Dmitrievsky:

Ich habe in diesem Thread nichts über Informationskriterien(Bayes oder Akaike) gelesen. Vielleicht werden sie standardmäßig verwendet (in den verwendeten MoD-Paketen)?