Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading

Yuri Evseenkov 2016.08.12 08:34 #991

Mihail Marchukajtes:
Sie haben völlig Recht mit dem Anfang. Endlich tauchten einige vernünftige Leute in der Branche auf. Aber das Muster selbst hat eine prädiktive Funktion, und es ist nicht das Muster selbst, das zählt, sondern die Reaktion des Marktes auf dieses Muster. Und wenn diese Reaktion mit der im Training identisch ist, wird das Netz die richtige Schlussfolgerung ziehen. Es ist also so....

Was ist zu tun? Versuchen Sie, den naiven Bayes-Klassifikator zu verwenden oder die j-Prädiktoren zu untersuchen?

Mihail Marchukajtes 2016.08.12 09:12 #992

Juri Evseenkov:
Was ist zu tun? Versuchen Sie, den naiven Besovian-Klassifikator zu verwenden, oder untersuchen Sie gPredictors?

xWas ist der Besovsche Klassifikator???? Ich verstehe es nicht, jetzt hat Reshetov eine furchtbar coole Sache gemacht, an, aus, Teig. Und du spielst immer noch mit deinen R's herum. Eine Menge unnötiger Datenmanipulationen. Und was ist das Iris-Beispiel???? Interessant zu sehen, wie der Predictor das herausfinden wird....

FOREX - Trends, Prognosen _Marktbeschreibung Fragen von Anfängern MQL4

Yuri Evseenkov 2016.08.12 09:26 #993

Mihail Marchukajtes:
xWas ist der Besov-Klassifikator???? Ich verstehe es nicht, jetzt hat Reshetov eine furchtbar coole Sache gemacht, an, aus, Teig. Und Sie fummeln weiter an Ihren R's herum. Eine Menge unnötiger Datenmanipulationen. Und was ist das Iris-Beispiel???? Interessant zu sehen, wie der Predictor das herausfinden wird....

Ja, ich habe erst hier von R erfahren. Und in dem Wort Bayes'scher Klassifikator wurde versehentlich ein Buchstabe übersehen (vielleicht von Freud). Und dass Reshetovs Programm cool ist, bestreite ich nicht. Ich weiß nicht, wie es mit Iris aussieht.

EURUSD - Trends, Prognosen Eine Frage an die Alert: MT4 Terminal dupliziert

Mihail Marchukajtes 2016.08.12 09:36 #994

Juri Evseenkov:
Ich habe erst hier von R erfahren. Und ich habe versehentlich einen Buchstaben in dem Wort Bayes'scher Klassifikator übersehen (vielleicht von Freud). Und Reshetovs Programm ist cool, das bestreite ich nicht. Ich weiß nicht, wie es mit Iris aussieht.

Die Maschine von IShaitan Reshetov :-)

mytarmailS 2016.08.12 09:52 #995

Mihail Marchukajtes:
xWas ist der Besov-Klassifikator???? Ich verstehe nicht, jetzt hat Reshetov eine furchtbar coole Sache gemacht, an, aus, Teig. Und Sie fummeln weiter an Ihren R's herum. Eine Menge unnötiger Datenmanipulationen. Und was ist das Iris-Beispiel???? Interessant zu sehen, wie der Predictor das herausfinden wird....

Kann ich das Handelsergebnis von gestern sehen?

Yuri Evseenkov 2016.08.12 09:56 #996

Mihail Marchukajtes:
Das Auto von IShaitan Reshetov :-)

Sollen wir die Beiträge löschen, die mit meinem Tippfehler beginnen?

mytarmailS 2016.08.12 09:56 #997

mytarmailS:

Warum haben die Indikatoren nie funktioniert und werden auch nie funktionieren, meine Meinung...

hat irgendjemand irgendetwas ausprobiert? ist ihm etwas eingefallen? oder war nicht einmal klar, worum es ging?

Alexey Burnakov 2016.08.12 10:08 #998

2 Dr.Trader.

Hallo.

Ja, ich habe versucht, einen Ausschuss zu bilden.

Ich habe 1000 trainierte Modelle. Es gibt eine aufgeschobene Stichprobe von 5 Jahren. Ich habe meinen Kollegen um Rat gefragt, wie man Ausschüsse zusammenstellt. Er riet dazu, den Ausschuss an einem Teil der aufgeschobenen Probe zu versammeln und ihn am anderen Teil zu testen. An dieser Stelle bin ich ins Stocken geraten. Der Ausschuss hat für den ersten Teil umgeschult und für den zweiten Teil eine Pflaume gezeigt.

Mit den einzelnen Modellen verhält es sich ähnlich. Ich habe den Fehler gemacht, ein Modell durch verzögerte Stichproben auszuwählen. Danach kann das Modell leicht gespült werden.

Diskussion zum Artikel "Ökonometrischer Volatilität Qualitätsindex [Archiv!] Jede Anfängerfrage, um

Dr. Trader 2016.08.12 11:40 #999

Vieles davon wissen Sie selbst und haben es getan, aber ich werde ausführlicher schreiben, um einige Annahmen auszuschließen, über die wir in gleicher Weise reden, aber anders handeln.

Sie benötigen eine sorgfältig ausgearbeitete Fitnessfunktion, um die Modellparameter zu schätzen. Wenn die Funktion bestimmte Modellparameter und ausgewählte Prädiktoren mit einer hohen Punktzahl bewertet, dann sollte der Test mit neuen Daten gute Ergebnisse liefern.
(Ich werde bei jeder Schätzung berücksichtigen, dass sie umso besser ist, je höher sie ist)

Sie haben zum Beispiel Daten für die Ausbildung, 5 Jahre. Und die Parameter für gbm sind n.trees, interaction.depth, shrinkage, n.minobsinnode, distribution, bag.fraction.

Die Fitnessfunktion sollte sich mindestens 50 Mal in einem Zyklus wiederholen:
1) Teilen Sie die Daten in 2 Teile, 50%/50%. Es sollte sowohl Zufallsstichproben mit Stichproben als auch sequentielle Stichproben geben (der Teil für das Training liegt irgendwo in der Mitte, und für die Validierung das, was ihn am Anfang und Ende der Rohdaten umgibt). Einschließlich extremer Versionen, bei denen das Training auf der ersten Hälfte der Tabelle stattfindet und die Validierung auf der letzten und umgekehrt. Ich denke, dass es wichtig ist, sowohl sequentiell gezogene Stichproben als auch Zufallsstichproben für das Training zu haben. In der Abbildung sehen Sie einige Beispiele für zufällige und sequentielle Partitionierung, die grünen Linien sind für das Training, die gelben sind für die Validierung.

2) Trainieren Sie das Modell anhand der Trainingsstichprobe (die verwendeten Modellparameter und Prädiktoren sind während des gesamten Zyklus die gleichen, die Sie zu schätzen versuchen), sagen Sie dann genau diese Daten mit diesem Modell voraus und bewerten Sie die Vorhersage - Genauigkeit, r^2 oder etwas anderes. Ich zum Beispiel runde das Regressionsergebnis auf Klassen und verwende Cohens Kappa-Funktion für die Schätzung, sie stammt von caret und gefällt mir besser als die Klassifizierungsgenauigkeit oder die Regressionsgenauigkeit. Aber es funktioniert nur für zwei Klassen. Bei drei Klassen finde ich es schwierig, irgendetwas vorzuschlagen. Es ist wichtig, dass die Schätzung die Genauigkeit jeder einzelnen Klasse berücksichtigt und auf dieser Grundlage eine Gesamteinschätzung abgibt.
3) Wenden Sie ein trainiertes Modell an, um Daten aus einer Validierungsstichprobe vorherzusagen, und schätzen Sie die Vorhersage mit der gleichen Funktion.
4) Beide Schätzungen (Training und Validierung) sollten nahe beieinander liegen und so hoch wie möglich sein. Ich verwende diesen Code für die Endnote - (min(score1,score2) - (max(score1,score2)-min(score1,score2)) - vom Min-Wert wird ihr Delta abgezogen.

Am Ende jeder Iteration erhalten wir eine Punktzahl, die aufgrund der zufälligen Aufteilung der Daten zwischen -1 und 1 variieren kann (oder in einem anderen Intervall, je nach verwendeter Funktion). Wir berechnen ihren Durchschnittswert und geben ihn als Ergebnis der Fitnessfunktion zurück. Zusätzlich ziehe ich vom Fitnesswert eine kleine Zahl (0,0001) für jeden verwendeten Prädiktor ab, um das Modell für eine zu große Menge an erforderlichen Daten zu bestrafen.

Ich wende dies zusammen mit der Genetik an, die Prädiktoren und Modellparameter auswählt und den Fitnesswert maximiert.

Das Endergebnis ist ein Satz von Prädiktoren und Modellparametern, die im Durchschnitt gute Vorhersageergebnisse für die verfügbaren Trainingsdaten liefern. Das Modell kann einige Muster in den Daten finden, daraus lernen und dieselben Muster auch in den neuen Validierungsdaten erfolgreich finden, unabhängig davon, welche Datenstichprobe für das Training verwendet wird.
Da das Modell jedes Mal mit nur 50 % der verfügbaren Daten trainiert wird und die Parameter und Prädiktoren auf dieser Grundlage ausgewählt werden, ist dies eine wichtige Voraussetzung für das Modell.
Das Modell für den Ausschuss sollte unter den gleichen Bedingungen trainiert werden - entweder durch Stichproben oder durch sukzessive Auswahl von 50 % der Daten für das Training. Für jedes neue Modell wird auch eine neue Stichprobe (oder eine Folge von Stichproben) benötigt.

Wie lange ein solcher Ausschuss gute Prognosen abgeben wird, ist nicht bekannt, aber wenn man bedenkt, dass die Trainingsdaten 5 Jahre lang waren, wird der Ausschuss offensichtlich weniger als die nächsten 5 Jahre leben.
Und noch ein wichtiger Punkt - wenn nach all der Zeit, die für die Erstellung des Ausschusses aufgewendet wurde, ein verlustreicher Handel stattfindet, dann ist das für Prognosen verwendete Paket nicht für den Forex-Bereich geeignet. Vielleicht hat sie zu viele Freiheitsgrade oder ist einfach nicht geeignet. Es ist besser, ein anderes Paket zu nehmen. Oder Sie können versuchen, den Prozentsatz der Trainingsdaten von 50 % auf noch weniger zu reduzieren.

All dies aus Ratschlägen aus diesem Forum und aus Erfahrung.

Gibt es ein Muster Diskussion zum Artikel "Entwicklung Diskussion zum Artikel "Random-Forest-Vorhersage-Trends"

СанСаныч Фоменко 2016.08.12 11:53 #1000

Dr. Trader:

Vieles davon wissen Sie selbst und haben es getan, aber ich werde ausführlicher schreiben, um einige Annahmen auszuschließen, über die wir in gleicher Weise reden, aber anders handeln.

Zur Schätzung der Modellparameter ist eine sorgfältig ausgearbeitete Fitnessfunktion erforderlich. Wenn die Funktion bestimmte Modellparameter und ausgewählte Prädiktoren mit einer hohen Punktzahl bewertet, dann sollte der Test mit den neuen Daten gute Ergebnisse liefern.
(Ich werde bei jeder Schätzung berücksichtigen, dass sie umso besser ist, je höher sie ist)

Sie haben zum Beispiel Daten für die Ausbildung, 5 Jahre. Und die Parameter für gbm sind n.trees, interaction.depth, shrinkage, n.minobsinnode, distribution, bag.fraction.

Die Fitnessfunktion sollte sich mindestens 50 Mal in einem Zyklus wiederholen:
1) Teilen Sie die Daten in 2 Teile, 50%/50%. Es sollte sowohl Zufallsstichproben mit Stichproben als auch sequentielle Stichproben geben (der Teil für das Training liegt irgendwo in der Mitte, und für die Validierung das, was ihn am Anfang und Ende der Rohdaten umgibt). Einschließlich extremer Versionen, bei denen das Training auf der ersten Hälfte der Tabelle stattfindet und die Validierung auf der letzten und umgekehrt. Ich denke, dass es wichtig ist, sowohl sequentiell gezogene Stichproben als auch Zufallsstichproben für das Training zu haben. In der Abbildung sehen Sie einige Beispiele für zufällige und sequentielle Partitionierung, die grünen Linien sind für das Training, die gelben sind für die Validierung.

2) Trainieren Sie das Modell anhand der Trainingsstichprobe (die verwendeten Modellparameter und Prädiktoren sind während des gesamten Zyklus die gleichen, die Sie zu schätzen versuchen), sagen Sie dann genau diese Daten mit diesem Modell voraus und bewerten Sie die Vorhersage - Genauigkeit, r^2 oder etwas anderes. Ich zum Beispiel runde das Regressionsergebnis auf Klassen und verwende Cohens Kappa-Funktion für die Schätzung, sie stammt von caret und gefällt mir besser als die Klassifizierungsgenauigkeit oder die Regressionsgenauigkeit. Aber es funktioniert nur für zwei Klassen. Bei drei Klassen finde ich es schwierig, irgendetwas vorzuschlagen. Es ist wichtig, dass die Schätzung die Genauigkeit jeder einzelnen Klasse berücksichtigt und auf dieser Grundlage eine Gesamteinschätzung abgibt.
3) Wenden Sie ein trainiertes Modell an, um Daten aus einer Validierungsstichprobe vorherzusagen, und schätzen Sie die Vorhersage mit der gleichen Funktion.
4) Beide Schätzungen (Training und Validierung) sollten nahe beieinander liegen und so hoch wie möglich sein. Ich verwende diesen Code für die Endnote - (min(score1,score2) - (max(score1,score2)-min(score1,score2)) - vom Min-Wert wird ihr Delta abgezogen.

Am Ende jeder Iteration erhalten wir eine Punktzahl, die aufgrund der zufälligen Aufteilung der Daten zwischen -1 und 1 variieren kann (oder in einem anderen Intervall, je nach verwendeter Funktion). Wir berechnen ihren Durchschnittswert und geben ihn als Ergebnis der Fitnessfunktion zurück. Zusätzlich ziehe ich vom Fitnesswert eine kleine Zahl (0,0001) für jeden verwendeten Prädiktor ab, um das Modell für eine zu große Menge an erforderlichen Daten zu bestrafen.

Ich wende dies zusammen mit der Genetik an, die Prädiktoren und Modellparameter auswählt und den Fitnesswert maximiert.

Das Endergebnis ist ein Satz von Prädiktoren und Modellparametern, die im Durchschnitt gute Vorhersageergebnisse für die verfügbaren Trainingsdaten liefern. Das Modell kann einige Muster in den Daten finden, daraus lernen und dieselben Muster auch in den neuen Validierungsdaten erfolgreich finden, unabhängig davon, welche Datenstichprobe für das Training verwendet wird.
Da das Modell jedes Mal mit nur 50 % der verfügbaren Daten trainiert wird und die Parameter und Prädiktoren auf dieser Grundlage ausgewählt werden, ist dies eine wichtige Voraussetzung für das Modell.
Das Modell für den Ausschuss sollte unter den gleichen Bedingungen trainiert werden - entweder durch Stichproben oder durch sukzessive Auswahl von 50 % der Daten für das Training. Für jedes neue Modell wird auch eine neue Stichprobe (oder eine Folge von Stichproben) benötigt.

Wie lange ein solcher Ausschuss gute Vorhersagen machen wird, ist nicht bekannt, aber wenn man bedenkt, dass die Trainingsdaten für 5 Jahre waren, wird der Ausschuss offensichtlich weniger als die nächsten 5 Jahre leben.
Ein weiterer wichtiger Punkt ist, dass das für die Prognosen verwendete Paket nicht für den Devisenhandel geeignet ist, wenn nach der für die Erstellung des Ausschusses aufgewendeten Zeit ein Gewinn erzielt wird. Vielleicht hat sie zu viele Freiheitsgrade oder ist einfach nicht geeignet. Es ist besser, ein anderes Paket zu nehmen. Oder Sie könnten versuchen, den Datenanteil für das Training von 50 % auf noch weniger zu reduzieren.

All dies aus Ratschlägen aus diesem Forum und aus Erfahrung.

Eine hervorragende Zusammenfassung der Ergebnisse.

Herzlichen Glückwunsch!

Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 100