Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 79

 
Dr.Trader:

Ich habe die Methode "repeatedcv" in trainControl mit einer Standardaufteilung verwendet. Kürzlich habe ich selbst Code für die Kreuzvalidierung geschrieben. Ich habe die Kreuzvalidierung sowohl mit zufällig entnommenen Balken als auch mit fortlaufend entnommenen Abschnitten ohne Lücken ausprobiert. Beim Fronttest konnte ich keinen Unterschied feststellen, das Ergebnis war in beiden Fällen gleich. Ich habe die Daten für Training/Kreuzvalidierung zu 50%/50% aufgeteilt, vielleicht spielt es bei diesem Verhältnis keine Rolle mehr.
Ich werde das in Ruhe ausprobieren...

Ich erinnere mich, dass in dem Artikel, den Sie vor einiger Zeit gepostet haben, der führende Vergleich mit der Platt-Methode (oder so ähnlich) aufgestockte Bäume waren. Alles, was ich bei Google über diese Methode gefunden habe, ist, dass man die Modellausgabe an Sigmoid übergeben und dessen Ergebnis übernehmen muss. Können gbm oder xgboost das leisten? Dieser Ansatz scheint besser zu sein als Wald, Neuron und einige "eingesackte Bäume", die an zweiter Stelle stehen.

Gbm und xgboost sind verstärkte Bäume. Für eine bessere Konvergenz in grpdient wird jeder neue Baum auf gewichteten Beobachtungen aufgebaut, die auf den Ergebnissen des Lernens des vorherigen Baums basieren. Sowohl lineare als auch nichtlineare Modelle können verstärkt werden...

An zweiter Stelle steht ein Zufallsforst. Das ist Bagging, wie ich es verstehe. Die durchschnittlichen Ergebnisse mehrerer Modelle, die auf unterschiedlichen Daten basieren.

Lesen Sie mehr über Gradientenverstärkung. Es ist schwer, eine bessere Klassifizierung zu finden. Ich zum Beispiel klassifiziere auf der Grundlage der Ergebnisse von Regressionsprädiktoren.
 
Über CV. Standardmäßig wird eine zufällige Partitionierung vorgenommen... Bei Zeitreihen ist die zeitliche Trennbarkeit wichtig... In caret kann dies getan werden. Caret CV Zeitreihen benutzerdefinierte Falten... schlagen Sie es nach. In meinem Code, den ich vorhin gepostet habe. Es ist dort in traincontrol implementiert.
 
Alexey Burnakov:
Über CV. Die Standardeinstellung ist eine zufällige Partitionierung... Bei Zeitreihen ist die zeitliche Trennbarkeit wichtig... Sie können es in Caret tun. Caret CV Zeitreihen benutzerdefinierte Falten... schlagen Sie es nach. In meinem Code, den ich vorhin gepostet habe. Es ist in traincontrol implementiert.

Ich sehe dich an und bin erstaunt... Sie wollen etwas aus dem Nichts schaffen. D.h., Sie wollen 0,000000000000000000000000000000000000000000000000 Ergebnis von Null erhalten. Ich kann mir das nicht länger ansehen, also helfe ich Ihnen. Die Topologie des Netzes ist eigentlich zweitrangig. Beim maschinellen Lernen, im Devisenhandel und darüber hinaus, stehen die Daten an erster Stelle. Das heißt, das Wichtigste beim Entwurf neuronaler Netze ist nicht die Netztopologie oder die Trainingsmethode. Es handelt sich um Eingangsdaten und Ausgangsdaten. Wenn die Daten für den Markt relevant sind, wird jedes noch so kleine Perseptron Ihr Klassifizierungsproblem lösen und auch in Zukunft gut funktionieren, und zwar aus einem einfachen Grund: Weil die Eingabedaten für den Markt relevant sind und diese Daten ihn vorhersagen können. Was Sie versuchen, ist, an der Oberfläche irrelevanter Informationen zu kratzen. Tut mir leid, aber das Ergebnis wird auch irrelevant sein.... Was den Markt betrifft, so kommt es im Devisenhandel in erster Linie auf das Volumen an, und dann auf die Reaktion des Marktes darauf. Und nicht das Volumen, das in MT (tick), aber das tatsächliche Volumen der Futures, die gleichen Euro. Nehmen Sie das Cluster-Delta zu Hilfe. Es gibt eine Menge nützlicher Informationen. Also, mit dem Volumen der Trades, wird die Leistung eines jeden Netzes, auch die einfachste perseptron deutlich erhöhen. Sie verfügt auch über ein Delta, das ebenfalls sehr nützlich ist. Aber Sie versuchen, ein Modell auf der Grundlage von Indikatoren zu erstellen, die nach dem Preis sekundär, ich würde sagen tertiär sind, und Sie erwarten ein Wunder davon. Es wird kein Wunder geben, das versichere ich Ihnen.....

P.S. Denken Sie daran, gegen wen Sie kandidieren wollen... Unternehmen mit Teams der coolsten Programmierer, die mehr Rechenleistung haben als Ihr Quad-Core. Mit Geld, das in die Entwicklung neuer Methoden usw. investiert wird. Und hier beschloss Alexey aus der einfachen russischen Provinz, den Markt in 5 Jahren zu hacken und den Gral zu holen. Komm vom Himmel herab und nimm die rosarote Brille ab........

 
Mihail Marchukajtes:

Beim maschinellen Lernen, im Devisenhandel und darüber hinaus, stehen die Daten an erster Stelle. Das heißt, das Wichtigste beim Entwurf neuronaler Netze ist nicht die Netztopologie oder die Trainingsmethode. Es handelt sich um Eingangsdaten und Ausgangsdaten. Wenn die Daten für den Markt relevant sind, wird jedes noch so kleine Perseptron Ihr Klassifizierungsproblem lösen und auch in Zukunft gut funktionieren, und zwar aus einem einfachen Grund: Weil die Eingabedaten für den Markt relevant sind und diese Daten ihn vorhersagen können.

Ich habe nicht einmal etwas zu widersprechen, das ist richtig. Das wissen wir auch, und wir diskutieren nicht nur Klassifizierungsmodelle, sondern auch Methoden zur Auswahl von Prädiktoren (Eingabedaten), lesen Sie zuerst diesen Thread.

Ich nehme an, dass Sie hoffen, ein Dutzend Inputs manuell auszuwählen, ein Modell zu erstellen, eine Woche lang zu handeln, dann zu verlieren und erneut Inputs auszuwählen. Ich habe das auch getan, manchmal habe ich lustige Strategien wie "nehmen Sie ein bestimmtes Korn, um das Neuron zu initialisieren, trainieren Sie es genau 7777 Iterationen, alles wird in Ordnung sein, aber jeden zweiten Dienstag müssen Sie gegen sein Signal handeln. Optimieren Sie das Netz jeden zweiten Tag anhand neuer Daten". Solche Strategien sind real, aber es dauert lange, bis man so etwas auswählt, und es bringt nur für ein paar Wochen Gewinn. Alles nur, weil eine solche Strategie auf einem kurzfristigen Muster beruht.

Stattdessen wähle ich einen Algorithmus für die automatische Auswahl von Einträgen. Es ist ganz einfach: Es gibt etwa 100 Einträge in jedem Balken und einen Algorithmus, der eine solche Kombination von Einträgen auswählt, dass sie zusammen über das ganze Jahr hinweg ein gültiges Kauf-/Verkaufssignal ergeben. Es ist nicht wie die Optimierung von Expert Advisors in mt5, wo ein EA kann große Ergebnisse erzielen und scheitern auf der Fronttest, aber es ist komplizierter, mit Cross-Validierungen und verschiedene Kriterien der Schätzung des Ergebnisses. Früher habe ich etwa hundert Einträge ausgewählt, jetzt sind es nur noch ein paar Dutzend. Ich erhalte 60%-70% Genauigkeit im Fronttest, aber es ist immer noch instabil, ich muss Freiheitsgrade im gesamten Auswahl- und Trainingsprozess loswerden, um jedes Mal ungefähr die gleichen Ergebnisse zu erhalten, selbst wenn ich bei Null anfange.

Mihail Marchukajtes:

P.S. Überlegen Sie, gegen wen Sie antreten wollen... Unternehmen mit Teams der coolsten Programmierer, mit mehr Rechenleistung als Ihr Quad-Core. Mit Geld, das in die Entwicklung neuer Methoden usw. investiert wird. Und hier beschloss Alexey aus der einfachen russischen Provinz, den Markt in 5 Jahren zu hacken und den Gral zu holen. Komm vom Himmel herab und nimm die rosarote Brille ab........

Unternehmen, die über eigene Einrichtungen und Programmierer verfügen, nutzen dieselbe Datenanalyse- und Modellierungssoftware, die uns zur Verfügung steht. Nehmen wir an, sie trainieren das perfekte Modell und erzielen 100 % Gewinn pro Monat. Wenn ich weniger Macht habe, kann ich mit denselben Daten ein schwächeres Modell mit, sagen wir, nur 50 % des Gewinns erstellen. Das wird für mich ausreichen.

 
Mihail Marchukajtes:

Ich sehe dich an und es ist erstaunlich... Sie wollen etwas aus dem Nichts schaffen. Das heißt, von Null wollen Sie 0,000000000000000000000000000000000000000000000000000000000000000000000000 Ergebnis erhalten. Ich kann mir das nicht mehr ansehen, also helfe ich Ihnen. Die Topologie des Netzes ist eigentlich zweitrangig. Beim maschinellen Lernen, im Devisenhandel und darüber hinaus, stehen die Daten an erster Stelle. Das heißt, das Wichtigste beim Entwurf neuronaler Netze ist nicht die Netztopologie oder die Trainingsmethode. Es handelt sich um Eingangsdaten und Ausgangsdaten. Wenn die Daten für den Markt relevant sind, wird jedes noch so kleine Perseptron Ihr Klassifizierungsproblem lösen und auch in Zukunft gut funktionieren, und zwar aus einem einfachen Grund: Weil die Eingabedaten für den Markt relevant sind und diese Daten ihn vorhersagen können. Was Sie versuchen, ist, an der Oberfläche irrelevanter Informationen zu kratzen. Tut mir leid, aber das Ergebnis wird auch irrelevant sein.... Was den Markt betrifft, so kommt es im Devisenhandel in erster Linie auf das Volumen an, und dann auf die Reaktion des Marktes darauf. Und nicht das Volumen, das in MT (tick), aber das tatsächliche Volumen der Futures, die gleichen Euro. Nehmen Sie das Cluster-Delta zu Hilfe. Es gibt eine Menge nützlicher Informationen. Also, mit dem Volumen der Trades, wird die Leistung eines jeden Netzes, auch die einfachste perseptron deutlich erhöhen. Sie verfügt auch über ein Delta, das ebenfalls sehr nützlich ist. Aber Sie versuchen, ein Modell auf der Grundlage von Indikatoren zu erstellen, die nach dem Preis sekundär, ich würde sagen tertiär sind, und Sie erwarten ein Wunder davon. Es wird kein Wunder geben, das versichere ich Ihnen.....

P.S. Denken Sie daran, gegen wen Sie kandidieren wollen... Unternehmen mit Teams der coolsten Programmierer, die mehr Rechenleistung haben als Ihr Quad-Core. Mit Geld, das in die Entwicklung neuer Methoden usw. investiert wird. Und hier beschloss Alexey aus der einfachen russischen Provinz, den Markt in 5 Jahren zu hacken und den Gral zu holen. Komm vom Himmel herab und nimm die rosarote Brille ab........

Demagoge, autsch. Es wird Zeit, dass du hier rauskommst. Bauen Sie ein Haus.

"Der Hund bellt, die Karawane zieht weiter." С

 
Dr. Trader:

Ich habe nicht einmal etwas, worüber ich streiten könnte, das stimmt. Das wissen wir auch, und wir diskutieren nicht nur über Klassifizierungsmodelle, sondern auch über Methoden zur Auswahl von Prädiktoren (Inputs), lesen Sie zuerst diesen Thread.

Ich nehme an, dass Sie hoffen, ein Dutzend Inputs manuell auszuwählen, ein Modell zu erstellen, eine Woche lang zu handeln, dann zu verlieren und erneut Inputs auszuwählen. Ich habe das auch getan, manchmal habe ich lustige Strategien wie "nehmen Sie ein bestimmtes Korn, um das Neuron zu initialisieren, trainieren Sie es genau 7777 Iterationen, alles wird gut sein, aber jeden anderen Dienstag müssen Sie gegen sein Signal handeln. Optimieren Sie das Netz jeden zweiten Tag anhand neuer Daten". Solche Strategien sind real, aber es dauert lange, bis man so etwas auswählt, und es bringt nur für ein paar Wochen Gewinn. Alles nur, weil eine solche Strategie auf einem kurzfristigen Muster beruht.

Stattdessen wähle ich einen Algorithmus für die automatische Auswahl von Einträgen. Ich habe einfach etwa 100 Einträge für jeden Balken und einen Algorithmus, der eine solche Kombination von Einträgen auswählt, dass sie alle zusammen ein gültiges Kauf-/Verkaufssignal für das ganze Jahr ergeben. Es ist nicht wie die Optimierung von Expert Advisors in mt5, wo ein EA kann große Ergebnisse erzielen und scheitern auf der Fronttest, aber es ist komplizierter, mit Cross-Validierungen und verschiedene Kriterien der Schätzung des Ergebnisses. Früher habe ich etwa hundert Einträge ausgewählt, jetzt sind es nur noch ein paar Dutzend. Ich erhalte 60%-70% Genauigkeit im Fronttest, aber es ist immer noch instabil, ich muss Freiheitsgrade im gesamten Auswahl- und Trainingsprozess loswerden, um jedes Mal ungefähr die gleichen Ergebnisse zu erhalten, selbst wenn ich bei Null anfange.

Unternehmen mit ihren Einrichtungen und Programmierern verwenden dieselbe Datenanalyse- und Modellierungssoftware, die auch uns zur Verfügung steht. Sie werden ein perfektes Modell trainieren und 100 % Gewinn pro Monat erzielen. Ich habe weniger Macht, mit den gleichen Daten kann ich ein schwächeres Modell erstellen, mit, sagen wir, nur 50 % des Gewinns. Ich komme schon klar.

Lassen Sie es mich so formulieren. Die besten Fonds weisen eine durchschnittliche jährliche Rendite von 40-50 % auf. Dort arbeiten die Klugen, aber auch die, die einfach gut sind. Für mich ist es nichts Ungewöhnliches, wenn ich mich jährlich der 50 %-Marke nähere und dieser Wert steigt.
 
Alexey Burnakov:
Lassen Sie es mich so formulieren. Die besten Fonds weisen eine durchschnittliche jährliche Rendite von 40-50 % auf. Sie können dort sowohl kluge als auch hervorragende Leute arbeiten. Ich sehe nichts Ungewöhnliches darin, dass ich mich 50 % pro Jahr nähere und dieses Wachstum haben werde.

Erstens - die Fonds zeigen eine solche miserable Rendite nur aus einem Grund, der Mangel an Liquidität auf dem Markt, ist es schwer, eine große Menge an Geld in die Strategie zu setzen, haben Sie nicht solche Probleme

Zweitens: Warum sollte man nicht 100 % pro Monat anstreben, sagen wir?

Ich stimmeMihail Marchukajtes voll und ganz zu: Um die Qualität der Anerkennung zu verbessern, müssen wir die Qualität der Zeichen und Modelle verbessern.... ihr Einfluss +/- 5% auf das Gesamtergebnis

 
mytarmailS:

Erstens - die Fonds zeigen eine solche miserable Rendite nur aus einem Grund, der Mangel an Liquidität auf dem Markt, ist es schwer, eine große Menge an Geld in die Strategie zu setzen, haben Sie nicht solche Probleme

Zweitens: Warum sollte man nicht 100 % pro Monat anstreben, sagen wir?

Ich stimmeMihail Marchukajtes voll und ganz zu: Um die Qualität der Anerkennung zu verbessern, müssen wir die Qualität der Zeichen und Modelle verbessern.... ihr Einfluss auf das Endergebnis +/- 5%

Sie sind auch ein Demagoge. Zeigen Sie uns die Eingaben mit diesem Grad an Informativität. Warum nehmen wir die Top-Modelle? Um Signale aus verrauschten Daten herauszufiltern, könnten wir, wenn wir Daten ohne Rauschen hätten, auch eine Formel in Excel verwenden.

"100 % pro Monat". Bemühen Sie sich, zeigen Sie Ergebnisse, teilen Sie Ideen. Wir hören Ihnen zu, wie Sie Ihre Rentabilität um das 20-fache steigern können und wie Sie im nächsten Monat nicht von der Auszahlung zurücktreten.

 
Alexey Burnakov:

Sie sind auch ein Demagoge. Zeigen Sie uns die Eingaben mit diesem Grad an Informativität. Warum nehmen wir die Top-Modelle? Um Signale aus verrauschten Daten herauszufiltern, könnten wir die Formel in Excel anwenden, wenn wir Daten ohne Rauschen hätten.

"100 % pro Monat". Sich anstrengen, Ergebnisse zeigen, Ideen austauschen. Wir hören Ihnen zu, wie Sie Ihre Rentabilität um das 20-fache steigern können und wie Sie sich nicht im nächsten Monat aus einem Drawdown zurückziehen.

"Langlebige" Devisenhändler. Mehr als 5 Jahre im Geschäft. Sortiert nach FS. Ja, einige haben kosmische Renditen, aber andere Statistiken sind schlecht. Das ist die Realität. Und Stabiliti wechselt den Besitzer. Alle anderen zeigen FS von 3 und weniger.

 
Alexey Burnakov:

Sie sind auch ein Demagoge. Zeigen Sie uns die Eingaben mit diesem Grad an Informativität. Warum nehmen wir die Top-Modelle? Um Signale aus verrauschten Daten herauszufiltern, könnten wir die Formel in Excel anwenden, wenn wir Daten ohne Rauschen hätten.

"100 % pro Monat". Sich anstrengen, Ergebnisse zeigen, Ideen austauschen. Lassen Sie uns hören, wie man die Rendite um das 20-fache steigern kann und wie man im nächsten Monat nicht durch einen Drawdown verloren geht.

Wir sind hier alle Demagogen, nur du bist d'artagnan, das ist schon klar, gut dass du wenigstens kein Troll bist.... tschüss..... :)


Ich glaube nicht, dass es eine echte Handelsstrategie ist, aber ich habe gelernt, dass er ein tiefgründiger Praktiker ist und ich habe keine Fragen über den Markt, die nicht beantwortet wurden... Ich möchte ihm dafür danken.

Dieser Mann ist Ph. Er promovierte in technischen Wissenschaften und verteidigte seine Dissertation über "KI" vor ziemlich langer Zeit (vor etwa 20 Jahren) Er baut seit über 20 Jahren Roboter und verfügt über eine Menge Erfahrung.

Und er sagt, dass man den Markt nicht mit einem Black-Box-Ansatz vorhersagen kann, sondern dass es notwendig ist, die funktionierenden Attribute zu identifizieren, zu verstehen, wie und warum sie funktionieren, und die Daten so weit wie möglich zu filtern, damit nur das übrig bleibt, was funktioniert, und das Rauschen zu ignorieren.

Er hat ein Netzwerk von etwa 100 Zeichen (Prädiktoren), jedes Merkmal hat eine ganze Bibliothek oder Paket, wie Sie wollen.

Und nun vergleichen Sie den Qualitätsunterschied zwischen einem Schild, für das eine ganze Bibliothek benötigt wird, und einem dummen, krummen Ding, das "SMA" heißt. , "MACD" , "RSI" usw... Sie haben 0,00000001% nützliche Informationen, genau wieMihail Marchukajtes schrieb, und das ist eine Tatsache, sonst würden die Modelle genau die Leistung zeigen, die sie zeigen können, d.h. 90% richtige Antworten

Der Mann empfiehlt die Lektüre von "MSUA" und Spektralanalyse, insbesondere Fourier

========================================================

Ferner, was Ergebnisse, die ich "Demagoge" erreicht haben, aber in der Tat sehr bescheiden, gute Ideen, wie ich denke, eine Menge, meine Forschung geht in viele Richtungen gleichzeitig und es gibt einen großen Mangel an Wissen in verschiedenen Bereichen, weil oft um Hilfe von Forumsteilnehmern fragen, aber vor allem zu helfen und niemand will, sagen sie, Sie lernen selbst, und dann..... nur, wenn ich mich selbst gemeistert haben alle dann, warum ich diese Kommunikation zu tun, wie ohne Logik, werde ich abgelenkt.


Hier ist das Beste, was auf der dan. Mom. dass ich es geschafft, aus RF auf die neuen Daten zu quetschen ist 50% pro Monat für 2 Monate in Folge, aber alles ist immer noch sehr instabil, habe ich versucht, füllen Sie die Bilder 10-mal, aber nicht bekommen (got it)

ww

www

Die Quintessenz ist, dass man sich nicht mit Schablonen einschränken sollte, wie z.B. 30% pro Jahr ist cool, es ist nicht cool, es ist ein Rahmen für den Geist und die Kreativität

Grund der Beschwerde: