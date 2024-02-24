Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 79
Ich habe die Methode "repeatedcv" in trainControl mit einer Standardaufteilung verwendet. Kürzlich habe ich selbst Code für die Kreuzvalidierung geschrieben. Ich habe die Kreuzvalidierung sowohl mit zufällig entnommenen Balken als auch mit fortlaufend entnommenen Abschnitten ohne Lücken ausprobiert. Beim Fronttest konnte ich keinen Unterschied feststellen, das Ergebnis war in beiden Fällen gleich. Ich habe die Daten für Training/Kreuzvalidierung zu 50%/50% aufgeteilt, vielleicht spielt es bei diesem Verhältnis keine Rolle mehr.
Ich werde das in Ruhe ausprobieren...
Ich erinnere mich, dass in dem Artikel, den Sie vor einiger Zeit gepostet haben, der führende Vergleich mit der Platt-Methode (oder so ähnlich) aufgestockte Bäume waren. Alles, was ich bei Google über diese Methode gefunden habe, ist, dass man die Modellausgabe an Sigmoid übergeben und dessen Ergebnis übernehmen muss. Können gbm oder xgboost das leisten? Dieser Ansatz scheint besser zu sein als Wald, Neuron und einige "eingesackte Bäume", die an zweiter Stelle stehen.
Über CV. Die Standardeinstellung ist eine zufällige Partitionierung... Bei Zeitreihen ist die zeitliche Trennbarkeit wichtig... Sie können es in Caret tun. Caret CV Zeitreihen benutzerdefinierte Falten... schlagen Sie es nach. In meinem Code, den ich vorhin gepostet habe. Es ist in traincontrol implementiert.
Ich sehe dich an und bin erstaunt... Sie wollen etwas aus dem Nichts schaffen. D.h., Sie wollen 0,000000000000000000000000000000000000000000000000 Ergebnis von Null erhalten. Ich kann mir das nicht länger ansehen, also helfe ich Ihnen. Die Topologie des Netzes ist eigentlich zweitrangig. Beim maschinellen Lernen, im Devisenhandel und darüber hinaus, stehen die Daten an erster Stelle. Das heißt, das Wichtigste beim Entwurf neuronaler Netze ist nicht die Netztopologie oder die Trainingsmethode. Es handelt sich um Eingangsdaten und Ausgangsdaten. Wenn die Daten für den Markt relevant sind, wird jedes noch so kleine Perseptron Ihr Klassifizierungsproblem lösen und auch in Zukunft gut funktionieren, und zwar aus einem einfachen Grund: Weil die Eingabedaten für den Markt relevant sind und diese Daten ihn vorhersagen können. Was Sie versuchen, ist, an der Oberfläche irrelevanter Informationen zu kratzen. Tut mir leid, aber das Ergebnis wird auch irrelevant sein.... Was den Markt betrifft, so kommt es im Devisenhandel in erster Linie auf das Volumen an, und dann auf die Reaktion des Marktes darauf. Und nicht das Volumen, das in MT (tick), aber das tatsächliche Volumen der Futures, die gleichen Euro. Nehmen Sie das Cluster-Delta zu Hilfe. Es gibt eine Menge nützlicher Informationen. Also, mit dem Volumen der Trades, wird die Leistung eines jeden Netzes, auch die einfachste perseptron deutlich erhöhen. Sie verfügt auch über ein Delta, das ebenfalls sehr nützlich ist. Aber Sie versuchen, ein Modell auf der Grundlage von Indikatoren zu erstellen, die nach dem Preis sekundär, ich würde sagen tertiär sind, und Sie erwarten ein Wunder davon. Es wird kein Wunder geben, das versichere ich Ihnen.....
Beim maschinellen Lernen, im Devisenhandel und darüber hinaus, stehen die Daten an erster Stelle. Das heißt, das Wichtigste beim Entwurf neuronaler Netze ist nicht die Netztopologie oder die Trainingsmethode. Es handelt sich um Eingangsdaten und Ausgangsdaten. Wenn die Daten für den Markt relevant sind, wird jedes noch so kleine Perseptron Ihr Klassifizierungsproblem lösen und auch in Zukunft gut funktionieren, und zwar aus einem einfachen Grund: Weil die Eingabedaten für den Markt relevant sind und diese Daten ihn vorhersagen können.
Ich habe nicht einmal etwas zu widersprechen, das ist richtig. Das wissen wir auch, und wir diskutieren nicht nur Klassifizierungsmodelle, sondern auch Methoden zur Auswahl von Prädiktoren (Eingabedaten), lesen Sie zuerst diesen Thread.
Ich nehme an, dass Sie hoffen, ein Dutzend Inputs manuell auszuwählen, ein Modell zu erstellen, eine Woche lang zu handeln, dann zu verlieren und erneut Inputs auszuwählen. Ich habe das auch getan, manchmal habe ich lustige Strategien wie "nehmen Sie ein bestimmtes Korn, um das Neuron zu initialisieren, trainieren Sie es genau 7777 Iterationen, alles wird in Ordnung sein, aber jeden zweiten Dienstag müssen Sie gegen sein Signal handeln. Optimieren Sie das Netz jeden zweiten Tag anhand neuer Daten". Solche Strategien sind real, aber es dauert lange, bis man so etwas auswählt, und es bringt nur für ein paar Wochen Gewinn. Alles nur, weil eine solche Strategie auf einem kurzfristigen Muster beruht.
Stattdessen wähle ich einen Algorithmus für die automatische Auswahl von Einträgen. Es ist ganz einfach: Es gibt etwa 100 Einträge in jedem Balken und einen Algorithmus, der eine solche Kombination von Einträgen auswählt, dass sie zusammen über das ganze Jahr hinweg ein gültiges Kauf-/Verkaufssignal ergeben. Es ist nicht wie die Optimierung von Expert Advisors in mt5, wo ein EA kann große Ergebnisse erzielen und scheitern auf der Fronttest, aber es ist komplizierter, mit Cross-Validierungen und verschiedene Kriterien der Schätzung des Ergebnisses. Früher habe ich etwa hundert Einträge ausgewählt, jetzt sind es nur noch ein paar Dutzend. Ich erhalte 60%-70% Genauigkeit im Fronttest, aber es ist immer noch instabil, ich muss Freiheitsgrade im gesamten Auswahl- und Trainingsprozess loswerden, um jedes Mal ungefähr die gleichen Ergebnisse zu erhalten, selbst wenn ich bei Null anfange.
Unternehmen, die über eigene Einrichtungen und Programmierer verfügen, nutzen dieselbe Datenanalyse- und Modellierungssoftware, die uns zur Verfügung steht. Nehmen wir an, sie trainieren das perfekte Modell und erzielen 100 % Gewinn pro Monat. Wenn ich weniger Macht habe, kann ich mit denselben Daten ein schwächeres Modell mit, sagen wir, nur 50 % des Gewinns erstellen. Das wird für mich ausreichen.
Demagoge, autsch. Es wird Zeit, dass du hier rauskommst. Bauen Sie ein Haus.
"Der Hund bellt, die Karawane zieht weiter." С
Lassen Sie es mich so formulieren. Die besten Fonds weisen eine durchschnittliche jährliche Rendite von 40-50 % auf. Sie können dort sowohl kluge als auch hervorragende Leute arbeiten. Ich sehe nichts Ungewöhnliches darin, dass ich mich 50 % pro Jahr nähere und dieses Wachstum haben werde.
Erstens - die Fonds zeigen eine solche miserable Rendite nur aus einem Grund, der Mangel an Liquidität auf dem Markt, ist es schwer, eine große Menge an Geld in die Strategie zu setzen, haben Sie nicht solche Probleme
Zweitens: Warum sollte man nicht 100 % pro Monat anstreben, sagen wir?
Ich stimmeMihail Marchukajtes voll und ganz zu: Um die Qualität der Anerkennung zu verbessern, müssen wir die Qualität der Zeichen und Modelle verbessern.... ihr Einfluss +/- 5% auf das Gesamtergebnis
Sie sind auch ein Demagoge. Zeigen Sie uns die Eingaben mit diesem Grad an Informativität. Warum nehmen wir die Top-Modelle? Um Signale aus verrauschten Daten herauszufiltern, könnten wir, wenn wir Daten ohne Rauschen hätten, auch eine Formel in Excel verwenden.
"100 % pro Monat". Bemühen Sie sich, zeigen Sie Ergebnisse, teilen Sie Ideen. Wir hören Ihnen zu, wie Sie Ihre Rentabilität um das 20-fache steigern können und wie Sie im nächsten Monat nicht von der Auszahlung zurücktreten.
"Langlebige" Devisenhändler. Mehr als 5 Jahre im Geschäft. Sortiert nach FS. Ja, einige haben kosmische Renditen, aber andere Statistiken sind schlecht. Das ist die Realität. Und Stabiliti wechselt den Besitzer. Alle anderen zeigen FS von 3 und weniger.
Der Mann empfiehlt die Lektüre von "MSUA" und Spektralanalyse, insbesondere Fourier
========================================================
Ferner, was Ergebnisse, die ich "Demagoge" erreicht haben, aber in der Tat sehr bescheiden, gute Ideen, wie ich denke, eine Menge, meine Forschung geht in viele Richtungen gleichzeitig und es gibt einen großen Mangel an Wissen in verschiedenen Bereichen, weil oft um Hilfe von Forumsteilnehmern fragen, aber vor allem zu helfen und niemand will, sagen sie, Sie lernen selbst, und dann..... nur, wenn ich mich selbst gemeistert haben alle dann, warum ich diese Kommunikation zu tun, wie ohne Logik, werde ich abgelenkt.
Hier ist das Beste, was auf der dan. Mom. dass ich es geschafft, aus RF auf die neuen Daten zu quetschen ist 50% pro Monat für 2 Monate in Folge, aber alles ist immer noch sehr instabil, habe ich versucht, füllen Sie die Bilder 10-mal, aber nicht bekommen (got it)
Die Quintessenz ist, dass man sich nicht mit Schablonen einschränken sollte, wie z.B. 30% pro Jahr ist cool, es ist nicht cool, es ist ein Rahmen für den Geist und die Kreativität