Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 1227

 
giftig:

Die Chips sind so allgemein, dass es schwer ist, etwas Nützliches zu sagen, und die Einzelheiten, na ja, Sie wissen schon...

Es gibt eine Reihe von "Regeln", die Sie schwerwiegende Fehler bei der Konstruktion von Merkmalen mit Zeitreihen zu vermeiden, insbesondere eine der am meisten verletzt ist eine banale "Vermischung" von Merkmalen mit Zielen, sollten Merkmale streng aus der Vergangenheit, und Ziele von Punkten streng aus der Zukunft, sollte diese Trennung auf der Ebene der Algorithmus der Serie Umwandlung in Datensatz, und nicht, wie jeder tut alle Arten von Indikatoren dann schneiden zu verfolgen und zu testen, etwas verschieben irgendwo und so weiter. Wir sollten die ursprüngliche Reihe schneiden und dann gleitende Fenster (Vergangenheit und Zukunft) verwenden, um die Reihe zu durchlaufen und Merkmale und Ziele separat für Lerne und Test oder sogar für die Validierung zu erhalten. Natürlich kann man das auch mit Indikatoren machen, wenn man sicher ist, dass der Indikator für die Merkmale nicht in die Zukunft und für die Ziele nicht in die Vergangenheit schaut. Es gibt noch einige subtilere Fehler, auf die ich jetzt aber nicht eingehen werde.

Die Transformationen selbst können unterschiedlich sein und reichen von trivialen (Rückkehrer, Variation, Volumenänderung, Delta des Stapels, Verteilung der Geschäfte usw.) bis hin zu allen möglichen exotischen Transformationen.) Dutzende spezifischer benutzerdefinierter Statistiken, die durch "Inspiration" oder Clustering gewonnen wurden und sich als nützlich erwiesen haben, wie z. B. "Trend/Sommer" (von Inokenty oben erwähnt), sowie "Ordnung/Haos" und andere. Einige Statistiken sind für verschiedene Zeitrahmen gültig, andere nicht, einige Funktionen funktionieren für bestimmte Instrumente, andere nicht, und Sie müssen wissen, wie Sie Attribute für die Zielgruppenauswahl filtern und auswählen können. Es gibt viele Dinge, Standard-ARMA-Modelle, GARCH ... Mittel- und langfristige Makroprognosen als Merkmale usw. Ich bin noch nicht dazu gekommen, NLP\NLU für die Analyse von Textströmen, von sozialen Netzwerken usw. zu entwickeln. Hier werden die Dip-Einkünfte definitiv benötigt werden.

Als ich die Artikel von Vladimir Pererwenko wiederholte, machte ich ein zusätzliches Experiment - ohne zusätzliche Indikatoren(digitale Filter für die letzten Artikel), d.h. rein auf die Preise. Das Ergebnis war nur um ein paar Prozent schlechter. Und selbst dann denke ich, es ist nur weniger erfolgreiches Training von NS (unterschiedliche Mischung und Initialisierung von Gewichten, und OHLC waren nicht aus dem Artikel, sondern von meinem Server). NS kann problemlos jeden Indikator in sich selbst erstellen, wenn er ihn für Vorhersagen benötigt. Ich denke, es ist nicht nötig zu raten, welcher DF mit welchen Parametern (LPF/FTF/Bandpass oder irgendein MA) für die Vorhersage nützlich ist. Der NS wird alles aus OHLC selbst herstellen.

Aber über die subtileren Fehler ist es trotzdem interessant zu wissen...

Es ist schade, dass nützliche Informationen über MO für BP auf über 1200 Seiten verstreut sind. Wenn schon nicht funktionierende Ideen, dann wenigstens Sackgassen wie ZZ, PCA und Vorwärts-/Rückwärtsblicke.

 
Geh zurück in die Hölle:

Der "Gral" kann also nur im Zusammenhang mit Ultra-Hft stehen bzw. war da, als es noch keine so undurchsichtige Regulierung gab, oder ein Insider, der den Leuten zur Verfügung steht, die ohne ihn in einer Krise einfach Geld drucken und damit ihre Anleihen kaufen können).

Da haben wir es wieder...

Wenn Sie nicht müde werden, die Leute mit Ihren Billionen und Insidern zu erschrecken, kennen Sie das Sprichwort "ein Hund bellt, aber die Karawane zieht weiter", wir brauchen Ihre Beleidigungen nicht zum Maklerhaus, wo Sie Ihre letzten hundert Pfund gelassen haben, die Welt ist nicht fair, Sie hatten Pech, während ich Glück hatte, ich werde aus hundert eine Million machen, und wenn nicht, werde ich es wieder versuchen, bis ich sie bekomme.


Halten Sie uns nicht davon ab, von Yachten und Inseln zu träumen und unsere Träume Schritt für Schritt zu verwirklichen. Sie wissen nicht einmal, wo sie Voronov herunterladen können und wie sie einen Trend von einer Wohnung unterscheiden können.

 
Kesha Rutov:

Da haben wir es wieder...

Sie wissen, was man sagt: "Der Köter bellt und die Karawane zieht weiter", wir brauchen Ihre Beleidigungen gegenüber dem Maklerhaus, in dem Sie Ihre letzten hundert Pfund deponiert haben, nicht, die Welt ist nicht fair, Sie hatten Pech und ich werde Glück haben, ich werde aus hundert eine Million machen und wenn nicht, werde ich es wieder versuchen, bis ich Erfolg habe.


Halten Sie uns nicht davon ab, von Yachten und Inseln zu träumen und unsere Träume Schritt für Schritt zu verwirklichen. Sie sind alle "Gurus", die nicht einmal wissen, wo sie Voronov herunterladen können und wie sie einen Trend von einem Flat unterscheiden können.

Sagen Sie sofort - für welche DC arbeiten Sie? Traum-Propagandist.
 

Ich weiß, dass es noch niemand ausprobiert hat, aber vielleicht:

Sortieren Sie die Geschäfte nach Gewinn/Verlust, bzw. geben Sie bei der Einteilung in Klassen den profitabelsten Geschäften eine höhere Wahrscheinlichkeit, den unprofitabelsten eine Wahrscheinlichkeit von 0,5. Sortiert man die Geschäfte nach ihrer Effizienz und ordnet ihnen Wahrscheinlichkeiten zu, so ist es klar, dass die effektivsten Geschäfte weniger und die schlechtesten mehr erscheinen werden.

Lohnt es sich zu experimentieren? Sollte der Fehler abnehmen?

 
Maxim Dmitrievsky:

Ich weiß, dass es noch niemand ausprobiert hat, aber vielleicht:

Sortieren Sie die Geschäfte nach Gewinn/Verlust, bzw. geben Sie bei der Einteilung in Klassen den profitabelsten Geschäften eine höhere Wahrscheinlichkeit, den unprofitabelsten etwa 0,5. Sortiert man die Geschäfte nach ihrer Effizienz und ordnet ihnen Wahrscheinlichkeiten zu, so ist es klar, dass die effektivsten Geschäfte weniger und die schlechtesten mehr erscheinen werden.

Lohnt es sich zu experimentieren, sollte der Fehler abnehmen?

Es handelt sich um eine Regression, aber nicht durch die Höhe der Balken, sondern durch die Ergebnisse der Geschäfte (wahrscheinlich braucht man das für selbstlernende Systeme). Ich werde keine Ratschläge geben, weil ich mich seit 5 Monaten nicht mehr mit IR beschäftigt habe und jetzt überlege ich, welche Idee ich ausprobieren soll. Ich möchte den Einfluss von Rauschprädiktoren automatisch verringern. Immerhin wurde das am Anfang der Branche gemacht.
 

1 2 Teilweise ja, ein Trendphänomen, aber das ist meine Meinung, an sich ist "Deep Learning" nicht wirklich Regression/Klassifizierung, sondern eine Methode zur Extraktion von ziemlich einfachen hierarchisch organisierten Merkmalenaus Daten eines bestimmten Typs, z. B. Pixelbilder, die von reflektiertem Licht gezeichnet werden, das von der "realen Welt" in eine Kamera einfällt, sind für sich genommen als Pixelhelligkeiten sehr schlechte Merkmale, wenn man sie so in einen Klassifikator stopft und CNN eine Art "benachbarte Pixeldekorrelation" und Dimensionskompression durchführt, in mehreren Durchläufen. Ähnliches kann man tun, wenn man Bilder in kleine Fragmente clustert, im Allgemeinen ist "Deep Learning" eine Art von Clustering in mehreren Durchläufen und dann das Einspeisen von "High-Level-Merkmalen" in einen regulären Klassifikator. Das Thema ist sicherlich sehr interessant, aber es ist an der Zeit, es theoretisch zu entwickeln und nicht nur mit neuronalen Netzen unterschiedlicher Architektur zu "analysieren", die mit furchtbar langsamen Backprop trainiert werden. Aber auch hier ist es mir noch nicht gelungen, die Diplomatie mit dem Markt in Einklang zu bringen, obwohl die Frage offen ist, denn es ist zu teuer, in dieser Richtung zu experimentieren, wie Sie richtig festgestellt haben.

3 Sie müssen keine Konstanten in die Baumblätter einfügen, Sie können lineare Modelle oder komplexere Modelle einfügen, dann wird es eine "Extrapolation" über die Punktwolke hinaus geben))

4 Sie haben etwas falsch und Wald und Boosten kann Regression, kein Problem.

3. d.h. Sie können andere Modelle kombinieren und in die Blätter des Solver-Baums einfügen, ich frage mich, wie das funktioniert, bitte geben Sie ein konkretes Beispiel.

4. Nicht verwirrt und ich sehe das Problem, denn bisher habe ich nicht erfüllt Umsetzung auf Gerüst der Regression Problem mit vielen Ausgaben (abhängige Variablen) als auf neuronale Netze.
Nehmen wir zum Beispiel die Funktion der Zufallswaldkonstruktion aus der MQL-Bibliothek alglib.mqh

//+------------------------------------------------------------------+
//| This subroutine builds random decision forest.                   |
//| INPUT PARAMETERS:                                                |
//|     XY          -   training set                                 |
//|     NPoints     -   training set size, NPoints>=1                |
//|     NVars       -   number of independent variables, NVars>=1    |
//|     NClasses    -   task type:                                   |
//|                     * NClasses=1 - regression task with one      |
//|                                    dependent variable            |
//|                     * NClasses>1 - classification task with      |
//|                                    NClasses classes.             |

d.h. wenn die Anzahl der abhängigen Variablen mehr als eins beträgt, kann diese Funktion nur das Klassifikationsproblem lösen. Bringen Sie Ihre Umsetzung mit Lösung für dieses Problem, und bitte in Code, schließlich sind wir auf einem Forum der Programmierer :)

 
Maxim Dmitrievsky:

Ich weiß, dass es noch niemand ausprobiert hat, aber vielleicht:

Sortieren Sie die Geschäfte nach Gewinn/Verlust, bzw. geben Sie bei der Einteilung in Klassen den profitabelsten Geschäften eine höhere Wahrscheinlichkeit, den unprofitabelsten eine Wahrscheinlichkeit von 0,5. Sortiert man die Geschäfte einfach nach ihrer Effizienz und ordnet ihnen Wahrscheinlichkeiten zu, so ist klar, dass die effizientesten Geschäfte weniger und die schlechtesten mehr erscheinen werden.

Lohnt es sich zu experimentieren, damit der Fehler kleiner wird?

Wenn es in der Tester und um, indirekt, durch die Rentabilität der Geschäfte, erreichen die richtigen Einstiegspunkte, warum dann nicht finden sie auf einmal und ideal, von Preis-Serie, obwohl ich bereits gefragt, diese in der Monte Carlo Thread:)
 
Iwan Negreshniy:
Wenn es in tester und um die richtigen Einstiegspunkte indirekt zu finden, durch die Rentabilität der Geschäfte, warum nicht finden, sie auf einmal und ideal, von Preis-Serie, obwohl ich es in Monte Carlo Zweig bereits gefragt:)

dann wird es nur wenige Beispiele geben und die neuen Daten werden uns zu blinden Verlierern machen, wir müssen sie so viel wie möglich in ihrem Leben "sehen"

man kann nicht einfach einen idealen Zickzackkurs wählen, weil man keine Merkmale finden kann, sondern es sollte ein zweischneidiger Prozess sein, bei dem man alles gleichzeitig ausprobiert :)

Ich überlege bereits, ob ich statt 2 weitere Kurse belegen soll.

 
Maxim Dmitrievsky:

dann wird es wenige Beispiele geben und auf neue Daten ns wird blind verloren gehen, sie sollte in ihrem Leben so viel wie möglich "sehen"

Das ist logisch, aber andererseits ist es für sie vielleicht besser, weniger zu sehen und nur die sichere Sache zu handeln, als ständig zu signalisieren und das Risiko zu erhöhen.
 
Ivan Negreshniy:
ist logisch, aber auf der anderen Seite ist es vielleicht besser, weniger zu sehen und nur mit einer sicheren Sache zu handeln, als ständig zu signalisieren und das Risiko zu erhöhen.

Nun, ich suche immer nach Fehlern in einem Testmuster. Diese "sichere Sache" erscheint nur dem Menschen, wir "denken" anders.

Ich denke, ein neuronales Netz denkt so, dass es sich nicht darum kümmert, ob es eine sichere Sache ist oder nicht, solange es verallgemeinern kann.

wenn Sie etwas Mist in den 0,5-Bereich setzen, und die Spikes sind Qualitätshandel, würde die Verallgemeinerungsfähigkeit verbessern... Sie sollten es natürlich überprüfen, weil Sie es nicht mit dem Auge tun können
Grund der Beschwerde: