Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 269

 

Die Geschichte mit dem Null-Modellanpassungsfehler, die hier veröffentlicht wurde, ist rein alchemistischer Natur.

1. Modellanpassungsfehler = 0. Nun, so funktioniert das nicht, das kann nicht sein. Wie kann das sein? 1% kann oder kann nicht? Und 5 % können oder können auch nicht? Und wie viele %% braucht man, damit es "kann"?

2. Zwei Konzepte: Neuzeichnen und Vorausschauen. Was sind sie? Es wurde ein verblüffender Beweis verwendet: Man fand irgendwie verdächtige Indikatoren, warf sie weg und erhielt einen Anpassungsfehler = 50%. Das war's. Bewiesen. Blick in die Zukunft. Was der Gegenstand des Beweises ist, was der Beweis selbst ist .... Kein Kommentar.

Oder liegt die Sache vielleicht viel tiefer und die Alchemie hat es nicht erlaubt, sich mit dem Problem zu befassen?

Ich habe das Problem oben genannt: Analysemethoden und Vorhersagemethoden sind unterschiedlich, haben ihre eigenen Besonderheiten und man kann nicht einfach Analysemethoden auf Vorhersagen übertragen - man muss die Zulässigkeit der Anwendung von Analysemethoden auf Vorhersagen beweisen.

In unserem Beispiel.

Wir nehmen einige Indikatoren (von denen keiner wirklich wichtig ist) und berechnen ihre Werte für die gesamte Stichprobe, mit der wir das Modell unterrichten und testen wollen. Es gibt kein Problem für die Analyse der Vergangenheit. Aber für die Vorhersage muss ein solcher Ansatz bewiesen werden, denn wir interessieren uns für den nächsten Balken nach dem, den wir haben. Das bedeutet, dass wir ein Fenster nehmen und alle Indikatoren auf diesem Fenster berechnen und dann das Modell anpassen sollten. Wenn ein neuer Balken kommt, sollten wir diesen Vorgang wiederholen. Ob sich die Geschichte geändert hat oder nicht, ist nicht von Interesse. Das Modell muss auf den Werten des letzten Indikatorbalkens aufgebaut werden. Wenn wir den Indikator für die gesamte Stichprobe berechnen, dann ist es wahrscheinlich, dass die Werte dieses Indikators NICHT die Werte des letzten Balkens während der Fensterbewegung enthalten werden.

Deshalb.

Wenn wir Modelle ON TIMES unterrichten wollen, sollten wir die Indikatorwerte verwenden, die von den Werten des letzten Balkens abgeleitet werden , wenn sich das Fenster entlang des Trainingsbeispiels bewegt.

PS.

Wenn Sie diese Methode für den Zickzack verwenden, erhalten Sie je nach Algorithmus des Zickzacks entweder Nullen oder Flecken oder Linien, die nichts mit dem Zickzack zu tun haben. Und keine Rede von Neuzeichnen und Vorausschauen - man kann es nicht gebrauchen, das ist alles.

 
Vladimir Perervenko:

Es gibt ein neues und sehr vielversprechendes Paket RKEEL, das als Gateway zu KEEL dient.

Viel Glück!

Können Sie wenigstens in zwei Worten sagen, was das Paket verspricht? oder drei )

SanSanych Fomenko:

Die hier gepostete Geschichte mit einem Modellanpassungsfehler von Null ist rein alchemistischer Natur..................

Ich habe kein Wort davon verstanden :)

 
mytarmailS:

Können Sie wenigstens in zwei Worten sagen, was das Paket verspricht? Oder drei )

===========================================================

Erklären:

1. Das Softwareprodukt "KEEL" ermöglicht die Erstellung, den Test und die Untersuchung verschiedener Modellklassen zur Lösung von Regressions-, Clustering- und Klassifizierungsproblemen ohne tiefe Kenntnisse der Sprache R. Es ist ein ähnliches Programm wie rattl, aber fortgeschrittener.

Das Programm ist mit grafischen vorgefertigten "Würfeln"/Modulen aufgebaut, schnell und übersichtlich, ähnlich wie KNIME, aber einfacher. Nach dem Prototyping wird das fertige Programm einfach mit dem Paket "RKEEL" nach R übertragen

Diese grafische Darstellung des Programms, das aus Modulen besteht, beschleunigt und erleichtert die Erstellung erheblich, insbesondere für Anfänger in der Programmierung, die meist Händler sind. Es gibt analoge Programme für R - "RedR" und "RAnaliticFlow", aber sie werden nur schlecht unterstützt.

2. Es wird eine große Anzahl von Modulen zur Vorverarbeitung und Transformation von Variablen angeboten, was gut ist.

3. Es werden viele originelle Algorithmen vorgeschlagen, die nicht in R enthalten sind.

Die Vielfalt der Methoden zur Wissensextraktion aus Daten ermöglicht es, Handelsaufgaben flexibler zu lösen.

Viel Glück!

 
Vladimir Perervenko:
Dankeschön
 
mytarmailS:

Was hast du gesagt? Ich verstehe kein Wort davon :)

Sie müssen die letzten Werte eintippen

for(i in ...)
{

    X29_1 <- TrendDetectionSMA(D[i:i+windows,])

    X29[i+windows] <- X29_1[windows]
}

Infolgedessen wird X29 aus LAST-Werten bestehen, vorletzte Werte werden nicht für die Neuzeichnung von Indikatoren korrigiert

 
SanSanych Fomenko:

Wenn wir Modelle AUF ZEITEN lernen wollen, sollten wir Indikatorwerte verwenden , die wir vom letzten Balken erhalten, während wir das Fenster entlang der Trainingsstichprobe bewegen.

Ich habe es selbst gemacht. Sehen Sie sich den Code an, den ich vor ein paar Seiten angehängt habe, und seine Beschreibung.

Das Problem ist, dass diese 6 Indikatoren NA-Ergebnisse für den letzten Balken liefern. Wenn Sie dann bei der Analyse der nachfolgenden Balken diesen NA-Wert in einen anderen Wert ändern, wird das Ergebnis der vorherigen Balken entsprechend den neuen Daten geändert (im allgemeinen Sprachgebrauch: "Reflipping").
Das Ergebnis ist, dass wir dem Modell die gleichen Ergebnisse beibringen, aber wenn wir eine Vorhersage mit neuen Daten erhalten wollen, werden uns diese Indikatoren NA anstelle der benötigten Werte anzeigen, was inakzeptabel ist.

Wenn Sie diese Indikatoren analysieren möchten, finden Sie hier eine rdata-Datei mit den Indikatorwerten, die in einem gleitenden Fenster ermittelt wurden. Die Werte dieser sechs Redrawing-Indikatoren werden nicht für den letzten, sondern für den vorletzten Balken genommen, um etwas anstelle von NA zu haben.

Dateien:
 
Dr. Trader:

Ich habe es selbst gemacht. Sehen Sie sich den Code an, den ich vor ein paar Seiten angehängt habe, und seine Beschreibung.

Das Problem ist, dass diese 6 Indikatoren das Ergebnis NA am letzten Balken liefern. Und dann - bei der Analyse der nachfolgenden Balken - ändern Sie diesen NA-Wert in einen anderen, wobei das Ergebnis der vorherigen Balken entsprechend den neuen Daten geändert wird (im allgemeinen Sprachgebrauch - "Reflipping").
Das Ergebnis wird sein, dass wir das Modell mit denselben neu gezeichneten Ergebnissen unterrichten, und wenn wir eine Vorhersage mit neuen Daten machen wollen, werden uns diese Indikatoren NA anstelle der benötigten Werte anzeigen, was inakzeptabel ist.

Wenn Sie diese Indikatoren analysieren möchten, finden Sie hier eine rdata-Datei mit den Indikatorwerten, die in einem gleitenden Fenster ermittelt wurden. Die Werte dieser sechs Indikatoren wurden nicht für den letzten Balken, sondern für den vorletzten Balken genommen, so dass es etwas statt NA gab.

Wir verstehen es also nicht: Wir brauchen uns nicht damit zu befassen. Erinnern Sie sich an den letzten Takt. Wenn es sich um NA handelt, dann gibt es keinen Wert mehr. Das ist übrigens genau der Wert von ZZ auf dem letzten Balken.
 
Eine Überprüfung von Deep Learning in R stieß auf
 
SanSanych Fomenko:
Ich habe einen Bericht über Deep Learning in R gefunden

Ein oberflächlicher Artikel mit vielen Ungenauigkeiten. Offensichtlich von Studenten als Semesterarbeit geschrieben.

Ich wollte einen Kommentar schreiben, konnte aber nicht finden, wo ich ihn abgeben sollte.

Es ist gut als populäre Rezension, aber nicht als Leitfaden.

Viel Glück!

 

warum sind alle so auf Modelle fixiert? warum spricht niemand über Vorzeichen? warum spricht niemand über Nicht-Stationarität? Warum versucht niemand, diese Probleme zu lösen? Warum denkt niemand darüber nach, was die Preise treibt?

Wenn Sie eine Stochastik verwenden, spielt es keine Rolle, welches Modell Sie verwenden, ob es sich um ein gewöhnliches KNN oder ein hochentwickeltes tiefes Netz handelt,die Genauigkeit liegt bei 51-53 %, unabhängig davon, wie tief es ist. Was nützen diese Modelle, wenn die Eingaben unsinnig sind? Nein, aber 95 % der Aufmerksamkeit gilt den Modellen. Für mich persönlich sind Modelle der letzte Schritt im System, und sie machen nur 2 % der Arbeit aus.

In der Zwischenzeit werde ich meine Ergebnisse mitteilen...

Mein extremer Algorithmus ....

Bislang keine MO im klassischen Sinne, aber Anerkennung ist vorhanden.

Das Entscheidungssystem ist halbautomatisch.

In der ersten Phase erkennt der Algorithmus einige Formationen und gibt sie an mich weiter.

Auf der zweiten Stufe bewerte ich mit meinen Augen, was es berechnet hat, und treffe eine Handelsentscheidung. Obwohl es sehr leicht und eindeutig bewertet, kann ich die zweite Stufe noch nicht in den automatischen Erkennungsmodus übertragen, so dass das System im Wesentlichen halbmanuell ist

Das System ist intraday, Handel ist auf 5M Zeitrahmen, ein Tag gibt es etwa 20 Trades im Durchschnitt, in 15 Handelstagen war nur zwei Tage mit einem kleinen Verlust

Das rote Rentabilitätsdiagramm ist dasselbe wie das schwarze, jedoch unter Berücksichtigung der Provision

й

Übertragung von Geschäften auf eine technische Analysesoftware, um ein flexibleres und tieferes Verständnis zu ermöglichen

р

Und ich werde mehr über Nicht-Stationarität hinzufügen, schauen Sie sich diese wilde Spitze in der Volatilität, die ich mit einem Pfeil vor ein paar Tagen markiert, ich sage Ihnen mit Zuversicht, dass alle Systeme, die auf feste Parameter gehandelt, sie alle zerquetscht wurden, in der Tat diese ganze Volatilität ist ihre Stop-Loss, aber ich schweife von diesem ....

Was ich also sagen will, ist, dass das Entscheidungssystem, um mehr oder weniger angemessen auf Marktbewegungen zu reagieren, entweder ständig in seinen Parametern entsprechend dem Markt korrigiert werden sollte(was ich einmal über Fourier gesagt habe) oder das System sollte generell nicht parametrisch sein, sonst weiß ich nicht, wie ((

Und kein Raster wird helfen, egal wie tief es ist, wenn Sie Stochastik verwenden

л

Viel Glück!

Grund der Beschwerde: