Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading

Vladimir Perervenko 2018.05.19 20:44 #9301

Dr. Trader:

Genetics versucht, die richtigen Parameter für eine begrenzte Anzahl von Funktionsaufrufen zu finden. Durch die Verringerung der Anzahl der Varianten dieses Parameters (30 anstelle von 200) kann der Genetiker den Bereich von 1 bis 30 genauer untersuchen. Wenn Sie die spezifischen Grenzen für die Ermittlung eines Modellparameters kennen, ist es besser, wenn Sie diese Information gleich an den Genetiker weitergeben.

Alternativ dazu:

Fügen Sie diese Zeile (die grüne) in den Code ein, dann hat der Genetiker 500 Individuen in der Population anstelle der standardmäßigen 50. Und sie wird 10 Mal mehr Modelle testen können (aber auch die Laufzeit des Skripts wird sich um das 10-fache erhöhen), da sie so viele Kombinationen von Modellparametern wie möglich ausprobieren kann. Selbst bei maximal 200 Neuronen denke ich, dass die Genetik auch mit 0,85 ein besseres Ergebnis erzielen kann, oder zumindest in die Nähe davon kommt.

Ich kann nicht verstehen, von welcher Genetik Sie sprechen. In ELM gibt es keine Genetik. Schauen Sie sich einfach die ELM-Theorie oder die Beschreibung des elmNN-Pakets an:

"Der ELM-Algorithmus ist eine alternative Trainingsmethode für SLFN ( Single Hidden Layer Feedforward Networks ), die weder eine iterative Abstimmung noch die Einstellung von Parametern wie Lernrate, Momentum usw. erfordert, die bei den traditionellen gradientenbasierten Lernalgorithmen ( wie Backpropagation ) ein Problem darstellen.

Das Training eines SLFN mit ELM ist ein dreistufiges Lernmodell:

Bei einer Trainingsmenge P = {(xi , ti )|xi E R , ti E R , i = 1,..., N}, einer versteckten Knotenausgabefunktion G(a, b, x) und der Anzahl der versteckten Knoten L

1) Weisen Sie den versteckten Knoten zufällig Parameter (ai , bi ) zu, i = 1,..., L. Das bedeutet, dass die Bogengewichte zwischen der Eingabeschicht und der versteckten Schicht und der versteckten Schicht zufällig erzeugt werden.

2) Berechnen Sie die Ausgabematrix H der verborgenen Schicht mit Hilfe einer der verfügbaren Aktivierungsfunktionen.

3) Berechnen Sie die Ausgangsgewichte B: B = ginv(H) %*% T ( Matrixmultiplikation ), wobei T der Ziel-Output der Trainingsmenge ist.

ginv(H) ist die verallgemeinerte Moore-Penrose-Inverse der Ausgabematrix H der verborgenen Schicht. Sie wird von der Funktion ginv des MASS-Pakets berechnet.

Nachdem das SLFN trainiert wurde, ist die Ausgabe eines generischen Testsatzes einfach Y = H %*% B (Matrixmultiplikation). Wesentliche Merkmale:

- Die Lerngeschwindigkeit von ELM ist extrem hoch.

- Im Gegensatz zu traditionellen gradientenbasierten Lernalgorithmen, die nur für differenzierbare Aktivierungsfunktionen funktionieren, funktioniert ELM für alle begrenzten, nicht konstanten, stückweise kontinuierlichen Aktivierungsfunktionen.

- Im Gegensatz zu traditionellen gradientenbasierten Lernalgorithmen, die mit verschiedenen Problemen wie lokalen Minima, ungeeigneter Lernrate und Überanpassung usw. konfrontiert sind, neigt ELM dazu, die Lösungen ohne solche trivialen Probleme zu erreichen.

- Der ELM-Lernalgorithmus sieht viel einfacher aus als andere gängige Lernalgorithmen: neuronale Netze und Support-Vector-Maschinen".

Selbst bei einer geringen Anzahl von Neuronen ist es unmöglich, zwei identische neuronale Netze zu erhalten. Sie haben den Schwellenwert für die Übertragung von Dauerleistungen in eine Klasse falsch definiert. Schwellenwert = 0,5 ist der schlechteste Fall. Annehmbar = Mittelwert/ Es gibt aber auch fortgeschrittenere.

Viel Glück!

Machine learning in trading: Neuronales Netz Einsatz neuronaler Netze im

СанСаныч Фоменко 2018.05.19 20:53 #9302

Maxim Dmitrievsky:

Oh, das wird etwas zum Lesen sein, ich hatte vergessen, was es ist. Oder besser gesagt, ich habe den Unterschied zwischen GBM und XGboost vergessen... oder nicht gewusst

gbm kann jedes Modell verstärken, xgb scheint auf Bäumen zu stehen

Ich weiß, dass die Aufstockung etwas besser ist als die Absackung, durch die der Wald aufgebaut wird. Ich weiß nicht, ob ich umschulen soll.

Der Neustart hat NICHTS mit dem Modelltyp zu tun.

Ein Modell wird in zwei Fällen neu trainiert:

das Vorhandensein von Rauschprädiktoren ist ein großes Problem und wird NUR durch die Anpassung von Prädiktoren gelöst
Überanpassung des Modells - "Optimierung" seiner Parameter, in der Regel anhand einer kleinen Stichprobe. Diese Art der Überanpassung wird durch die Erfahrung der Entwickler gelöst.

Multi-Timeframe-Indikatoren Das Problem der Umstellung Liga der Handelssysteme. Machen

[Gelöscht] 2018.05.19 20:58 #9303

SanSanych Fomenko:

SanSanych, hör auf, hysterisch zu werden

Mihail Marchukajtes 2018.05.19 21:01 #9304

Vladimir Perervenko:

Ich kann nicht verstehen, von welcher Genetik Sie sprechen. Im ELM gibt es keine Genetik. Schauen Sie sich einfach die ELM-Theorie oder die Beschreibung des Pakets elmNN an: