Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3167

 
mytarmailS #:

Haben Sie diese Zahlen jemals selbst gesehen?

0,99 Züge/Test, wobei das Modell auf ein paar Iterationen abgeschnitten wurde. Es bleiben nur wenige Regeln übrig, die die Klassen gut vorhersagen.

 
Maxim Dmitrievsky #:

0,99 train/test, wobei das Modell auf ein paar Iterationen reduziert wurde. Es bleiben nur wenige Regeln übrig, die die Klassen gut vorhersagen.

TP=10 und SL=1000 ?)

 
Forester #:

TP=10 und SL=1000 ?)

Nein, es macht Spaß, wenn Sie viele Trades machen wollen.

bei jedem Bar neue eröffnen
 
Vladimir Perervenko #:

Was meinen Sie mit "hausgemacht"? Es gibt eine theoretische Rechtfertigung, einen guten Artikel. Es gibt ein Paket namens RLTv3.2.6. Es funktioniert ziemlich gut. Achten Sie auf die Version.


Viel Glück

Meiner Meinung nach nicht hausgemacht, wenn die folgenden Bedingungen mit einem konkreten Beispiel erfüllt sind.

Ursprünglich, jetzt viel weniger, war die Seite voll von selbstgebastelten "Genies", die in der Küche sitzend etwas erfunden, Begriffe aus dem Kopf verwendet und angefangen haben zu "forschen", und nicht nur "forschen", sondern bestehende und allgemein anerkannte Dinge zu widerlegen.

All diese Leute wissen nicht, dass ihr selbstgebastelter Code keinen Pfennig wert ist, da er KEINE theoretische Grundlage hat, die in seriösen Fachzeitschriften veröffentlicht und dann, oft jahrelang, von Leuten mit der entsprechenden Ausbildung diskutiert wird. Dann wird der Code geschrieben und von einer großen Zahl von Anwendern getestet, und erst dann ist er für den industriellen Einsatz geeignet.

Es hat keinen Sinn, über lokale "Genies" zu diskutieren.

Aber katbust.

Vergleichen wir die Dokumentation zu katbust und XGBoost, um die Hinterhältigkeit einer nicht zum Kerngeschäft gehörenden Organisation und einer professionellen, sehr ähnlichen Entwicklung zu verstehen.

 
Maxim Dmitrievsky #:
Und der wichtigste Selfmademan ist Breiman, weil er nicht in R geschrieben hat. Er ist so ein kolkhoznik.

Lernen Sie R, damit Sie nicht völlig unwissend aussehen: praktisch alle Pakete in R sind NICHT in R geschrieben. Normalerweise ist es C++ oder Fortran, und R ist nur der Zugang. Deshalb funktionieren rechenintensive Algorithmen in R nicht schlechter als in C++.

 
СанСаныч Фоменко #:

Lernen Sie R, damit Sie nicht völlig unwissend aussehen: Fast alle Pakete in R sind NICHT in R geschrieben. Normalerweise ist es C++ oder Fortran, und R ist nur der Zugang. Deshalb funktionieren rechenintensive Algorithmen in R nicht schlechter als in C++.

Nein, das höre ich zum ersten Mal.

Gibt es noch weitere erhellende Informationen? )

Ich bin schon beim Catbuster angelangt... )))

 
mytarmailS Dimensionalitätsreduktion, das Modell wird wiederholbarer.

und die letzte vielleicht dekorative Note


Ich frage mich, wie das MO auf solche Daten trainiert wird?

Dies ist ein Testmuster.

Haben Sie solche Zahlen jemals selbst gesehen?




Höchstwahrscheinlich handelt es sich um eine Umschulung, da sie mit absoluten Preiswerten verbunden ist.

 

Wenn Sie eine Funktion schreiben, die die Etiketten neu beschriftet und sie für Ihre Merkmale berechenbarer macht, wird das Modell stabiler.

Wenn Sie einen kleinen Datensatz haben, können Sie es für die Überprüfung fallen lassen, und stellen Sie sicher, auf Ihre Daten (oder frustriert werden).

Für die Python-Fans:

    c = coreset[coreset.columns[1:-4]] // ваш датасет без меток. Нужно брать только трейн/тест данные, на остальных не делать кластеризацию, иначе подгонка
    kmeans = KMeans(init='k-means++', n_clusters=clusters).fit(c) // кол-во кластеров - гиперпараметр
    coreset['clusters'] = kmeans.predict(c)
    mean_labels = coreset.groupby('clusters')['labels'].apply(lambda x: x.mean()) // считаем среднее по меткам каждого кластера
    coreset['labels'] = coreset.apply(lambda row: 0 if mean_labels[row['clusters']] < 0.5 else 1, axis=1) // если среднее больше 0.5, то для всех элементов кластера ставим метку 1 и наоборот
Das Modell ist stabiler, wenn die Cluster repräsentativ sind. So durch Brute-Force-Methode die Anzahl der Cluster und von denen Chips zu clustern.
 
Aleksey Nikolayev #:

Soweit ich weiß, sind die Befehle für die Arbeit mit R in einer interaktiven Sitzung auskommentiert. Zuerst lädt man das gesamte Skript, um die Funktionen zu definieren, und dann die Befehle Zeile für Zeile, wobei man nach jedem einzelnen die Eingabetaste drückt. Dies ist wahrscheinlich so etwas wie ein Standard in wissenschaftlichen Publikationen - verlassen Sie sich nur auf die Kommandozeile und vermeiden Sie Umgebungen wie Rstudio.

Der Kürze halber habe ich CTree aus den Datensammlungs- und Klassenvorlagen aufgerufen, was ebenfalls unvermeidlich zu sein scheint.

Die Erkennung von Anomalien ist dort in den Zielen enthalten - es wird danach gesucht, wo Brände anomal häufig auftreten.


PS. Vor einiger Zeit habe ich Ihnen über die Verwendung der Poisson-Verteilung geschrieben, und hier ist sie zum Arbeitscode entwickelt.

Ich habe noch nicht alles ausprobiert - ich hänge an einer meiner Aufgaben fest.

Ich werde auf jeden Fall versuchen, es mit meinen eigenen Daten durchzuführen. Ich bin dabei, verschiedene Lösungen zu diesem Thema zu sammeln.

Was die Pausson-Verteilung betrifft, so ist sie theoretisch interessant, aber wenn ich mir die Daten ansehe, die Abfolge, sagen wir, es gibt vielleicht 20 Nullen in einer Reihe, und dann eine Mischung aus Nullen und Einsen, und diese Auslassungen sind signifikant, scheinen sie mit der Verteilung unvereinbar zu sein.

 
Aleksey Vyazmikin #:

Was die Pausson-Verteilung betrifft, so ist sie theoretisch interessant, aber wenn ich mir die Daten ansehe, die Sequenz, sagen wir, es gibt vielleicht 20 Nullen in einer Reihe, und dann eine Mischung aus Nullen und Einsen, und diese Auslassungen sind signifikant, sie scheinen mit der Verteilung unvereinbar zu sein.

Die Idee besteht darin, die Beispiele in Gruppen aufzuteilen, die sich voneinander unterscheiden und innerhalb derer eine Homogenität besteht. Es ist keineswegs sicher, dass dies aufgrund bestimmter Merkmale möglich ist. Es ist auch nicht sicher, dass dies bei allen der Fall ist, z. B. wegen der Nicht-Stationarität.

Ich habe nicht vor, diesen Artikel im Detail zu studieren, da er nur das Thema berührt, an dem ich interessiert bin. CHAID ist ein bisschen näher dran, aber nicht ganz dasselbe.

Grund der Beschwerde: