Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 92

 
Eidechse_:
OK)))) aber lesen Sie die Bedingungen sorgfältig -
post" Ergebnisse in % (erfolgreich vorhergesagte Fälle) für beide Stichproben (train = xx%, test = xx%). Es müssen keine Methoden und Modelle angegeben werden, nur Zahlen".
Wir warten auf weitere Ergebnisse. Ich frage mich, welche Schlussfolgerungen Mihail Marchukajtes ziehen wird.

mein Ergebnis (wenn Sie es wünschen, werde ich Ihnen auch die Methode nennen):

# predict with best models

glm_predict_train <- as.data.frame(predict(glm_obj

, newx = training

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_train$observed <- train_y

table(glm_predict_train[, 2], glm_predict_train[, 1])

table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

# validate with best models

glm_predict_validate <- as.data.frame(predict(glm_obj

, newx = validating

, type = "class"

, s = best_models$bestTune$lambda))

glm_predict_validate$observed <- validate_y

table(glm_predict_validate[, 2], glm_predict_validate[, 1])

table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

56% in Ausbildung:

> table(glm_predict_train[, 2], glm_predict_train[, 1])

      

       down  up

  down  333 181

  up    256 230

> table(glm_predict_train[, 2], glm_predict_train[, 1]) / nrow(training)

      

        down    up

  down 0.333 0.181

  up   0.256 0.230

52% bei der Prüfung:

> table(glm_predict_validate[, 2], glm_predict_validate[, 1])

      

       down  up

  down  332 173

  up    309 186

> table(glm_predict_validate[, 2], glm_predict_validate[, 1]) / nrow(validating)

      

        down    up

  down 0.332 0.173

  up   0.309 0.186

 
Wie auch immer, der maximale Verallgemeinerungsgrad liegt bei 53%, so..... Gelegentlich Garbage in Garbage out, d.h. Müll.... Ich kann es im Test nicht überprüfen, weil Excel keine langen Formeln unterstützt. Ich möchte nicht dafür in MKUL schreiben, wenn das Modell von normaler Qualität wäre, würde ich es versuchen, aber mit einem solchen Prozentsatz der Verallgemeinerung, ich denke, das Ergebnis wird nicht sehr gut auf den Test sein...
 
mytarmailS:
Ich verstehe nicht, wie diese "Vorhersagbarkeit" berechnet wird und ob sie überhaupt Sinn macht, wenn das Ziel nicht berücksichtigt wird.

Es gibt Formeln, um abzuschätzen, wie verrauscht das Signal ist, oder umgekehrt. Wie und was diese Formeln berechnen, weiß nur der Autor, wir können nur darauf vertrauen, dass er weiß, was er tut.
Die Quintessenz ist ganz einfach: Wenn die Prädiktoren selbst kein "Rauschen" sind, ist es einfacher, mit ihnen etwas vorherzusagen. Und wenn man sie irgendwie verarbeitet, kann man ein noch stabileres Signal erhalten. Ein stabiles Signal ist eine gute Grundlage für eine Prognose.

Sie können die Prädiktoren sogar schnell selbst schätzen, indem Sie die Funktion Omega() dieses Pakets verwenden und die Werte eines bestimmten Prädiktors (eine Spalte aus der Trainingstabelle) darauf anwenden. Das Ergebnis ist 0% - Rauschen und der Prädiktor ist nutzlos. 100% - alles ist gut, der Prädiktor kann verwendet werden.
Ich vermute, dass wir nicht die reinen Indikatorwerte in die Funktion einspeisen sollten, sondern deren Inkrement, z.B. für einen gleitenden Durchschnitt - c(MA[0]-MA[1], MA[1]-MA[2], MA[2]-MA[3], usw.).

Zu den Zielwerten: Ja, sie werden in dem Paket nicht verwendet. Dieses Paket kann nichts vorhersagen. Sie bestimmt nur irgendwie, welchen Prädiktoren man trauen kann und welchen nicht, und erstellt auf deren Grundlage weitere neue. Die Auswahl der Zielvariablen und das Training des Vorhersagemodells müssen unterschiedlich gehandhabt werden. Es ist logisch, dass manche Zielvariablen besser und manche schlechter vorhergesagt werden können.
Die Zielvariable ist für jedes Paket ein Problem. Es ist nicht sicher, dass die verwendete Zielvariable mit den verfügbaren Prädiktoren überhaupt vorhergesagt werden kann. Zum Beispiel kann ich als Zielvariable entweder "Preisanstieg/-rückgang über den nächsten Balken" oder "Anstieg/Abfall im Zickzack" verwenden. Ich möchte lernen, wie man neue Zielvariablen so erstellt, dass sie am besten zu den verfügbaren Prädiktoren passen. Wer weiß, vielleicht kann ich mit meinen Prädiktoren eine Wohnung perfekt vorhersagen, aber ich werde es nie wissen, weil ich es nicht versucht habe.

 
Soweit ich weiß, liest niemand die Allgemeinen Geschäftsbedingungen (jede Datenmanipulation ist erlaubt), also werde ich mich nicht quälen. Im Grunde ist alles ganz einfach.
Ich muss nur die Verzögerungen aus A6 nehmen, eine einfache Formel anwenden, die sieben weniger als ein Fünftel beträgt, und 100 % für beide Stichproben erhalten. Ich danke Ihnen allen. Viel Glück...
 
Eidechse_:
Soweit ich weiß, liest niemand die Allgemeinen Geschäftsbedingungen (jede Datenmanipulation ist erlaubt), also werde ich mich nicht quälen. Im Grunde ist alles ganz einfach.
Sie brauchen nur die Verzögerungen aus A6 zu nehmen, eine einfache Formel anzuwenden, die weniger als ein Fünftel beträgt, und erhalten 100 % für beide Stichproben. Ich danke Ihnen allen. Viel Glück...
Wo ist also der Haken? Auch ich kann eine Ausgangsvariable in einem solchen Haufen von Eingabemüll kodieren. Das würden Sie nie erraten. Ich weiß immer noch nicht, was das Ganze soll.
 
Mihail Marchukajtes:
Wo bleibt da der Spaß? Ich kann auch eine Ausgangsvariable in einem Haufen von Eingabemüll kodieren. Sie werden es nicht erraten können. Ich weiß immer noch nicht, wozu das gut sein soll.
Er machte uns darauf aufmerksam, dass die Menge der verwendeten Daten für eine Vorhersage nicht immer ausreichend ist. Wenn wir uns zum Beispiel auf 9 Takte beschränken, könnten wir wichtige Informationen aus weiter entfernten Takten verpassen. Und auch, dass wir einen Prädiktor nicht bewerten können, ohne seine Wechselwirkungen mit anderen Prädiktoren zu berücksichtigen.
 
Mihail Marchukajtes:
Wo bleibt da der Spaß? Ich kann auch eine Ausgangsvariable in einem Haufen von Eingabemüll kodieren. Sie werden es nicht erraten können. Ich verstehe immer noch nicht, was das soll.
Dass man das Erdhörnchen nicht sehen kann, aber man kann es.)
Komm, lass es uns versuchen. Nur eine einfache.
 
Eidechse_:
Indem man das Gopher nicht sieht, aber es ist da)))
Komm, wir probieren es mal aus. Nur eine einfache.
Komm schon, mir fällt schon was ein....
 
Zum Beispiel diese Datei. Der Chitso-Zug braucht keinen Test zu machen. Reshetovs Optimierer zeigt Müll oder 56%, aber der Gopher ist auch da. Wer findet....??? Wirklich nicht sehen, den Sinn dieser Spiele, wenn die Ausgabe von der Umwandlung der Eingabe gemacht wird, hier und das Netzwerk wird nicht benötigt werden.... Das war's also....
 
Mihail Marchukajtes:
Also zum Beispiel diese Datei. Der Chitso-Zug braucht keinen Test zu machen. Reshetovs Optimierer zeigt Müll oder 56%, aber der Gopher ist auch da. Wer findet....??? Ich sehe wirklich keinen Sinn in diesen Spielen, wenn die Ausgabe durch die Umwandlung der Eingabe erfolgt, ist das Netzwerk nicht mehr nötig entweder.... so....
Es kotzt dieses Forum an, dass ein einfaches rar-Archiv nicht angehängt werden kann.... Es ist erbärmlich in einem Wort....
Dateien: