Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 555

 
Maxim Dmitrievsky:

Ich weiß also nicht, was ich in diesem Leben glauben soll... alles muss doppelt geprüft werden.


Benchmarks sind die Rettung)))

Verschiedene Umbauten und Kürzungen. Das obere Bild ist das Rohdatenbild.

train = rms sample with light sql. test = OOS. time = rms time in sec.


 
Was die Emissionen in Datensätzen betrifft, so könnte der Markt diese Methode anwenden.
 

Das frage ich mich manchmal in diesem Forum. Alles ist ruhig und langweilig. Und plötzlich tauchen einige Leute wie Vladimir oder Vizard_ oder der höchst verdächtige Podotr auf und beginnen, Meisterkurse zu geben. Wer sind sie? Bitte zeigen Sie alle Ihre Pässe und Bildungsabschlüsse vor! :))))

 
SanSanych Fomenko:

Es sollten nur Prädiktoren verwendet werden, die eine BEZIEHUNG zur Zielvariablen haben. Dabei spielt es keine Rolle, ob "linear" oder "nichtlinear" nichts mit dem sehr präzise formulierten "in Beziehung stehen" zu tun hat.

dies und alles andere im Text ist klar, aber was hat die Korrelation des Attributs mit dem Ziel in einem inhärent nicht linearen Modell damit zu tun?

Ich habe darüber geschrieben, warum es im Regressionsmodell benötigt wird, aber nicht in der Klassifizierung, weil es nicht das Ziel ist, sondern Klassen... gehen Sie tiefer, worüber ich schreibe :)

 
Maxim Dmitrievsky:

dies und alles andere im Text ist klar, aber was hat die Korrelation des Attributs mit dem Ziel in einem inhärent nicht linearen Modell damit zu tun?

und ich habe geschrieben, warum es im Regressionsmodell benötigt wird, aber nicht in der Klassifizierung, weil es nicht das Ziel ist, sondern Klassen... lesen Sie genauer, worüber ich schreibe :)


Ich brauche nicht tiefer zu lesen - ich verstehe dich sehr gut, aber du verstehst mich überhaupt nicht.

Ich schreibe über Übertraining (Überanpassung) - dies ist der Hauptfeind aller Klassifizierungsmodelle. Das Verhalten von überangepassten Modellen wird NICHT in der Zukunft bestimmt.

Um dieses Übel zu bekämpfen, sehe ich zwei Möglichkeiten:

1. den Eingangssatz der Prädiktoren vom Rauschen zu befreien

2. sorgfältige Prüfung.

All dies schreibe ich auf der Grundlage meiner eigenen Berechnungen, ich versichere Ihnen, dass es sich um ein sehr großes Volumen handelt, das ich seit über einem Jahr bearbeite.

Ich bin zu faul, um zu suchen und dann einen lesbaren Beitrag zu verfassen, da ich niemanden von irgendetwas überzeugen will.


PS.

Sie beharren immer wieder auf der Unschädlichkeit und sogar Nützlichkeit von Geräuschvorhersagen - Sie sind nicht der Erste, es gibt viele solcher Leute, man nennt sie Astrologen.

 
SanSanych Fomenko:

Sie beharren darauf, dass Geräuschvorhersagen harmlos und sogar nützlich sind - Sie sind nicht der Erste, es gibt viele solcher Leute, man nennt sie Astrologen.


Wo habe ich so etwas geschrieben?

 
Maxim Dmitrievsky:

Wo habe ich das geschrieben?

Lesen Sie Ihren Beitrag noch einmal.

ну это и все далее по тексту понятно, но причем здесь корреляция признака с целевой в изначально нелинейной модели

а я написал зачем она (корреляция) нужна в случае регрессионной, а в классификации нет, потому что там вообще не целевая а классы



Es stellt sich heraus, dass ich spekuliert habe, und ich denke, dass unsere Meinungsverschiedenheit auf folgendem beruht:

Sie sind gegen die Korrelation und ich habe nie über die Korrelation zwischen Prädiktor und Zielvariable geschrieben.

Das nennt man Reden.

Ich habe immer geschrieben: Der Prädiktor muss mit der Zielvariablen in Beziehung stehen . Ich habe nie Korrelation, lineare oder nicht-lineare Regression im Sinne des Wortes"Beziehung" gemeint. Darüber hinaus sind alle Algorithmen zur Vorhersage der "Wichtigkeit", die Klassifizierungsalgorithmen ausgeben, für mich nicht zufriedenstellend.


Betrachten Sie mein Beispiel: Ziel: Geschlecht mit den Klassen männlich/weiblich und Prädiktor: Kleidung mit dem Wert von Röcken/Hosen.

 
SanSanych Fomenko:

Lesen Sie Ihren Beitrag noch einmal.



Es stellt sich heraus, dass ich spekuliert habe und ich denke, dass unsere Meinungsverschiedenheit auf folgendem beruht:

Sie sind gegen die Korrelation und ich habe nie über die Korrelation zwischen Prädiktor und Zielvariable geschrieben.

Das nennt man Reden.

Ich habe immer geschrieben: Der Prädiktor muss mit der Zielvariablen in Beziehung stehen . Ich habe nie Korrelation, lineare oder nicht-lineare Regression im Sinne des Wortes"Beziehung" gemeint. Darüber hinaus sind alle Algorithmen zur Vorhersage der "Wichtigkeit", die Klassifizierungsalgorithmen ausgeben, für mich nicht zufriedenstellend.


Betrachten Sie mein Beispiel: Ziel: Geschlecht mit den Klassen männlich/weiblich und Prädiktor: Kleidung mit dem Wert von Röcken/Hosen.


Ja, es wird nur manchmal geschrieben, dass die Merkmale mit dem Ziel genau korrelieren sollten, d. h. es sollte eine lineare Abhängigkeit bestehen.

und ich schrieb, dass es bei Regressionsmodellen sinnvoll sein kann, dass mindestens 1 Attribut linear mit dem Ziel in Beziehung steht

was die "Beziehung" betrifft, stimme ich natürlich zu :)

 
Eidechse_:

Benchmarking-Rettung)))

Verschiedene Umbauten und Kürzungen. Der obere Teil sind Rohdaten.

train = r.sampling mit Lichtquadrat test = OOS. time = r.time in sec.



selbst ein gutes Ergebnis bei einem Forward ist nicht immer ein Vorbote für einen späteren Gewinn auf der Karte :)

Cross-Validierung wurde bereits oben erwähnt. Ich denke, das ist der beste Weg, um zu gehen

 
Überlernen - Tritt bei großen Gewichten (~10^18) auf, eine Folge der Multikollinearität, die zu einem instabilen A(x, w)-Modell führt.


Überlernen wird behandelt durch: frühzeitiges Beenden des Modelllernens, Einschränkung des Wachstums der Gewichte (L1(Lasso) und L2-Regularisierung), Einschränkung der Verbindungen im Netzwerk (Dropout), auch mögliche Anwendung von Straffunktionen (ElacticNet, Lasso).

Und die L1-Regularisierung führt zur Auswahl von Merkmalen, da sie sich auf deren Gewichtskoeffizienten konzentriert.

Die Entfernung von "verrauschten" Merkmalen ist die Auswahl von Merkmalen. Hierfür gibt es Methoden. Dies ist nicht immer vorteilhaft für das Modell, weshalb manchmal eine L2-Regularisierung verwendet wird (um das Problem der Multikollinearität zu lösen).


SanSanych Fomenko, Ihre Aussage über das Verhältnis von Merkmalen und Zielen ist ein wenig anmaßend. Denn wie kann man etwas behaupten, das noch nicht bewiesen ist; dafür ist das MO-Modell ja da. Ein gebautes und funktionierendes Modell liefert eine Schätzung, dass es eine Beziehung mit "so-und-so" Genauigkeit gibt.

Und das Beispiel mit den Hosen und Röcken zeigt, wie wenig der Forscher über das Untersuchungsgebiet weiß, denn bei einem solchen Modell werden wertvolle Informationen über den Ort, die Jahreszeit, den Längen- und Breitengrad des Wohnortes usw. weggelassen.


Bevor Sie ein Modell bauen, sollten Sie das zu untersuchende Gebiet verstehen, denn der Teufel steckt, wie das Genie, im Detail.


PS. Streit zu haben ist eine gute Sache. Sie helfen, Standpunkte zu verfeinern, lehren Sie, gute Argumente für die Thesen zu liefern, und führen zu einer gemeinsamen Wahrheit.

Grund der Beschwerde: