Diskussion zum Artikel "Gaußsche Prozesse im maschinellen Lernen: Regressionsmodellierung in MQL5"

 

Neuer Artikel Gaußsche Prozesse im maschinellen Lernen: Regressionsmodellierung in MQL5 :

Wir werden die Grundlagen von Gauß-Prozessen (GP) als probabilistisches Modell des maschinellen Lernens behandeln und deren Anwendung auf Regressionsprobleme anhand synthetischer Daten veranschaulichen.

Gauß-Prozesse (GPs) sind ein bayessches, nichtparametrisches Modellierungsverfahren, das im maschinellen Lernen häufig für Regressions- und Klassifizierungsprobleme eingesetzt wird. Im Gegensatz zu vielen herkömmlichen Modellen, die lediglich Punktprognosen liefern, erzeugen GPs eine vollständige Wahrscheinlichkeitsverteilung für die Prognosewerte. Dadurch kann das Modell nicht nur Punktvorhersagen liefern, sondern auch Unsicherheitsschätzungen, die in der Regel als Konfidenzintervalle ausgedrückt werden. Dies ist ein charakteristisches Merkmal des bayesianischen Ansatzes, bei dem Vorwissen mit beobachteten Daten kombiniert wird, um eine Vorhersageverteilung zu erhalten.

GPs gehören zur Klasse der Kernel-Methoden, die Kovarianzfunktionen (oder Kernel) verwenden, um Abhängigkeiten zwischen Daten zu modellieren. Die Möglichkeit, verschiedene Kernel zu kombinieren (z. B. durch Addition oder Multiplikation), ermöglicht eine gewisse Flexibilität bei der Beschreibung möglicher Vorhersagefunktionen. Jeder Kernel verfügt über eigene Hyperparameter, die optimiert werden müssen, um eine maximale Modellgenauigkeit zu erreichen.

In diesem Artikel werden wir den Prognoseprozess unter Verwendung eines Regressionsmodells auf Basis eines GPs eingehend untersuchen und dabei deutlich aufzeigen, wie GPs es ermöglichen, nicht nur genaue Prognosen zu erstellen, sondern auch deren Unsicherheit umfassend zu bewerten.


Autor: Evgeniy Chernish

 

Interessant.

Aus irgendeinem Grund werden die meisten Bilder nicht geladen.

 
Bitte überprüfen Sie das noch einmal
 
Rashid Umarov #:
Bitte überprüfen Sie das noch einmal
Danke, jetzt sind alle Bilder geladen.
 
Wir freuen uns schon sehr auf die Fortsetzung.
 
Es besteht ein enger Zusammenhang zwischen den Gaußschen Prozessen für die Regression und dem Wiener-Khinchin-Theorem https://danmackinlay.name/notebook/wiener_khintchine.html https://www.numberanalytics.com/blog/wiener-khinchin-theorem-guide Es wäre toll, wenn Sie in dieser Richtung weitermachen könnten, um uns aufzuklären.
[Gelöscht]  
Ein mathematisch elegantes Verfahren, das sich jedoch – genau wie beispielsweise die Support-Vektor-Methode – als Nischenverfahren herausgestellt hat. In der Praxis hört man überhaupt nicht, dass es irgendwo angewendet wird :) Alle Modelle auf Basis von Gaußschen Mischungen arbeiten bei großen Datenmengen langsam und ungenau.
 
nevar #:
Es besteht ein enger Zusammenhang zwischen den Gaußschen Prozessen für die Regression und dem Wiener-Khinchin-Theorem https://danmackinlay.name/notebook/wiener_khintchine.html https://www.numberanalytics.com/blog/wiener-khinchin-theorem-guide Es wäre toll, wenn Sie in dieser Richtung weitermachen könnten, um uns aufzuklären.
Bei der Fourier-Analyse geht es doch eher um Stationarität und lineare Zusammenhänge. Es ist einfacher, im Zeitbereich mit ARIMA-Modellen zu arbeiten; dies entspricht in gewisser Weise der Fourier-Analyse.

Bei GP hingegen geht es bereits um die Suche nach nichtlinearen Zusammenhängen; in diesem Sinne sind sie nicht weit von neuronalen Netzen wie MLP entfernt, bieten jedoch die Möglichkeit der Extrapolation und der Erstellung von Konfidenzintervallen für Prognosen.

Daher habe ich vorerst nicht vor, auf die Fourier-Analyse einzugehen, sondern werde die Reihe mit GP fortsetzen.

 
Maxim Dmitrievsky die Support-Vektor-Methode – als Nischenanwendung herausgestellt hat. In der Praxis hört man überhaupt nicht, dass es irgendwo angewendet wird :) Alle Modelle auf Basis von Gaußschen Mischungen arbeiten bei großen Datenmengen langsam und ungenau.
Es ist natürlich kein sehr beliebtes Werkzeug, aber ich sehe darin Potenzial. Mich reizt, dass man, wenn man den Kernel-Ansatz verstanden hat, sozusagen eine einheitliche, kohärente Sichtweise auf die Datenanalyse erhält. Hier kommen sowohl Regression als auch Klassifizierung, die Kernel-Dichte-Schätzung, die Auswahl signifikanter Merkmale sowie statistische Unabhängigkeitstests usw. zum Tragen.


[Gelöscht]  
Evgeniy Chernish #:
Es ist natürlich kein besonders beliebtes Werkzeug, aber ich sehe darin Potenzial. Mich reizt, dass man, wenn man den Kernel-Ansatz einmal verstanden hat, sozusagen eine einheitliche, abgestimmte Sichtweise auf die Datenanalyse erhält. Hier kommen sowohl Regression als auch Klassifizierung, die Kernel-Dichte-Schätzung, die Auswahl signifikanter Merkmale sowie statistische Unabhängigkeitstests usw. zum Einsatz.


Auf jeden Fall interessant :)