Diskussion zum Artikel "Bewertung und Auswahl von Variablen für Modelle für maschinelles Lernen"

 

Neuer Artikel Bewertung und Auswahl von Variablen für Modelle für maschinelles Lernen :

Dieser Artikel konzentriert sich auf die Besonderheiten der Auswahl, Vorkonditionierung und Bewertung der Eingabevariablen (Prädiktoren) für den Einsatz in Modellen für maschinelles Lernen. Neue Ansätze und Möglichkeiten der tiefen Prädiktor Analyse und deren Einfluss auf mögliche Überanpassung von Modellen werden berücksichtigt. Das Gesamtergebnis der Verwendung von Modellen hängt weitgehend vom Ergebnis dieser Phase ab. Wir werden zwei Pakete analysieren, die neue und ursprüngliche Konzepte für die Auswahl der Prädiktoren bieten.

Mit dem Paket "RandomUniformForests" berechnen und analysieren wir das Bedeutungskonzept einer Variablen auf verschiedenen Ebenen und in verschiedenen Kombinationen, die Übereinstimmung der Prädiktoren sowie ein Ziel und das Zusammenspiel zwischen Prädiktoren und der Auswahl eines optimalen Satzes von Prädiktoren unter Berücksichtigung aller Aspekte der Bedeutung.

Mit dem Paket "RoughSets" werden wir die gleiche Frage der Wahl Prädiktoren aus einem anderen Blickwinkel und basierend auf anderen Konzept betrachten. Wir zeigen, dass nicht nur eine Reihe von Prädiktoren optimal sein kann, eine Reihe von Beispielen für das Training kann ebenfalls optimiert werden.

Autor: Vladimir Perervenko

 

Herzlichen Glückwunsch!

Eigentlich ein Nachschlagewerk zum Thema, das auf den neuesten verfügbaren Tools in diesem Bereich basiert. Jeder kann nachmachen, alles ist kostenlos, gepflegt, entwickelt, dokumentiert....

Respekt und Achtung!

 
СанСаныч Фоменко:

Herzlichen Glückwunsch!

Eigentlich ein Nachschlagewerk zum Thema, das auf den neuesten verfügbaren Tools in diesem Bereich basiert. Jeder kann nachmachen, alles ist kostenlos, gepflegt, entwickelt, dokumentiert....

Respekt und Achtung!

Grüße SanSanych.

Von allen bisher ausprobierten Möglichkeiten der Prädiktorenauswahl ist diese hier die klarste und detaillierteste.

Viel Erfolg!

 
Ja! Ja! Ich schließe mich San Sanych an. Mein Dank! Das Thema Deep Learning mit allen dazugehörigen Nuancen ist aktuell und vielversprechend. Ich als jemand, der keine allzu tiefen mathematischen Kenntnisse hat, brauche diese Art von Informationen in einer systematischen, maximal zugänglichen Form, mit der Möglichkeit, bestimmte Punkte zu vertiefen. Nochmals vielen Dank!
 
Ich will nicht unwissend erscheinen und die Verdienste des Autors nicht schmälern, er ist eindeutig gut gemacht, aber hilft das alles zu verdienen?
 
Alexey Oreshkin:
Ich will nicht unwissend erscheinen und nicht von den Verdiensten des Autors zu schmälern, er ist sicherlich gut gemacht, aber hilft es alles zu verdienen?

Das kommt darauf an.

Einsame Sucher von Millionen mit den Kosten von ein paar Wochen? Nein, nutzlos.

Leute, die für ihren Lebensunterhalt handeln und wissen, dass ein anständiger EA mehrere Jahre braucht? Ja. Und hier ist es sehr wichtig, den richtigen Weg zu gehen und nicht durch den Wald zu irren ....

PS.

Und mit Hilfe welcher Tools verdienen professionelle Teilnehmer des Wertpapiermarktes Geld? Nicht mit Hilfe von TA? Schließlich wird die gesamte TA an den Universitäten in vierzehn Tagen mit Krediten unterrichtet. Und die professionellen Teilnehmer des Wertpapiermarktes sind mit Absolventen mit Diplomen in "Statistik", "Ökonometrie", "Künstliche Intelligenz" ...... ausgestattet. Und für sie ist der besprochene Artikel durchaus verständlich, obwohl er in vielerlei Hinsicht neu ist.

PSPS.

Ich schreibe nicht, um zu entmutigen. Sehen wir uns nicht ein Merrill Lynch mit 100 000 Mitarbeitern an, das auf allen Märkten und mit allen Instrumenten handelt.

Wir sprechen hier von einem sehr begrenzten TS: ein paar Modelle, ein Dutzend Instrumente. Und wirklich eine Rendite von über 20 % pro Monat erzielen.

Hier ist der Plan.

Wir setzen R. Als nächstes nehmen wir RAttle. Dies ist für jeden verfügbar, der den einfachsten Expert Advisor geschrieben hat. Eine Stunde Arbeit. Mit Excel bereiten wir eine Quelldatei vor. Danach stellt Rattle 6 sehr anständige Modelle zur Verfügung, von denen drei (ada, random forest, SVM) sehr vielversprechend sind und durch ihre Fähigkeiten alle Varianten mit Indikatoren und insbesondere neuronalen Netzen (ebenfalls in Rattle verfügbar und vergleichbar) weit übertreffen.

Und dann beginnt die mühsame, in vielerlei Hinsicht umfangreiche Arbeit, sich durch die Liste der Eingabedaten zu wühlen. Das geht über das ganze Gerüst von Excel, und die Auswertung der Ergebnisse in Rattle. Wenn man das einmal gemeistert hat, ist man drin und auf dem richtigen Weg.

Und in TA..... Sie schreiben einen Expert Advisor, er scheint Gewinn zu bringen..... Und dann ist es sicher, dass er verrottet und ein großes Glück ist, wenn der Trader misstrauisch ist und daran denkt, ihn wegzuwerfen, bevor dieser nächste "Gral" seines geleakten Depo.... Und so geht es ein ganzes Leben lang weiter. Erfahrung wird nicht angesammelt - theoretisch unmöglich.

 
<br/ translate="no">

Hier ist der Plan.

Setzen wir ein R ein. Als nächstes nehmen wir RAttle. Dies ist für jeden verfügbar, der den einfachsten Expert Advisor geschrieben hat. Eine Stunde Arbeit. Mit Excel bereiten wir eine Quelldatei vor. Danach stellt Rattle 6 sehr anständige Modelle zur Verfügung, von denen drei (ada, random forest, SVM) sehr vielversprechend sind und durch ihre Fähigkeiten alle Varianten mit Indikatoren und insbesondere neuronalen Netzen (die ebenfalls in Rattle verfügbar sind und verglichen werden können) weit übertreffen.

Wird es Geld geben? Dann wären die reichsten und erfolgreichsten Trader Mathematiker. Die Suche nach mythischen Regelmäßigkeiten in einer nicht-stationären Reihe ist eine Analogie zum Werfen einer Münze.

 

"Die Suche nach mythischen Mustern in einer nicht-stationären Reihe ist vergleichbar mit dem Werfen einer Münze."

Dies sollte als die arroganteste der dümmsten Aussagen festgehalten werden.

Und die Frage: "Lässt sich damit Geld verdienen?" sagt etwas über das Niveau der Ausbildung aus.

In der Tat: "Der Verstand des Menschen ist begrenzt, die Dummheit ist grenzenlos".

 
Alexey Oreshkin:

Die Suche nach mythischen Regelmäßigkeiten in einer nicht-stationären Reihe ist vergleichbar mit dem Werfen einer Münze.

Das stimmt. Lamers wissen nicht, dass die Ergebnisse eines Münzwurfs bekanntermaßen stationär sind. Es sei denn, sie ist aus Knetmasse, d. h. sie ändert ihre Form über lange Zeit nicht. Aber es gibt immer noch Dummköpfe, die mit solchen stationären Prozessen Geld verdienen wollen.
 
Im Allgemeinen sollte jeder die statistische Analyse lernen, auf jeden Fall wird sie nicht überflüssig sein :) Aber das Problem bleibt - welche Daten einzugeben, und auch auszugeben :)
 
Maxim Dmitrievsky:
Im Allgemeinen sollte jeder die statistische Analyse lernen, auf jeden Fall wird sie nicht überflüssig sein :) Aber es bleibt das Problem, welche Daten man eingibt, und welche man ausgibt :)

Es wird nie überflüssig sein. Aber was haben Input und Output damit zu tun, wenn sogar in diesem Thread, in Diskussionen, vorgeschlagen wird, 6 sehr anständige Modelle zu verwenden. Wofür sind sie geeignet? Um den Verbrauch des Wärmeverkehrs zu prognostizieren - dafür können sie tauglich sein. Was hat der Markt damit zu tun?

Ich will nicht urteilen und schon gar nicht gegen diesen Ansatz des Geldverdienens argumentieren. Für mich ist es nur ein Interesse und eine Diskussion, mehr nicht. Und all die Lahmärsche, die schon längst ihre superschlauen neuronalen Netze entwickelt haben ... und immer noch da..... ist es nicht einmal interessant, mit ihnen zu reden.