
Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
Der neue Artikel Predicting Trends with Random Forests wurde veröffentlicht:
Von СанСаныч Фоменко
Dieses Modell ist sehr einfach in der Vorhersage, aber in der Praxis gibt es eine Menge Probleme damit.
1. weil das Zickzack-Signal als Ziel gewählt wird, kann eine der einfachsten Variablen aus ihm vorhergesagt werden, z.B. die Sortierung von PRICE für die letzten 20 Zyklen, offensichtlich aus dem Ziel-Design, das Signal von Zickzack ist aufwärts, wenn moverank_price_20 =1, und moverank_price_20 >1, wenn Es besteht eine Wahrscheinlichkeit von mehr als 90 %, dass das Signal von zigzag abwärts gerichtet ist; daraus können viele solcher Variablen konstruiert werden, so dass es einfach ist, bei der Modellvorhersage erfolgreich zu sein; eine A-priori-Bedingung ist hier jedoch, dass man wissen muss, dass dieser Punkt der Punkt von zigzag ist. Wenn es sich um andere Zeitpunkte handelt, aber nicht um den Zickzackpunkt, sind die oben genannten Variablen nicht in der Lage, eine Vorhersage zu treffen.
(2) So wird es ein großes Problem bei der Anwendung, weil Sie nicht wissen, was ist der Ausgangspunkt der Zickzack, so dass Sie alle Daten zu berechnen, zu diesem Zeitpunkt, moverank_price_20 =1, glaube nicht, dass ist der Ausgangspunkt der Zickzack, und so kann nicht vorhersagen, den Punkt zu ändern, nachdem der Trend nach oben ist.
3. so die Zielsetzung Methode der Zickzack ist schwierig zu arbeiten.
Es gibt eine Tabelle in dem Artikel
Aber es wird nichts darüber gesagt, was die Zahlen an sich bedeuten, ihre Beziehung zu anderen Zahlen ist verständlich - besser - besser, aber die Werte selbst, was sollen sie sein und wovon hängen sie ab? Hier im Artikel ist der maximale Wert von MeanDecreaseGini 321,86, aber meiner ist 1876 - hängt das von der Anzahl der Prädiktoren ab oder was? Und ich habe eine MeanDecreaseAccuracy von 140,22 - wie soll ich das interpretieren? Vielleicht sollte ich einfach alle Werte in einen Prozentsatz des größten Wertes umrechnen?
In dem Artikel gibt es eine Tabelle
Aber es wird nichts darüber gesagt, was die Zahlen an sich bedeuten, ihre Beziehung zu anderen Zahlen ist verständlich - besser ist besser, aber die Werte selbst sollten was sein und wovon hängen sie ab? Hier im Artikel ist der maximale Wert von MeanDecreaseGini 321,86, und ich habe 1876 - hängt das von der Anzahl der Prädiktoren ab oder was? Und ich habe eine MeanDecreaseAccuracy von 140,22 - wie soll ich das interpretieren? Vielleicht sollte ich einfach alle Werte in einen Prozentsatz des höchsten Wertes umrechnen?
Dies ist die interne Statistik der Verwendung von Prädiktoren bei der Erstellung eines Bündels von Bäumen, die alle zusammen randoForest genannt werden. Der Vergleich verschiedener Modelle macht überhaupt keinen Sinn. Ich konnte nicht einmal innerhalb desselben Modells vergleichen. Wenn Sie Prädiktoren auswählen wollen, müssen Sie andere Werkzeuge verwenden. Ich habe schon oft im Thread über maschinelles Lernen geschrieben, und ich bin nicht der Einzige.
Dies ist die interne Statistik der Verwendung von Prädiktoren bei der Erstellung eines Bündels von Bäumen, die alle zusammen randoForest genannt werden. Der Vergleich verschiedener Modelle macht überhaupt keinen Sinn. Ich konnte nicht einmal innerhalb desselben Modells vergleichen. Wenn Sie Prädiktoren auswählen wollen, müssen Sie andere Werkzeuge verwenden. Ich habe schon oft im Thread über maschinelles Lernen geschrieben, und ich bin nicht der Einzige.
Ich verstehe, d.h. es ist ein Schätzer innerhalb eines Modells, aber nicht absolut....
Vielleicht, natürlich, und schrieb auf dem Forum, aber das Volumen zu bewältigen.... - Ich lese die Hälfte des Forums über meinen Reader. Wenn Sie mich in die richtige Richtung weisen können, wäre ich Ihnen sehr dankbar.
Verstehe, d. h. es handelt sich um einen Schätzer innerhalb des Modells, aber nicht um absolute....
Vielleicht, natürlich, und schrieb auf dem Forum, aber das Volumen zu bewältigen... - Ich lese die Hälfte des Forums durch meinen Reader. Wenn Sie Ihre Nase stoßen, würde ich dankbar sein.
1. Ich habe keine kurze Antwort, da es sich um eine ganze Branche handelt, die sich Datamining nennt und mit der Modellierung vergleichbar ist
2. Das Standardschema für Datamining-Klassifikationsmodelle ist wie folgt:
3. Anpassung des Modells an die erste Hälfte der Datei, vorzugsweise mit Kreuzvalidierung
4. Überprüfen Sie die zweite Hälfte der Datei. Die Ergebnisse sollten übereinstimmen
Für all dies benötigen Sie eine Menge DONE-Tools. Das beste ist caret. Es hat alles, was man braucht. Aber nicht genug.
PS.
Das ist R. Außerhalb davon kommt man nicht weiter als mit unartikuliertem Babygebrabbel.
1. Ich habe keine kurze Antwort, denn es gibt einen ganzen Industriezweig namens Datamining, der mit der Modellierung vergleichbar ist.
2. Das Standardschema für Datamining-Klassifikationsmodelle ist wie folgt:
3. Anpassen des Modells an die erste Hälfte der Datei, vorzugsweise mit Kreuzvalidierung
4. Überprüfung an der zweiten Hälfte der Datei. Die Ergebnisse sollten übereinstimmen
Für all dies brauchen Sie eine Menge DONE-Tools. Das beste ist caret. Es hat alles, was man braucht. Aber nicht genug.
PS.
Das ist R. Ansonsten kommt man über unartikuliertes Babygebrabbel nicht hinaus.
Danke, ich werde weiter suchen!
Ich habe RStudio installiert, das Boruta-Paket heruntergeladen , aber wie aktiviere ich es, wie arbeite ich damit?
Lesen Sie die Dokumentation, immer für alle Pakete. Öffnen Sie in RStudio die Registerkarte "Pakete", geben Sie den Paketnamen in die Suche ein und klicken Sie auf den erscheinenden Paketnamen, um die Hilfe zu öffnen. Oder besser hier nach dem Paketnamen suchen, vielleicht gibt es Links zu verwandten Materialien.
Wenn Sie sich für Ideologie interessieren, finden Sie in den im Paket enthaltenen Funktionen einen Link zu einem theoretischen Artikel.
Lesen Sie die Dokumentation, immer für alle Pakete. Öffnen Sie in RStudio die Registerkarte "Pakete", geben Sie den Paketnamen in die Suche ein und klicken Sie auf den erscheinenden Paketnamen, um die Hilfe zu öffnen. Oder noch besser, klicken Sie hier auf den Paketnamen, möglicherweise gibt es Links zu verwandten Materialien.
Wenn die Ideologie interessant ist, gibt es einen Link zu dem theoretischen Artikel in den Funktionen, die in dem Paket enthalten sind.
Vielen Dank!
Also habe ich das pdf mit der Beschreibung geöffnet und hier sind die Einstellungen verblüffend - so viele Dinge werden verlangt, dass ich nicht weiß, was die Hälfte davon bedeutet.
Gibt es etwas einfacheres, wenn auch weniger zuverlässig, und vorzugsweise mit GUI?
Generell wäre es sehr nützlich, wenn Sie Artikel zu diesem Thema verfassen würden, mit Details, wo und wie!