Diskussion zum Artikel "Random-Forest-Vorhersage-Trends" - Seite 8

 
Demi:

nein, das ist nicht klar - ich habe keine Katze und ich bezweifle, dass die Temperatur eines Haustiers für Deviseninformationen relevant ist.

Übrigens gebe ich 100 %, dass die Dynamik der Katzentemperatur eine Korrelation ungleich Null mit der Preisreihe eines Finanzinstruments hat.

Nun, vorhin haben Sie behauptet, dass alle Daten eine Vorhersagekraft haben. Natürlich geht es hier um die Vorhersage von Finanzmärkten.

Wenn die Rechenleistung unserer Computer es uns erlauben würde, alle verfügbaren Informationen, einschließlich der Temperatur der Katze, zu verwenden, würden wir sie einfach aus dem Berechnungsprozess herausnehmen. Aber da die Ressourcen begrenzt sind, müssen wir unseren eigenen Kopf benutzen.Was die Korrelation betrifft, so ist die Tatsache, dass sie nicht Null ist, eine Selbstverständlichkeit, Null kann nur selten vorkommen, aber sie ist fast Null. Kaufen Sie sich eine Katze, legen Sie ein Thermometer auf sie und prüfen Sie sie )) Vielleicht haben Sie Glück und sie macht Sie reich ).

 
meat:

Sie haben vorhin gesagt, dass alle Daten eine Vorhersagekraft haben. Natürlich geht es hier um die Vorhersage von Finanzmärkten.

Wenn die Rechenleistung unserer Computer es uns erlauben würde, alle verfügbaren Informationen zu nutzen, einschließlich der Temperatur der Katze, würde sie bei der Berechnung einfach verworfen werden. Aber da die Ressourcen begrenzt sind, müssen wir unseren eigenen Kopf benutzen.Was die Korrelation angeht, die Tatsache, dass sie nicht Null ist - es versteht sich von selbst, dass Null im Allgemeinen selten vorkommt. Aber fast Null. Kaufen Sie sich eine Katze, stellen Sie ihr ein Thermometer hin und überprüfen Sie es )) Vielleicht haben Sie Glück und sie macht Sie reich )

Sie lügen - ich zitiere mich selbst: "Ich gebe Ihnen die Antwort auf Ihre Frage - es gibt eine gewisse "Vorhersagekraft" in allen Daten. Na und? Es gibt eine Art von Information in allen Forex-Daten.".

Wenn Sie einen Satz von Hunderttausenden von Beobachtungen haben, wäre die Frage der Computerleistung von Bedeutung.

 
Demi:

Sie lügen - ich zitiere mich selbst: "Ich gebe Ihnen die Antwort auf Ihre Frage - es gibt eine gewisse "Vorhersagekraft" in allen Daten. Und? Es gibt irgendeine Art von Information in allen Forex-Daten.".".

Fleisch:

Sie haben zuvor behauptet, dass es in allen Daten eine Vorhersagekraft gibt.

Und was ist die Lüge?

 
meat:

Und was ist die Lüge?

Ich habe mich im zweiten Satz entschlüsselt.
 
Demi:
Ich habe mich im zweiten Satz selbst entschlüsselt.

D.h. Information = Vorhersagekraft? Wie können Sie sich da so sicher sein? Wenn ich Ihnen einige "Forex-Daten" nenne, können Sie damit den Kurs vorhersagen?

Es gibt nicht nur Devisen, sondern auch Aktienmärkte, Rohstoffmärkte und viele andere Dinge.... Alles ist miteinander verknüpft.

 

faa1947:

Ich habe hier ein Dutzend Kunden. Vor der Kommunikation mit mir waren alle fröhlich und heiter, aber jetzt sind sie traurig und nachdenklich.

Multiplizieren Sie nicht die Traurigkeit)))
 

faa1947, bitte zeigen Sie anhand des folgenden Beispiels, wie Ihr Modell funktioniert. Die erste Spalte ist die modellierte Reihe, die zweite und dritte Spalte sind die Prädiktoren. Wie hoch ist die Vorhersagekraft dieser Prädiktoren?

-0.35742 0.461646 -0.81907
0.431277 0.004545 0.426731
-0.00018 -0.4037 0.403528
-0.08575 0.90851 -0.99426
0.773826 0.008975 0.764852
0.426905 -0.96485 1.391757
0.253233 0.487955 -0.23472
0.20994 0.880554 -0.67061
-0.09929 0.160276 -0.25956
0.332911 -0.08736 0.420268
0.032258 0.360106 -0.32785
0.253027 -0.06859 0.321621
-0.66668 -0.54985 -0.11683
-0.5476 -0.13231 -0.41529
-0.75652 0.536488 -1.29301
-0.66109 -0.87314 0.212052
-0.09993 -0.86293 0.763
0.014625 0.715032 -0.70041
-0.48345 -0.62666 0.143206
-0.03596 0.935653 -0.97161
-0.17023 0.678024 -0.84826
0.293376 0.079529 0.213847
0.002922 0.754594 -0.75167
0.329194 -0.05535 0.384546
0.639423 -0.41358 1.053007
0.431631 -0.60334 1.034973
0.59125 0.497989 0.093262
0.266098 -0.79645 1.062549
-0.02624 0.643164 -0.6694
0.055014 -0.46214 0.517154
0.436132 -0.89992 1.336052
-0.30143 0.628619 -0.93005
-0.12168 0.886467 -1.00814
-0.10851 -0.0507 -0.0578
-0.74573 -0.50921 -0.23653
-0.574 0.244825 -0.81883
-0.87313 0.336188 -1.20932
-0.00344 0.117363 -0.1208
-0.20265 0.424326 -0.62697
0.177873 -0.17967 0.357541
 
gpwr:


Wie hoch ist die Vorhersagekraft dieser Prädiktoren?

Offenbar sind die Zahlen nicht zufällig. Ich habe das ganz einfach überprüft: Ich habe drei Reihen von 40 Reihen nach dem Zufallsprinzip generiert und Neuron auf sie angewendet. Bei zufälligen Daten ist die Verallgemeinerungsfähigkeit deutlich schlechter als bei den oben erwähnten Daten.
 
Reshetov:
Offenbar sind die Zahlen nicht zufällig. Ich habe das ganz einfach überprüft: Ich habe drei Reihen von 40 Reihen zufällig generiert und Neuronka auf sie angewendet. Bei zufälligen Daten ist die Verallgemeinerungsfähigkeit deutlich schlechter als bei den oben erwähnten Daten.
Ich würde mich für verschiedene universelle algorithmische Ansätze interessieren, um die Vorhersagefähigkeit dieser beiden Prädiktoren zu bestimmen. Ökonometrie, Neuronik und tiefe Netzwerke sind willkommen. Zeigen Sie uns, was sie leisten können. Sie können entweder einige Parameter aufzeigen, die die Vorhersagefähigkeit dieser Prädiktoren charakterisieren (Korrelationskoeffizient, gegenseitige Information, RMS und andere Erfindungen), oder Sie zeigen einen Vergleich der Modellausgabe mit simulierten Reihen.
Применение метода собственных координат к анализу структуры неэкстенсивных статистических распределений
Применение метода собственных координат к анализу структуры неэкстенсивных статистических распределений
  • 2012.06.21
  • MetaQuotes Software Corp.
  • www.mql5.com
Центральной проблемой прикладной статистики является проблема принятия статистических гипотез. Долгое время считалось, что эта задача не может быть решена. Ситуация изменилась с появлением метода собственных координат. Это очень красивый и мощный инструмент структурного исследования сигнала, позволяющий увидеть больше, чем доступно методами современной прикладной статистики. В статье рассмотрены вопросы практического использования данного метода и приведены программы на языке MQL5. Рассмотрена задача идентификации функций на примере распределения, полученного Хилхорстом и Шером.
 
gpwr:
Ich würde mich für verschiedene universelle algorithmische Ansätze interessieren, um die Vorhersagekraft dieser beiden Prädiktoren zu bestimmen. Ökonometrie, Neuronik und tiefe Netzwerke sind willkommen. Zeigen Sie uns, was sie leisten können. Sie können entweder einen Parameter angeben, der die Vorhersagekraft dieser Prädiktoren charakterisiert (Korrelationskoeffizient, gegenseitige Information, RMS und andere Erfindungen), oder Sie zeigen einen Vergleich der Modellausgabe mit simulierten Reihen.
  1. Der Begriff "Vorhersagefähigkeit" ist der Stoff, aus dem Wahrsager, Hellseher, Schamanen und andere Ökonometriker sind. Beim maschinellen Lernen kann man die Verallgemeinerungsfähigkeit berechnen, und selbst dann nur annähernd
  2. Es gibt nicht genügend Daten, d.h. wir haben es mit Small Data zu tun (nur 40 Beispiele), und daher können die Schätzungen der Generalisierungsfähigkeit überschätzt werden, d.h. ein Finger im Himmel.

Ich habe die Stichprobe in eine Form gebracht, die für eine binäre Klassifizierung geeignet ist, d. h. ich habe die abhängige Variable berechnet, um zu sehen, ob sie über oder unter Null liegt (CSV-Datei im angehängten Archiv), habe mit libVMR gesucht und dieses Modell erhalten:


/**
* Die Qualität der Modellierung:
*
* TruePositives: 9
* TrueNegatives: 11
* FalsePositives: 0
* FalseNegatives: 0
* Sensitivity of generalization abiliy: 100.0%
* Spezifität der Generalisierungsfähigkeit: 100.0%
* Generalisierungsfähigkeit: 100.0%
*/
double x0 = 2.0 * (v0 + 0.96485) / 1.900503 - 1.0;
double x1 = 2.0 * (v1 + 1.00814) / 2.399897 - 1.0;

y = 0,12981203254657206 + 0,8176828303879957 * x0 + 1,0 * x1 -0,005143248786272694 * x0 * x1;


Das Geheimnis der "hohen Verallgemeinerbarkeit" Ihrer Stichprobe ist gelüftet: Der Wert der ersten Spalte ist die Summe der Werte der beiden anderen Spalten.

libvmr
libvmr
  • code.google.com
VMR - machine learning library
Dateien:
test.zip  1 kb