Abhängigkeitsstatistik in Anführungszeichen (Informationstheorie, Korrelation und andere Methoden der Merkmalsauswahl) - Seite 7

 
TheXpert:

Wie können sie diskret sein, wenn man mit relativen Inkrementen arbeitet?

Und die zweite Frage - wie hoch ist die Anzahl der Zeichen ) ?


Und wir diskretisieren sie. Es gibt zwei Hauptschemata: Quantile (wodurch die PDF gleich wird) und gleiche Abstände (die PDF ist dem Ergebnis der Rohdaten sehr ähnlich).

Die Anzahl der Zeichen wird vom Forscher festgelegt.

 
Mathemat: Und bei dieser Aufgabe ist TI für mich in erster Linie einData-Mining-Tool. Was mit diesen Daten geschehen soll, ist eine andere Frage. Wichtig ist, dass wir etwas sehen, das mit dem bloßen Auge nicht sichtbar ist. Und von welchen anderen Wissenschaften sprechen Sie?

Ich öffne im Paket STATISTIK die Registerkarte "Data Mining" - etwa 20 Namen von Abschnitten und einzelnen Verfahren. All dies steht im Einklang mit den Lehrbüchern und Monographien auf diesem Gebiet, aber nichts über TI für Data Mining.

 
alexeymosc:
Offensichtlich handelt es sich bei unserer Interpretation des Prozesses um diskrete Werte der Renditen.

Wenn Sie "wirtschaftliche und andere Bedeutungen" nicht mit einbeziehen, von welchen Prozessen sprechen wir dann? Ein Prozess ist ein "physikalisches" Phänomen, er hat Ursachen und Folgen. Zum Beispiel der Vorgang, dass ein Apfel auf Newtons Kopf fällt. In der Anwendung auf Märkte, der Prozess des Kaufens und Verkaufens. Wo ist das alles auf dem Markt zu finden?

Nächster Punkt. Das ter.ver, auf dem das ter.inf basiert, setzt die Unabhängigkeit der betreffenden Ereignisse oder Symbole voraus. Andernfalls ist die Verwendung dieser mathematischen Apparate nicht korrekt. Wo ist die Unabhängigkeit geblieben? Angenommen, ich kaufe aus spekulativen Gründen einige Aktien (ich meine den realen Markt, nicht das Brokerhaus), und die Preise steigen wieder an. Nach einiger Zeit beschloss ich, diese Aktien zu verkaufen, und es kam zu einer weiteren Rendite. Diese beiden Ereignisse sind ganz klar über mich und meine spekulativen Impulse miteinander verbunden. Da es viele Dummköpfe wie mich auf dem Markt gibt, die alle auf die gleiche Art und Weise kaufen und verkaufen, sind alle Renditen miteinander verbunden und abhängig. Warum versuchen Sie also, einen mathematischen Apparat auf abhängige Ereignisse von unabhängigen anzuwenden? Ist das richtig?

In dieser Hinsicht ist alles andere als klar.

 
faa1947:

Ich öffne im Paket STATISTIK die Registerkarte "Data Mining" - etwa 20 Namen von Abschnitten und einzelnen Verfahren. All dies steht im Einklang mit den Lehrbüchern und Monographien auf diesem Gebiet, aber nichts über TI für Data Mining.


Dies ist ein Fehler in der Statistik. Ich benutze es übrigens selbst.
 
alexeymosc:

Und wir diskretisieren sie. Es gibt zwei Hauptschemata: Quantile (wodurch die PDF gleich wird) und gleiche Abstände (die PDF ist dem Ergebnis der Rohdaten sehr ähnlich).

Die Anzahl der Zeichen wird vom Forscher festgelegt.

D.h. wenn wir das Alphabet des Marktes nicht kennen, sollten wir uns selbst eines ausdenken, und das werden wir dann untersuchen.

Ich könnte mich natürlich irren, und das tue ich auch nicht selten, aber dieser Ansatz scheint mir nicht gut zu sein.

 
HideYourRichess:

D.h. wenn wir das Alphabet des Marktes nicht kennen, sollten wir es selbst erfinden und genau studieren.

Ich könnte mich natürlich irren, und das tue ich auch nicht selten, aber dieser Ansatz scheint mir nicht gut zu sein.


Sehen Sie, ich will mich nicht streiten und ich mag es nicht, aber das ist es, was Forscher bei kontinuierlichen Variablen tun, sie diskretisieren sie. Es gibt keinen anderen Weg, die Alternative ist, TI überhaupt nicht auf kontinuierliche Variablen anzuwenden.

Wie man das macht, ist ein anderes Thema. Es gibt eine Methode, um die Anzahl der Zeichen eines Alphabets durch eine Analyse der kontinuierlichen Werteverteilung zu bestimmen (Parzen-Fenster genannt - googeln Sie die Regeln...), aber ich habe sie in diesem Fall nicht verwendet, und ich glaube, ich habe ein bisschen verloren.

 
Sie scheinen überhaupt nicht verstanden zu haben, worüber Sie gesprochen haben. Nun, viel Glück.
 
HideYourRichess:
Sie scheinen überhaupt nicht verstanden zu haben, worüber Sie gesprochen haben. Nun, viel Glück.

Ich verstehe Ihre Überlegungen zur Unabhängigkeit der Inkremente. Ich bin mir nicht sicher, ob ich dem vollständig zustimmen kann. Ich würde auch die Mathematik zu diesem Thema konsultieren.
 
HideYourRichess:

Wenn Sie "wirtschaftliche und andere Bedeutungen" nicht mit einbeziehen, von welchen Prozessen sprechen wir dann? Ein Prozess ist ein "physikalisches" Phänomen, er hat Ursachen und Folgen. Zum Beispiel der Vorgang, dass ein Apfel auf Newtons Kopf fällt. In der Anwendung auf Märkte, der Prozess des Kaufens und Verkaufens. Wo ist das alles auf dem Markt?

Nächster Punkt. Ter.ver, auf dem ter.inf. basiert, setzt die Unabhängigkeit der fraglichen Ereignisse oder Symbole voraus. Andernfalls ist die Verwendung dieser mathematischen Apparate nicht korrekt. Wo ist die Unabhängigkeit geblieben? Angenommen, ich kaufe aus spekulativen Gründen einige Aktien (ich meine den realen Markt, nicht das Brokerhaus), und die Preise steigen wieder an. Nach einiger Zeit beschloss ich, diese Aktien zu verkaufen, und es kam zu einer weiteren Rendite. Diese beiden Ereignisse sind ganz klar über mich und meine spekulativen Impulse miteinander verbunden. Da es viele Dummköpfe wie mich auf dem Markt gibt, die alle auf die gleiche Art und Weise kaufen und verkaufen, sind alle Renditen miteinander verbunden und abhängig. Warum versuchen Sie also, einen mathematischen Apparat auf abhängige Ereignisse von unabhängigen anzuwenden? Ist das richtig?

In dieser Hinsicht ist alles andere als klar.


In diesem Fall ist die Unabhängigkeit meines Erachtens nicht erforderlich, sondern gerade der Gegenstand der Bewertung.
 
Viele Beispiele für die Anwendung der TI in der russischen Sprache beziehen sich auf die Analyse des Alphabets des Russischen und anderer Sprachen sowie auf die Analyse von Wörtern und Sätzen (Wortfolgen). Und alle diese Zeichen sind a priori statistisch nicht unabhängig, und anhand dieser Beispiele wird die gegenseitige Information geschätzt, ein Wert, der das Ausmaß der Abhängigkeit zeigt. Die a priori Unabhängigkeit der untersuchten Werte ist also keine Voraussetzung für die korrekte Anwendung der TI.