Abhängigkeitsstatistik in Anführungszeichen (Informationstheorie, Korrelation und andere Methoden der Merkmalsauswahl) - Seite 8

 
Avals:

In diesem Fall ist die Unabhängigkeit nicht erforderlich, wie ich es verstehe, sondern sie ist gerade Gegenstand der Bewertung.
Sie ist erforderlich. Und die Entropie wird als probabilistische Schätzung bewertet.
 
HideYourRichess:
Erforderlich. Und die Entropie wird als Wahrscheinlichkeitsschätzung geschätzt.

Wo steht geschrieben, dass Unabhängigkeit erforderlich ist? Erscheinen von Buchstaben in russischsprachigen Texten unabhängig vom Kontext (vorherige Buchstaben)?
 
alexeymosc:
Viele Beispiele für die Anwendung von TC in der russischen Sprache beziehen sich auf die Analyse des Alphabets des Russischen und anderer Sprachen sowie auf die Analyse von Wörtern und Phrasen (Wortfolgen). Und alle diese Zeichen sind a priori statistisch nicht unabhängig, und anhand dieser Beispiele wird die gegenseitige Information geschätzt, ein Wert, der das Ausmaß der Abhängigkeit zeigt. Die a priori Unabhängigkeit der untersuchten Werte ist also keine Voraussetzung für die korrekte Anwendung der TI.

Sehr schwache Argumentation, auf der Ebene, dass irgendwo gelesen, dass irgendwo verwendet wird, für etwas dort, auf dieser.... Genau darüber schrieb uns das akademische Wörterbuch, - "Für die Modellierung von Kommunikationssystemen ist ein solcher Ansatz legitim, da sie für die fehlerfreie Übertragung der durch eine beliebige Menge von Symbolen dargestellten Informationen auf einem Kommunikationskanal bestimmt sind. Wenn jedoch die Berücksichtigung des Wertes und der Bedeutung der Information wesentlich ist, ist der quantitative Ansatz nicht anwendbar. Dieser Umstand schränkt die Anwendungsmöglichkeiten der TK wesentlich ein. Die Nichtberücksichtigung dieses Aspekts führte in den frühen Phasen der Entwicklung zu einer Überschätzung der Bedeutung der Anwendung.


 
Avals:

Wo steht geschrieben, dass Unabhängigkeit erforderlich ist? Das Erscheinen von Buchstaben im russischsprachigen Text unabhängig vom Kontext (vorherige Buchstaben)?
Geht das nicht aus der Aufgabenstellung hervor? Die Formulierung ist übrigens ganz klassisch für ter.ver.
 
alexeymosc:

Das ist ein Fehler in der Statistik. Ich benutze es übrigens selbst.
Sie können endlich eine fundierte Diagnose stellen.
 
faa1947: Ich öffne im Paket STATISTIK die Registerkarte "Data Mining" - etwa 20 Namen von Abschnitten und einzelnen Verfahren. All dies stimmt perfekt mit den Lehrbüchern und Monographien auf diesem Gebiet überein, aber nichts über TI für Data Mining.

Wunderbar. Das Statistica-Paket ist die einzige Quelle für Data Mining. Daher sollte TI die Verwendung verboten werden. Und verbannen Sie auch Ihr eigenes Gehirn, denn mit Statistica brauchen Sie es nicht mehr.

Roman: Alexey, kannst du uns sagen, ob es realistisch ist, all diese Freude am Code in die Richtung zu übersetzen, die uns interessiert...

A. Sergeev hat etwas Ähnliches getan, als er Sultonovs Indikator in Code übersetzte, oder irre ich mich?

Das ist durchaus machbar. Ich sehe dort keine Grenzen, aber es ist möglich, in MQL4 Summen und Logarithmen zu bilden. Ich weiß nicht, was Sergejew getan hat. Aber soweit ich aus anderen Quellen weiß, war der schwierigste Teil der Berechnungen die Berechnung der Gamma-Funktion. TI kam nicht in Frage.

HideYourRichess : Siehaben elementare Ereignisse, Rückkehr, sind identisch mit elementaren Ereignissen aus TI? [...] Daraus ergibt sich die Frage, welche Art von "Symbolen" wir auf dem Markt haben.

Dazu gibt es bereits die Antwort von alexeymosc: Es handelt sich um [relative] Inkremente, die speziell für diesen Zweck diskretisiert werden können. Mein endgültiges Alphabet enthält zwischen 15 und 50 Zeichen.

Ich nehme die nächste Frage vorweg: "Ist es möglich, diese Art von Diskretisierung vorzunehmen, ohne dass der Badezimmerjunge überläuft?". Und warum nicht? Ich habe kein Verfahren, um zu überprüfen, ob ich es richtig gemacht habe, aber einige Überprüfungen von extremen und besonderen Fällen zeigen, dass ich keinen fatalen Fehler gemacht habe. Die Quelle mit dem Empfänger ist ebenfalls vorhanden.

Das ist der Kommunikationskanal, der nicht so leicht zu beantworten ist. Das scheint die Frage zu sein, mit der Sie mich umbringen wollen...

Es gibt eine vermeintliche Antwort, die Ihnen vielleicht ketzerisch vorkommt: Es handelt sich um die Gegenwart, d. h. um den Zeitraum, in dem die Informationen aus der Vergangenheit auf den Takt Null übertragen werden.

HideYourRichess : Wenn Sie "wirtschaftliche und andere Bedeutungen" nicht mit einbeziehen, von welchen Prozessen reden wir dann? Ein Prozess ist ein "physikalisches" Phänomen, er hat Ursachen und Folgen. Zum Beispiel der Vorgang, dass ein Apfel auf Newtons Kopf fällt. In der Anwendung auf Märkte, der Prozess des Kaufens und Verkaufens. Wo ist das alles in den Erträgen enthalten?

Ich glaube, Sie sind zu mechanistisch, meine Liebe. Ein Prozess kann legitimerweise ein Informationsphänomen sein, das in der Erwirtschaftung von Erträgen auf der Grundlage von realen Kauf- und Verkaufsprozessen besteht.

HideYourRichess: ter.ver, auf dem ter.inf. basiert, setzt die Unabhängigkeit der fraglichen Ereignisse oder Symbole voraus.

Zeigen Sie mir die Quelle, in der dies behauptet wird. Ich bezweifle, dass Sie eine finden werden.

Wo haben Sie gesehen, dass terver Unabhängigkeit erfordert - wenn diese Unabhängigkeit ein definierbarer Begriff in terver ist? Und was sind Markov-Ketten Ihrer Meinung nach? Und die Theoreme von Bayes? Und das Konzept der bedingten Wahrscheinlichkeit im Allgemeinen?

Avals: Alexey, wo sind die Berechnungen, die zu "weit entfernten und praktisch zuverlässigen Abhängigkeiten" führen? Und was verstehen Sie unter Nettorenditen ohne Volatilität (wie werden die Renditen ermittelt, denn nur Renditen enthalten Volatilität)?

Nun, ich habe Ihnen gesagt, dass ich keine Ahnung von Ökonometrie habe und hoffnungslos verwirrt bin, was das Konzept der Volatilität angeht...

Ich möchte den Berechnungscode hier nicht posten, es ist immer noch ein Know-how. Aber ich kann Ihnen unter vier Augen sagen, wie ich sie gemacht habe.

 
HideYourRichess:
Ergibt sich das nicht aus den Bedingungen des Problems? Die Formulierung ist übrigens ganz klassisch für ter.ver.


Ich weiß nicht)))) wenn Unabhängigkeit erforderlich ist, warum gibt es dann so etwas wie bedingte Entropie?

Wenn die Reihenfolge der Symbole des Alphabets nicht unabhängig ist (zum Beispiel folgt auf den Buchstaben "q" im Französischen fast immer ein "u", und auf das Wort "Avantgarde" in den sowjetischen Zeitungen folgt in der Regel "Produktion" oder "Arbeit"), ist die Menge an Informationen, die die Folge solcher Symbole enthält (und damit die Entropie), natürlich geringer. Diebedingte Entropie wird verwendet, um solchen Tatsachen Rechnung zu tragen. https://ru.wikipedia.org/wiki/Информационная_энтропия

 
faa1947:
Endlich kann eine vernünftige Diagnose gestellt werden.


Öffnen Sie es.

Übrigens verfügt Statistics nicht über eine so nützliche Funktion wie einen genetischen Algorithmus für die Auswahl von Eingabevariablen, über die NeuroShell verfügt. Das heißt, ein Produkt kann nicht alles abdecken. Auch Matlab hat keine eingebaute Funktionalität zur Berechnung der gegenseitigen Information, aber ein entsprechendes Modul ist geschrieben worden und wird übrigens nachgefragt.

 

Mathemat:

Ich glaube, Sie sind zu mechanistisch, meine Liebe. Ein Prozess kann legitimerweise ein Informationsphänomen sein, das in der Generierung von Erträgen auf der Grundlage tatsächlicher Kauf- und Verkaufsprozesse besteht.

So entstehen echte Renditen: kaufen, verkaufen, kaufen, verkaufen...

Mathemat:

Zeigen Sie mir die Quelle, in der dies behauptet wird. Ich bezweifle, dass Sie sie finden werden.

Wo haben Sie gesehen, dass ein Freistaat Unabhängigkeit verlangt - wenn diese Unabhängigkeit ein definierbarer Begriff im Freistaat ist? Und was sind Markov-Ketten Ihrer Meinung nach? Und die Theoreme von Bayes? Und das Konzept der bedingten Wahrscheinlichkeit im Allgemeinen?

Weder Markov noch Bayes haben etwas mit TI zu tun. Aber der irdische Glaube schon. Und glauben Sie mir, das Erfordernis der Unabhängigkeit ist der Eckpfeiler von ter.ver., über den sie sogar zu faul sind zu schreiben.
 

Tut mir leid, HideYourRichess, aber du scheinst den Bogen überspannt zu haben. Ich weiß nicht mehr, worüber ich mit Ihnen diskutieren soll, da Sie so hartnäckig auf völligem Unsinn bestehen. Ihre Logik der Argumentation

Ни Марков, ни Байес не имеют отношения к ТИ. А тер.вер. имеет.

ist für mich völlig unverständlich.

Ich werde es nicht glauben. Zeigen Sie mir die Quelle, die besagt, dass

Die Forderung nach Unabhängigkeit ist der Eckpfeiler des ter.faith.