Maschinelles Lernen im Handel: Theorie, Modelle, Praxis und Algo-Trading - Seite 3104

 

Der ganze Schmerz eines solchen A/B-Tests in einem Video

(nicht für besonders beeinflussbare Personen geeignet)


 
Maxim Dmitrievsky #:

Der ganze Schmerz eines solchen A/B-Tests in einem Video

(nicht für besonders beeinflussbare Personen geeignet)


Finden Sie nicht auch, dass er am Anfang von einem binären Beispiel spricht, aber im Code eine Reihe von Zahlen aus einer Normalverteilung nimmt?

Außerdem hängen alle diese Tests von einem Zufallszahlengenerator ab, was Sie ebenfalls berücksichtigen sollten. Die Art des Auftretens der Zahlen kann für jedes Phänomen komplexer sein, auch wenn es eine Normalverteilung hat.

Bei dieser Herangehensweise an das Problem ist es, wie er zeigt, sinnvoller, nicht die "Tage" zu messen, sondern die Dynamik des Erreichens der Schwelle und die Zeit des Überschreitens der Schwelle zu bewerten.

Generell wäre es sinnvoller, das Phänomen an realen Daten zu beobachten, um daraus Schlüsse ziehen zu können.

 
Aleksey Vyazmikin #:

Meinen Sie nicht, dass er am Anfang von einem binären Beispiel spricht, aber im Code genau den Zahlenbereich einer Normalverteilung nimmt?

Außerdem hängen alle diese Tests von einem Zufallszahlengenerator ab, was ebenfalls berücksichtigt werden sollte. Die Art des Auftretens von Zahlen kann für jedes Phänomen komplexer sein, auch wenn es eine Normalverteilung haben kann.

Bei einer solchen Herangehensweise an das Problem ist es, wie er zeigt, sinnvoller, nicht die "Tage" zu messen, sondern die Dynamik des Erreichens der Schwelle und die Zeit des Überschreitens der Schwelle zu schätzen.

Generell wäre es sinnvoller, das Phänomen an realen Daten zu beobachten, um daraus Schlüsse ziehen zu können.

Das muss sehr schwierig sein, wenn man nie weiß, wovon man spricht und in welchem Kontext).

Und der Punkt ist, dass selbst wenn man eine Kurve und einen Test aus derselben Verteilung hat, man nicht immer eine Hypothese bestätigen oder verneinen kann, z. B. über die Robustheit des Modells, ganz zu schweigen davon, wenn sie aus unterschiedlichen Verteilungen stammen.

Hinzu kommt, dass Mehrfachtests die statistische Signifikanz solcher Tests mit Null multiplizieren.

 
Maxim Dmitrievsky #:

es muss sehr schwierig sein, wenn man nie weiß, wovon man überhaupt spricht? und den Kontext )

und der Punkt hier ist, dass man, selbst wenn man eine Spur und einen Test aus derselben Verteilung hat, nicht immer eine Hypothese bestätigen oder verneinen kann, zum Beispiel über die Robustheit des Modells. ganz zu schweigen davon, wenn sie aus verschiedenen Verteilungen stammen.

Hinzu kommen Mehrfachtests, deren statistische Signifikanz mit Null multipliziert wird.

Aha. Er redet über das Wesentliche und lässt die Ohren hängen....

 
Aleksey Vyazmikin #:

Ich verstehe. Er redet über das Wesentliche und hält sich nur die Ohren zu....

Sie verstehen nicht, worum es geht.

 
Maxim Dmitrievsky #:

Sie verstehen nicht, worum es geht.

Was jemand dort sagt und weitreichende Schlussfolgerungen zieht, ist schon klar, aber er erkennt nicht, dass das Ergebnis vom Algorithmus des Zufallszahlengenerators abhängt.

Die einzige Schlussfolgerung, die wertvoll ist, ist die, dass die Computermodellierung in einer primitiven Form es nicht erlaubt, sich realen Prozessen zu nähern, ohne sie zu verstehen.

Wenn er die Verteilung in zwei Teile mit 0 und 1 unterteilt und zeigt, dass er eine Größenordnung mehr Einheiten hat, wäre ich überrascht. Sie sehen, er sagt das eine und tut das andere.

Ich versuche gerade, die Verteilungswahrscheinlichkeit (ich habe eine Klassifizierung) im Quantensegment für die nächsten 3 Monate durch die tatsächliche Veränderung der Verteilung in der Zeit vorherzusagen, und durch Tests habe ich es geschafft, die Genauigkeit aufgrund dieser Metriken auf 15% zu erhöhen, und ich denke, dass dies nicht die Grenze ist.

Nun, im Allgemeinen hat der Autor des Videos eine gute "Ausrede" gefunden, warum er bei dem Experiment eine falsche Schlussfolgerung gezogen hat. Ja, das ist bequem, aber nicht funktional. Ich meine, dass es nach seinen Worten notwendig ist, die Zeit/Anzahl der Beobachtungen festzulegen und daraus eine Schlussfolgerung zu ziehen. Im Allgemeinen verstehe ich ihn hier wirklich nicht - wozu soll das gut sein, außer zur Rechtfertigung gegenüber dem Arbeitgeber.

 
Aleksey Vyazmikin #:

Was der Mann da sagt und weitreichende Schlüsse zieht, ist schon klar, aber er weiß nicht, dass sein Ergebnis vom Algorithmus des Zufallszahlengenerators abhängt.

p-hacking ist ein bekanntes Problem, das er versucht hat, den Nerds zu erklären, die das Wesentliche nicht verstanden haben.

können wir nicht tonnenweise bedeutungslose buchstaben machen? es ist schon klar, dass es kein verständnis gab.
 
Maxim Dmitrievsky #:

p-hacking ist ein bekanntes Problem, das er versucht hat, den Nerds zu erklären, die es nicht verstanden haben.

Können wir nicht tonnenweise bedeutungslose Buchstaben verwenden? Es ist bereits klar, dass es kein Verständnis gab.

Es ist schade, dass Sie immer noch nicht verstehen, was ich Ihnen zu vermitteln versuche.

 
Fluchen Sie nicht.
 
Maxim Dmitrievsky #:

Der ganze Schmerz eines solchen A/B-Tests in einem Video

(nicht für besonders beeinflussbare Personen geeignet)


Es ist höchste Zeit, dass wir uns alle auf die helle Seite begeben - auf die matstat!)

Die dunkle Seite ist wie immer dagegen) Dunkel in dem Sinne, dass sie immer versucht, alles auf das Dunkle und Unklare zu reduzieren - in der Extremversion auf ein gewisses "Flair").

Grund der Beschwerde: