Maxim Dmitrievsky #:
Schubladendenken ist in. Es handelt sich nicht um solche Wahrscheinlichkeiten, sondern sie werden so genannt, weil der Löß fi verwendet wird, um die Wahrscheinlichkeit zu schätzen.

Wie erhält man echte Klassenwahrscheinlichkeiten?

Es gibt keinen anderen Weg, darüber nachzudenken! Wir verwenden handelsübliche MO-Algorithmen, die von einer Reihe zusätzlicher Funktionen begleitet werden. Alles zusammen wird als "Paket" bezeichnet.

Was sind"echte Klassenwahrscheinlichkeiten"? Zum Beispiel liefert die Funktion 

predict(object, newdata, type = c("vector", "probs", "both","F"))
gibt "Wahrscheinlichkeitsklassen-Schätzungen" zurück. Der Algorithmuskann keine anderen Wahrscheinlichkeiten als "Schätzungen" enthalten.



 

Nicht streiten, Leute, wir lesen euch.

Öffnet die Schlösser ;)


СанСаныч Фоменко #:

Es gibt keinen anderen Weg des Denkens! Wir verwenden fertige MO-Algorithmen, die von einer Reihe von Zusatzfunktionen begleitet werden. Alles zusammen wird ein "Paket" genannt.

Was sind"echte Klassenwahrscheinlichkeiten"? Zum Beispiel liefert die Funktion

gibt"Wahrscheinlichkeitsklassen-Schätzungen" zurück. Andere Wahrscheinlichkeiten als "Schätzungen" kann der Algorithmus nicht enthalten.
Die Frage ist nicht, was er kann. Es geht darum, wie man zuverlässige Klassenwahrscheinlichkeiten erhält. So könnte man sicher sein, dass bei einer Klassenwahrscheinlichkeit von 0,8 80 % der Fälle richtig vorhergesagt wurden. Und man könnte zum Beispiel einen Schwellenwert verwenden. Die Ergebnisse der Klassifikatoren tun dies in den meisten Fällen nicht, ich wiederhole es noch einmal. Sie überschätzen oder unterschätzen "absichtlich". Deshalb funktioniert der Schwellenwert auch nicht. Echte Wahrscheinlichkeiten sind, wenn sie weder über- noch unterschätzt werden.

Sie haben bereits gezeigt, dass Sie es nicht wissen. Es gibt also noch mehr zu lernen. Also "müssen wir alle MOEs beherrschen" und das Schubladendenken abschaffen.
 

Es scheint, dass es nicht um eine Punktschätzung der Wahrscheinlichkeit geht, sondern um ihre Intervallschätzung. Für Matstat ist dies ein üblicher Ansatz - nicht nur um eine bestimmte numerische Schätzung der Wahrscheinlichkeit zu erhalten, sondern auch um ein Intervall zu erhalten, in das der wahre Wert dieser geschätzten Wahrscheinlichkeit mit einer bestimmten Genauigkeit (Wahrscheinlichkeit) fällt. Hier gibt es einige Verständnisschwierigkeiten, da der Begriff der Wahrscheinlichkeit an zwei verschiedenen Hypostasen beteiligt ist - sowohl der geschätzte Wert selbst als auch die Genauigkeit seiner Schätzung. Und das sind ganz unterschiedliche Wahrscheinlichkeiten)

Ich habe mich zwar nicht eingehend mit der konformen Vorhersage befasst, aber vielleicht irre ich mich ja.

 
Maxim Dmitrievsky #:
Die Frage ist nicht, was er tun kann. Es geht darum, wie man zuverlässige Klassenwahrscheinlichkeiten erhält. So dass man sicher sein kann, dass bei einer Klassenwahrscheinlichkeit von 0,8 80 % der Fälle richtig vorhergesagt werden. Und man könnte zum Beispiel einen Schwellenwert verwenden. Das Ergebnis des Klassifikators stimmt in den meisten Fällen nicht, ich wiederhole es noch einmal. Entweder über- oder unterschätzt er "absichtlich". Deshalb funktioniert der Schwellenwert nicht. Echte Wahrscheinlichkeiten liegen vor, wenn sie weder über- noch unterschätzt werden.

Das ist nicht das, was Sie haben. Die angegebene Zahl von 0,8 ist eine der Klassenwahrscheinlichkeiten. Hier ist ein Histogramm der Klassenwahrscheinlichkeiten.


Und ich habe es genau so und nicht anders, denn wenn es anders ist, bedeutet es Übertraining. Für mich ist bei einem festen Schwellenwert die Nichtübereinstimmung des Vorhersagefehlers in der OOV- und OOS-Datei sowie in der VNE-Datei das wichtigste Anzeichen für Übertraining. Bei mir funktioniert der Schwellenwert gut. Und "echte Wahrscheinlichkeiten" sind eine Fiktion, die nichts mit dem tatsächlichen Code und der in diesem Fall verwendeten Terminologie zu tun hat.

СанСаныч Фоменко #:

Sie irren sich. Die angegebene Zahl von 0,8 ist einer der Werte für die Klassenwahrscheinlichkeit.


Ich habe es genau so und nicht anders, denn wenn es anders ist, bedeutet das Übertraining. Für mich ist bei einem festen Schwellenwert die Nichtübereinstimmung des Vorhersagefehlers in der OOV- und OOS-Datei sowie in der VNE-Datei das wichtigste Anzeichen für Übertraining. Bei mir funktioniert der Schwellenwert gut. Und "reale Wahrscheinlichkeiten" sind eine Fiktion, die nichts mit realem Code und der dafür verwendeten Terminologie zu tun hat.

Wie haben Sie festgestellt, dass Ihre Schwelle perfekt funktioniert?
Für Sie ist es Fantasie, für jemand anderen ist es alltäglich.
Aleksey Nikolayev #:

Es scheint, dass es nicht um eine Punktschätzung der Wahrscheinlichkeit geht, sondern um ihre Intervallschätzung. Für Matstat ist dies ein üblicher Ansatz - nicht nur um eine bestimmte numerische Schätzung der Wahrscheinlichkeit zu erhalten, sondern auch um ein Intervall zu erhalten, in das der wahre Wert dieser geschätzten Wahrscheinlichkeit mit einer bestimmten Genauigkeit (Wahrscheinlichkeit) fällt. Hier gibt es einige Verständnisschwierigkeiten, da der Begriff der Wahrscheinlichkeit an zwei verschiedenen Hypostasen beteiligt ist - sowohl der geschätzte Wert selbst als auch die Genauigkeit seiner Schätzung. Und das sind ganz unterschiedliche Wahrscheinlichkeiten)

Allerdings habe ich mich nicht eingehend mit der konformen Vorhersage befasst, und ich kann mich irren.

Wir sprechen hier von einem etwas anderen Ansatz, bevor jemand danach gegoogelt hat :)
 
Maxim Dmitrievsky #:
Wie haben Sie festgestellt, dass Ihre Schwelle perfekt funktioniert?
Für Sie ist es fantastisch, für manche ist es alltäglich.
Übereinstimmender Vorhersagefehler in der OOV- und OOS-Datei und in der INE-Datei
СанСаныч Фоменко #:
Übereinstimmender Vorhersagefehler bei ALE und OOS sowie bei der ANS-Datei
Wie haben Sie festgestellt, dass der Klassifikator die richtigen Wahrscheinlichkeiten angibt? Nicht nur die Werte im Bereich. Lesen Sie, was Ihnen geschrieben wird?

Wenn Sie einen Schwellenwert von 0,8 festlegen, sind dann 80 % der Abschlüsse profitabel? Und wenn er bei 0,51 liegt?

Es ist fast sicher, dass Sie das nicht haben werden. Sehen Sie sich das an.
 
Maxim Dmitrievsky #:
Wie haben Sie festgestellt, dass der Klassifikator die richtigen Wahrscheinlichkeiten angibt? Nicht nur die Werte im Bereich. Lesen Sie, was Ihnen geschrieben wird?

Die Wahrscheinlichkeiten von Modellen werden durch Statistiken über die Trainingsstichprobe angegeben.

Dementsprechend sind sie ohne eine repräsentative Stichprobe nicht genau, also finde dich damit ab :)

Entweder Sie finden heraus, woraus das Modell besteht, und gewichten die Blätter nach dem von Ihnen entwickelten Algorithmus neu...

