L'Apprentissage Automatique dans le trading : théorie, modèles, pratique et trading algo - page 3355
J'espérais que quelqu'un irait au moins chercher l'info sur Google.
D'une certaine manière, vous ne prêtez pas attention à mes messages, qui se concentrent sur les probabilités. Le nom de la probabilité n'a pas d'importance, ce qui compte c'est que si elle ne s'améliore pas, le modèle est surentraîné, dans la poubelle. L'erreur de prédiction sur OOV, OOS et VNU devrait être à peu près la même.
Voici un autre histogramme
Algorithme différent - histogramme différent, bien que les étiquettes et les prédicteurs soient les mêmes. Si vous recherchez une sorte de probabilité théorique, impliquant que différents algorithmes de classification produiront les mêmes histogrammes ... cela ne me semble pas possible, car il faut travailler avec des algorithmes spécifiques qui prédisent et doivent être évalués, et non un quelconque idéal théorique. L'évaluation principale ici est le surajustement du modèle, et non la proximité des probabilités par rapport à un idéal théorique.
Le modèle ne donne pas les bonnes probabilités, quelles qu'elles soient. C'est là toute l'histoire. Vous pouvez avoir prédit des étiquettes qui correspondent parfaitement, mais les probabilités ne correspondent pas.
J'ai ajouté mon message. Tout modèle donne des probabilités correctes dans le sens où l'erreur de classification ne fluctue pas.
Voici un autre histogramme
Algorithme différent - histogramme différent, bien que les étiquettes et les prédicteurs soient les mêmes. Si vous recherchez une sorte de probabilité théorique, impliquant que différents algorithmes de classification produiront les mêmes histogrammes ... Cela ne me semble pas possible, car il faut travailler avec des algorithmes spécifiques, qui prédisent et doivent être évalués, et non avec un idéal théorique. L'évaluation principale ici est le surajustement du modèle, et non la proximité des probabilités par rapport à un idéal théorique.
Vous abandonnez ? Cherchez sur Google le calibrage des probabilités de classification, vous devriez le trouver dans R.
Nous parlons de choses différentes.
J'écris sur le résultat, et vous écrivez sur l'idéal des données intermédiaires.
Pour moi, il est évident que les valeurs de probabilité des étiquettes spécifiques données par RF et ada seront différentes, mais que les prédictions d'étiquettes spécifiques sont presque les mêmes. Les valeurs de probabilité ne m'intéressent pas, c'est l'erreur de prédiction qui m'intéresse
Si vous théorisez, il est très probablement impossible d'obtenir la probabilité de classe dans votre sens, puisque vous devez prouver que votre probabilité satisfait le théorème de la limite, ce qui est très douteux.
Pourtant, la question initiale a été posée et personne n'y a répondu.
Pourquoi ? Si dans le sens d'une thèse....
Pourquoi ? Si dans le sens d'une thèse....