Speravo che qualcuno cercasse almeno su Google il suggerimento.
In qualche modo non stai prestando attenzione ai miei post, concentrandoti sulle probabilità. Non importa come si chiama la probabilità, ciò che conta è che se non migliora, il modello è sovrallenato, nel cestino. L'errore di previsione su OOV, OOS e VNU dovrebbe essere più o meno lo stesso.
Ecco un altro istogramma
Algoritmo diverso - istogramma diverso, anche se le etichette e i predittori sono gli stessi. Se state cercando una sorta di probabilità teorica, che implichi che algoritmi di classificazione diversi producano gli stessi istogrammi... non mi viene in mente, dal momento che si deve lavorare con algoritmi specifici, che faranno previsioni e che devono essere valutati, non con un ideale teorico. La valutazione principale è l'overfitting del modello, non la vicinanza delle probabilità a un ideale teorico.
Il modello non fornisce le probabilità corrette, nessuna di esse. Questa è la storia. Potreste aver previsto etichette che corrispondono completamente, ma le probabilità non lo fanno.
Ho aggiunto il mio post. Qualsiasi modello fornisce probabilità corrette nel senso che l'errore di classificazione non fluttua.
Rinunciare? Cercate su Google Calibrazione della probabilità di classificazione, dovrebbe essere in R.
Stiamo parlando di cose diverse.
Io sto scrivendo del risultato, mentre voi state scrivendo dell'ideale dei dati intermedi.
Per me è ovvio che i valori di probabilità di etichette specifiche date da RF e ada saranno diversi, ma le previsioni di etichette specifiche sono quasi le stesse. Non mi interessano i valori di probabilità, ma l'errore di previsione.
Se si teorizza, è molto probabile che sia impossibile ottenere la probabilità di classe nel senso da voi indicato, poiché bisogna dimostrare che la probabilità soddisfa il teorema del limite, il che è molto dubbio.
Tuttavia, la domanda originale è stata posta e nessuno ha risposto.
