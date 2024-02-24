L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3353
Il pensiero batch è in corso. Queste non sono probabilità, sono chiamate così a causa del loess fi utilizzato, per stimare la probabilità.
Non c'è altro modo di pensare! Utilizziamo algoritmi di MO già pronti, accompagnati da una serie di funzioni aggiuntive. Tutto l'insieme è chiamato "pacchetto".
Non litigate, ragazzi, vi stiamo leggendo.
aprite le serrature ;)
Sembra che non si tratti della stima puntuale della probabilità, ma della sua stima per intervallo. Per matstat, questo è un approccio comune - non solo ottenere una specifica stima numerica della probabilità, ma anche ottenere un intervallo in cui il valore vero di questa probabilità stimata cade con una data precisione (probabilità). Qui c'è qualche difficoltà di comprensione, perché il concetto di probabilità partecipa a due ipostasi diverse - sia il valore stimato stesso che l'accuratezza della sua stima. E si tratta di probabilità molto diverse)
La domanda non riguarda ciò che può fare. Si tratta di come ottenere probabilità di classe affidabili. In modo da essere sicuri che con una probabilità di classe di 0,8, l'80% dei casi sia previsto correttamente. Si può utilizzare una soglia, ad esempio. L'output del classificatore non è vero nella maggior parte dei casi, lo ripeto ancora una volta. O sovrastimano o sottostimano "by design". Ecco perché la soglia non funziona. Le probabilità reali si hanno quando non sovrastimano né sottostimano.
La cifra di 0,8 citata è una delle probabilità di classe. Ecco un istogramma delle probabilità di classe.
Io la vedo esattamente così e in nessun altro modo, perché se fosse altrimenti, significherebbe sovrallenamento. Per me, a una soglia fissa, la mancata corrispondenza dell'errore di predizione su OOV e OOS e sul file VNE è il principale segno di sovrallenamento. La soglia funziona bene. E le "probabilità reali" appartengono al regno di una certa finzione che non ha nulla a che fare con il codice e la terminologia reali utilizzati in questo caso.
Io ho fatto esattamente così e in nessun altro modo, perché se è diverso, significa sovrallenamento. Per me, a una soglia fissa, la mancata corrispondenza dell'errore di previsione su OOV e OOS e sul file VNE è il principale segno di sovrallenamento. La soglia funziona bene. E le "probabilità reali" appartengono a un'immaginazione che non ha nulla a che fare con il codice del mondo reale e con la terminologia utilizzata.
Come vi siete accorti che la vostra soglia funzionava perfettamente?
Errore di previsione della corrispondenza su ALE e OOS e sul file SNE
Come si è capito che il classificatore fornisce le probabilità corrette? Non solo i valori dell'intervallo. State leggendo quello che vi viene scritto?
Le probabilità dei modelli sono date dalle statistiche sul campione di addestramento.
Di conseguenza, senza un campione rappresentativo non sono accurate, quindi fattene una ragione :)
O capisci in cosa consiste il modello e ripesi le foglie secondo l'algoritmo che hai ideato...