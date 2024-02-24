Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3355
Eu esperava que alguém pudesse pelo menos pesquisar a dica no Google.
De alguma forma, você não está prestando atenção às minhas publicações, concentrando-se nas probabilidades. Não importa como a probabilidade é chamada, o que importa é que, se ela não melhorar, o modelo está treinado em excesso, na lixeira. O erro de previsão em OOV, OOS e VNU deve ser praticamente o mesmo.
Aqui está outro histograma
Algoritmo diferente - histograma diferente, embora os rótulos e preditores sejam os mesmos. Se você estiver procurando algum tipo de probabilidade teórica, o que implica que diferentes algoritmos de classificação produzirão os mesmos histogramas ... isso não me ocorre, já que você precisa trabalhar com algoritmos específicos e eles farão previsões e precisam ser avaliados, não um ideal teórico. A principal avaliação aqui é o ajuste excessivo do modelo, não a proximidade das probabilidades com algum ideal teórico.
O modelo pronto para uso não fornece as probabilidades corretas, nenhuma delas. Essa é a história. Você pode ter previsto rótulos que correspondem totalmente, mas as probabilidades não.
Adicionei minha postagem. Qualquer modelo fornece probabilidades corretas no sentido de que o erro de classificação não flutuará.
Desistir? Pesquise a calibração de probabilidade de classificação no Google, ela deve estar no R.
Estamos falando de coisas diferentes.
Eu estou escrevendo sobre o resultado, e você está escrevendo sobre o ideal de dados intermediários.
Para mim, é óbvio que os valores de probabilidade de rótulos específicos fornecidos por RF e ada serão diferentes, mas as previsões de rótulos específicos são quase as mesmas. Não estou interessado nos valores de probabilidade, estou interessado no erro de previsão
Se você teorizar, é muito provável que seja impossível obter a probabilidade de classe no seu sentido, já que você precisa provar que sua probabilidade satisfaz o teorema do limite, o que é muito duvidoso.
Ainda assim, a pergunta original estava lá, ninguém respondeu.
