Isso acaba sendo um teste muito bom do modelo por meio do viés da janela. Se ele apresentar muitas defasagens, em vez de zero, com estatísticas melhores (como mi), então o modelo se baseia em randomização.
Caso contrário, seria inequívoco, não pode haver tantas TS lucrativas ao mesmo tempo.
Tentei selecionar por meio do std de acordo com as instruções de Sanych - aproximadamente o mesmo quadro. Mas selecionei conjuntos de características, não cada uma separadamente.
Vou examinar as características separadamente novamente
A melhor pontuação é o atraso 9, mas o padrão é melhor em 0:
Okabe, dê uma olhada nos backtests de ambos, 9º:
0-я:
O 0 tem, logicamente, uma dispersão menor de valores no backtest, porque o std para mi é inicialmente menor. Mas isso não afeta os resultados em OOS, nem o valor mais alto de mi (informação mútua)
Digamos que estejamos treinando novamente com um grande número de recursos (14 recursos aqui).
Vamos examinar as estatísticas de cada recurso e escolher apenas os melhores para o modelo com 9 defasagens:
Alguns recursos são totalmente anulados, ou seja, não têm valor. Vamos escolher apenas aqueles que são maiores que 0,004 e treinar com eles:
Treinamento e teste:
Mnde.
Conclusão: a correlação de informações mais alta na amostra de treinamento não ajuda a melhorar o modelo na amostra de teste.
Mas isso pode ser usado para extrair frações de % em competições, que é o que os profissionais dizem, que a pré-seleção de recursos para modelos modernos como o Busting não dá quase nada.
O std da estimativa numérica da correlação entre uma característica e uma característica de destino?
Primeiro você precisa remover as características correlacionadas. Por algum motivo, a correlação ideal em minhas características é de 75%.
Em seguida, selecione de 5 a 10 características com pontuação máxima.
Desenhe figuras, como acima em minha postagem, para garantir que a correlação divida as notas.
O erro de previsão deve ser inferior a 30%. Se não for, as características terão de ser descartadas.
Você pode ver na entropia que a correlação é insignificante (0,003), mas deve tender a 1.
Mas eu estimei a diferença, portanto, não importa. Ainda assim, deve haver uma pequena melhoria. Talvez não haja porque a diferença é mínima.
Em geral, mesmo que tudo seja bom (há bons recursos no conjunto), você não precisa remover os outros recursosÉ assim, um tarugo para outras coisas, como uma janela fora do padrão
A pontuação em si é uma coisa relativa.
Vou repetir as imagens.
Ruim, sem esperança
Melhor, se houver várias delas, podemos falar em 30% de erro de previsão.
E o lixo deve ser removido, porque no conjunto de treinamento o chip pode ficar a favor do lixo, é mais fácil encontrar o valor que leva ao ótimo.
a pré-seleção de recursos para modelos modernos do tipo Busting não produz quase nada.
O Busting procura as melhores divisões de todas as colunas e de todos os exemplos. Ou seja, ele usa as melhores fichas.
Schuch. forest pega metade das fichas e metade dos exemplos (a fração é configurável) para cada árvore e, em seguida, de 20 a 100 árvores, encontra a média. Se houver apenas 5 chips informativos de 200 chips, algumas das árvores não conterão chips informativos (em média, 2,5 chips informativos por árvore). E faremos a média de uma parte das árvores informativas com árvores de ruído. O resultado também será muito ruidoso.
Uma árvore de ruído funcionará bem se houver muitas fichas informativas (como nos exemplos clássicos/tarefas de MO).
O Busting encontrará e usará as fichas mais informativas, pois verifica todas elas. Portanto, pela lógica do bousting, ele selecionará as melhores fichas por si só. Mas o bousting também tem seus próprios problemas.
O Busting encontrará e usará as fichas mais informativas, pois verifica todas elas. Portanto, de acordo com a lógica do bousting, ele selecionará as melhores fichas. Mas o bousting também tem seus próprios problemas.
Criei um tópico com uma amostra que prova o contrário: o reforço não é onipotente, especialmente fora da caixa.