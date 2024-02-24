Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1279
Descobri-lo e fazer lançamentos são coisas diferentes. Eu ainda estou a experimentar. Estou a misturar os preditores neste momento. Talvez eu desista, tal como desisti da NS por incapacidade de lidar com o barulho.É fácil de perceber. Você tem que olhar para o código por algumas horas e tudo ficará claro.
Sim, é claro que é diferente, mas uma boa mão pode fazer muito! Eu, por outro lado, tenho dificuldade em entender o código dos outros, por isso nem sequer me meto nisso.
E a floresta, assim está no seu conceito será sempre barulhenta (na verdade, o ruído branco deve sobrepor o ruído com uma resposta colectiva mais confiante), porque funciona não devido à qualidade, mas sim à quantidade, penso que precisamos, de alguma forma, de controlar mais e qualidade das árvores e a sua singularidade.
Não entendo porque não gosta da minha ideia de recolher folhas das árvores; pode ir a uma sondagem, ou tentar distribuir as folhas para que não se sobreponham na amostragem... O ruído é obviamente menor, mas é importante que a regra na folha tenha um significado real, então ela será estável com o tempo.
Não percebo porque não gostas da minha ideia de recolher folhas das árvores - podes votar ou tentar distribuir as folhas para que não se sobreponham na amostra... Se você não tiver ruído suficiente, é importante que a regra na folha tenha um significado real, então ela será estável com o tempo.
Eu ainda não explorei completamente a floresta. É por isso que não tenho tempo para me distrair com mais nada.
Estou a ver. Resolva isso, escreva sobre suas conquistas - interessante.
Agora estou tentando fazer um pool de modelos CatBoost tão estranhos, que têm um pequeno número de árvores 1-30, para um aprendizado mais profundo e avaliar se o aprendizado profundo abaixo de 100-300 árvores faz sentido.
Curiosamente, a primeira parte da amostra (destacada em azul, mas um pouco mais do que o necessário, pois mostrou uma quebra do último equilíbrio alto, dizem que foi longo) para o treinamento parece muito medíocre após a aplicação do modelo, e então há um padrão que começa a explorar o modelo, enquanto na amostra de teste (na qual o modelo é selecionado) não é tão óbvio quanto no exame (não envolvido no treinamento). Talvez isto seja um sinal de subtreinamento, se é melhor do que o supertreinamento é a questão.
Se alguém estiver interessado, eu posso colocar as pilhas, a amostragem, as configurações para correr através da linha de comando, bem qualquer um que não tenha dominado a pitão como eu.
Vou dar a versão minuto a minuto, e anexar o relatório de negociação do testador.
Mas eu melhorei um pouco os indicadores.
A razão Sharpe é agora de 0,29.
Finalmente, a permutação contada e a recontagem real da floresta com 1 preditor retirado. Os resultados não são nada semelhantes.
Os autores da permutação experimentaram 6 preditores e eu fiz com 65. Talvez com 6 preditores seja mais fácil separar a entrada de ruído. Além disso, a floresta ainda é aleatória, talvez também tenha acrescentado a aleatoriedade à lista de importância.
Agora vou correr novamente com os mesmos dados e pela manhã vou comparar 4 tabelas de importância.
As mais parecidas foram 2 tabelas de importância de permutação (apenas de execuções diferentes com os mesmos dados).
As tabelas de importância obtidas pela recontagem da floresta ao remover 1 preditor - não semelhantes entre si, nem à permutação.
Olá maquinistas!
Sim, por aqui só há testers grails, e o ballet marlesoniano é dirigido pelo aprendiz do noivo e pela empresa :)
