Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2563
então você precisa ser mais específico.
Estou a pensar em escrever um artigo a explicar com mais detalhes o que estou a fazer.
Eu queria discutir abordagens semelhantes aqui, mas afinal não havia interesse.
Em resumo, eis o que eu faço por etapas:
1. Por meio do CatBoost eu salvo diferentes tipos de tabelas quânticas com diferentes números de "quanta" (pré-splits forçados).
2. eu analiso cada quantum pelo roteiro para estabilidade e capacidade de previsão do indicador.
2.1 Ultrapassar o limiar de completude e precisão de toda a amostra.
2.2 Avaliação da estabilidade do desvio do indicador preditor do indicador alvo em relação ao indicador alvo na área da amostra - Retiro 7 pontos e peneio por RMS.
3. selecciono os melhores quanta de todas as tabelas para cada preditor tendo em conta a sua não sobreposição no espaço de alcance para o qual a quantização teve lugar.
4. Eu crio uma nova amostra (dois tipos combinados em todos os quanta e nenhum) onde o preditor do quanta tem um sinal de 0 ou 1.
5. Excluo os preditores que têm um sinal semelhante na amostra.
6. Ensinar o modelo.
Se após o ponto 5 também fizermos uma verificação de robustez na amostra de teste e exame e selecionarmos apenas os preditores que mostram um resultado satisfatório, então os resultados do treinamento melhoram consideravelmente. Isto é uma espécie de fraude, mas se vale a pena usar ou não, é uma questão de experimentação. O meu pressuposto é que quanto mais tempo os indicadores estiverem estáveis, mais provável é que continuem estáveis.
Se você tiver alguma dúvida sobre uma determinada etapa, pergunte, tentarei lhe dar mais informações.P.S. Você também poderia simplesmente salvar a tabela de quant amostra, excluir preditores ineficientes e treinar em uma amostra regular - isso também melhorará o aprendizado.
O que são mesas quânticas? Mesas divisórias de árvores? Nunca fiz tal coisa.melhor um artigo com exemplos
As tabelas quânticas estão dividindo um preditor em limites/granjas, que estão então envolvidos na aprendizagem. Sim, já escrevi sobre isso muitas vezes.
Vocês ainda não mostraram nada de útil, só tagarelice. Nerds
Continua a vigiar.
A questão é o que quantificamos, como e com que propósito.
Uma vez tentei quantificar por lotes de Monotonicidade Equivalente, quando se usa um preditor em vez de tempo. Eu não vi nada especialmente bom.
Ah, entendi. Parece que o recurso de quantização só é usado para acelerar a aprendizagem. Ou é uma difícil? Sou apenas um apoiante da abordagem clássica, mais um pouco das minhas próprias perversões.
A aceleração da aprendizagem é uma das vantagens, mas há também o efeito da agregação de estados preditores semelhantes. Grosso modo, eu considero a seção de partição como um preditor binário separado que permite remover o ruído do preditor básico.
Além do efeito de uma melhor aprendizagem, consigo reduzir o número de árvores no modelo que dão resultados semelhantes, e assim reduzir o ruído no modelo.
Estou a experimentar tabelas de quadros rígidos, isto é quando a partição não se baseia em dados, mas em determinados critérios, por exemplo, os níveis de Fibonacci...
Foi o que escrevi - que o propósito é identificar um padrão consistente que dê uma vantagem estatística em uma determinada área. E nós quantificamos os preditores - qualquer preditor.
E "como" fazê-lo é uma questão em aberto - até agora apenas uma pesquisa de tabelas pré-fabricadas feitas em suposições empíricas ou algoritmo de particionamento estatístico CatBoost.
Na figura 3 "quanta" - o mais provável é que seja escolhido o intervalo médio, o que tem alguma vantagem estatística.