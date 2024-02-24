Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2564
Foi o que escrevi - com o objetivo de identificar um padrão consistente que dê uma vantagem estatística em um determinado local. E nós quantificamos os preditores - qualquer preditor.
Mas "como" fazer isso é uma questão em aberto - até agora apenas por enumeração de tabelas preparadas, feitas com base em suposições empíricas ou partição estatística do algoritmo CatBoost.
Na figura 3 "quanta" - o mais provável é que seja escolhida a faixa do meio, na qual há alguma vantagem estatística.
Meu entendimento é que há um problema com a colinearidade (correlação) de quase todos os preditores. Há também um problema combinatório - se há muitos preditores, então pode haver demasiados quanta. Provavelmente, vale a pena baixar a dimensionalidade primeiro pela PCA ou PLS.
Alguém tentou anexar o paradoxo do montichol ao comércio/tomada de decisão?
Meu entendimento é que há um problema com a colinearidade (correlação) de quase todos os preditores. Há também um problema combinatório - se há muitos preditores, então pode haver demasiados quanta. Pode valer a pena baixar a dimensionalidade por PCA ou PLS primeiro.
Eu escrevi acima que excluo os preditores que têm sinal semelhante na amostra, ou seja, a correlação entre os preditores de quantis diminui, embora eu use meu método de agrupamento e seleção do melhor resultado de um grupo de semelhantes.
Quanto ao problema combinatório - onde exatamente você o vê? Na amostra de treino? Se assim for, então teoricamente pode ser, e provavelmente há um sentido para aplicar o PCA aqui, mas não antes de a amostra final estar pronta. Eu ainda não encontrei tal problema; pelo contrário, há menos preditores do que na amostra inicial.
Eu li o seu post, construa a heurst e o que fazer com ela?
Escrevi acima que excluo os preditores que têm um sinal semelhante na amostra, ou seja, a correlação entre os preditores de quantis é reduzida, embora eu use meu método de agrupamento e seleção do melhor resultado de um grupo de preditores semelhantes.
Quanto ao problema combinatório - onde exatamente você o vê? Na amostra de treino? Se assim for, então teoricamente pode ser, e provavelmente há um sentido para aplicar o PCA aqui, mas não antes de a amostra final estar pronta. Eu não encontrei tal problema na realidade - pelo contrário, há menos preditores do que na amostra inicial.
Bem, se dividirmos cada preditor em duas partes e procurarmos todas as regras possíveis onde uma metade de cada preditor está incluída, então haverá 2^N partes diferentes, onde N é o número de preditores. Agora cada uma dessas peças pode ser tirada ou descartada - obtemos 2^(2^N) variantes. Este é um número enorme, mesmo com um pequeno N.
Bem, se dividirmos cada preditor em apenas dois pedaços e olharmos para todas as regras possíveis que incluem uma metade de cada preditor, então haverá 2^N pedaços diferentes, onde N é o número de preditores. Agora cada uma dessas peças pode ser tirada ou descartada - obtemos 2^(2^N) variantes. Este é um número enorme, mesmo com um pequeno N.
Primeiro descarte e depois combine.