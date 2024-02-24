Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3325
Aqui está o vídeo
No meu caso, tratava-se de um lugar na Internet, ou seja, um link.
Não me lembro do artigo exato,
mas não há um milhão deles, dê uma olhada.
Foi isso que percebi. Só estou perguntando se a causa disso já foi determinada. Não o que está quebrado, mas por que os sinais estão faltando.
O motivo é simples, como pretendido: os sinais estão ausentes porque, em novos dados, os sinais estão fora de um intervalo estreito aceitável.
Bem, isso pode ser comparado à classificação: há padrões conhecidos claros e há padrões desconhecidos obscuros. Com o passar do tempo, há cada vez mais desconhecidos e não há mais nada na classe "conhecida".
Afirma-se que, com esse algoritmo, foi possível conquistar os primeiros lugares no cagle, mas não acho que tenha havido tarefas simples...
Vamos tentar descobrir isso? Não entendo de fórmulas - para meu grande pesar.
E se você analisar a ideia, ela é muito ruim para os dados de mercado.
Ela sugere a exclusão de pares de exemplos de classes diferentes que são muito próximos uns dos outros. Se observarmos o terceiro exemplo, idealmente todos os exemplos de 0,2 a 0,8 serão removidos e somente as áreas abaixo de 0,2 e acima de 0,8 com pureza absoluta de classes permanecerão. Qualquer modelo os classificaria com mais facilidade.
Anteriormente, já mostrei que um exemplo tão simples e a árvore se dividirão facilmente se você usar folhas com alta pureza de classes (e não dividir folhas com até 1 exemplo em uma folha).
Mas esse é um exemplo artificial.
Nos dados de mercado, não haverá blocos puros com predominância de uma classe. Ou seja, você terá que limpar quase tudo. Por exemplo, havia 1.000 pontos, 900 foram limpos, o restante deles de alguma forma atingiu a limpeza das folhas, por exemplo, 70% - isso não parece ruim e você pode ganhar dinheiro. Mas, quando você começar a negociar de verdade, haverá exemplos dos quais nos livramos durante a limpeza (9 detritos para 1 restante) e os indicadores de 70% cairão para 53%, por exemplo, e você perderá com spread, slippages etc.
Prefiro uma árvore e uma folha com 53% de pureza honesta de uma das classes. E não a usarei.
Não vejo a conexão aqui. Do que isso decorre?
Também não estou usando fórmulas, mas ideias.
Nesse ponto, nossos pensamentos estão de acordo em relação ao resultado. Sim, eu espero uma amostra altamente desbastada, mas, pelo que entendi, o processo é iterativo, o que significa que você pode saber a medida e parar muito antes e usar os mesmos dados para criar os mesmos modelos de madeira, que terão menos rachaduras e valores mais confiáveis nas folhas.
Entendi corretamente que os centros iniciais estão localizados aleatoriamente?