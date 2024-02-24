Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2788
Você obtém muitas inconsistências, incluindo a remoção de outliers. Eles geralmente representam 10% do tamanho do conjunto de dados, de acordo com diferentes cálculos. Eliminado e o que, e como o modelo será negociado quando o outlier for detectado? )
Nada pode ser feito assim, depois de ler livros e artigos - esse é um estágio separado e é chamado de aprendizado. Sem conhecimento sistemático de estatística, não há nada a fazer no MOE.
É sempre necessário fazer, tentando atingir a meta.
Se considerarmos uma meta intermediária - capacidade máxima de previsão do preditor, então:
1. É obrigatório remover os outliers. Se os valores maiores que 0,5% do quantil forem considerados discrepantes, então os discrepantes serão menores que 1%. A propósito, essa é a porcentagem de paradas acionadas no futuro. Desenvolvemos o próprio sistema de negociação e temos limitações digitais.
2. O pré-processamento é obrigatório, mas, novamente, depende do tipo. Se estivermos falando sobre a capacidade preditiva do preditor, então não é possível corrigir inclinações que aumentem a capacidade preditiva. Este é um exemplo. Em geral, usamos algum algoritmo de pré-processamento e avaliamos seu efeito na capacidade de previsão. A resposta aqui é.
3. Tenha sempre em mente o significado de MO, que, em minha opinião, é a busca de alguns padrões. Obviamente, na RF, qual é o número de padrões contidos em, por exemplo, 5.000 barras? Ou a partir de qual valor de janela o aumento do número de padrões não reduz o erro? Ou, para alguma janela fixa, a partir de qual valor do número de padrões o erro para de cair?
Respostas para RF.
1. não faz sentido aumentar a janela acima de 1.500 barras.
2. a relação entre o erro e o número de padrões (árvores) pode ser vista claramente no gráfico:
Mínimo 50. Em geral, de 100 a 200. O gráfico não muda quando se aumenta a janela para 5000.
Você deve sempre formular claramente a meta e o critério para atingi-la. Todo o resto é blá blá blá.
Detectamos emissões por meio da floresta de isolamento, as excluímos e o resultado do treinamento não mudou. Tentei treinar com emissões - nenhum resultado. Fiquei com a impressão de que o modelo (catbust) não se importa com as emissões. Como se elas fossem bem reconhecidas por meio da pesquisa de anomalias, mas sua remoção não fosse necessária.
Os outliers afetam fortemente a capacidade de previsão, e a estabilidade da capacidade de previsão afeta a estabilidade do erro de previsão.
E para o modelo em si, isso depende do modelo, especialmente se a amostra de treinamento for obtida da amostra.
Veio-me à mente a ideia de uma árvore de decisão local. É algo como um análogo de KNN ou regressão local (também potencialmente adequado para não estacionariedade). A ideia é que dividimos em caixas apenas a caixa que contém o ponto de interesse (até pelo menos um determinado número de K pontos nela) e não nos importamos com o restante das caixas. Pode ser melhor que o KNN ou a regressão local se os limites entre as classes forem nítidos e o ponto estiver próximo a esse limite.
Gostaria de saber se a abordagem faz sentido.
Parece-me que você está comparando coisas incomparáveis - escalonamento é escalonamento (mesmo multidimensional, se você quiser, desde que a distância seja adequada) e filtragem de ruído - você pode fazer com derivadas (1ª e 2ª).-- ... bem, ou mude para matrizes vetoriais de maneira completamente não supervisionada, em vez de provar a importância das diferenças de classe (rotuladas) por meio de matrizes de covariância dos dados rotulados e explorar ainda mais a importância confirmada para a classificação do assunto de seu interesse...
Hipóteses, senhores, hipóteses não são uma forma de cálculo, mas um assunto de prova (ou refutação)....
Não entendi nada, mas muito interessante.
Qual é o valor de R2 entre seu método de determinar a capacidade de previsão e a importância do recurso da floresta aleatória?
Olá a todos.
Tenho uma pergunta: é realista usar um hash como um preditor?
Por exemplo,
LlLCmywDpe8dj_j8t8DWwoMjaIhTLnOedRh6KET7R7k
onde o objetivo é
1.04.
Faz sentido convertê-lo de alguma forma em um número ou em outra forma?
Portanto, é um número em notação de 256 itens (se a cadeia de caracteres for codificada em ANSI). Como os hashes têm um comprimento fixo, você ainda pode representá-los como vetores de números de 0 a 255.
Você quer decifrar o bitcoin?)
Cara,como o tipo de cadeia de caracteres relaxa e você se esquece da codificação ANSI.
Não, não é bitcoin, são sorteios on-line :))))
Qual é o valor de R2 entre seu método de determinar a capacidade de previsão e a importância do recurso da floresta aleatória?
Explicado várias vezes.