Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2788

 
Maxim Dmitrievsky #:
Você obtém muitas inconsistências, incluindo a remoção de outliers. Eles geralmente representam 10% do tamanho do conjunto de dados, de acordo com diferentes cálculos. Eliminado e o que, e como o modelo será negociado quando o outlier for detectado? )
A mesma situação com as transformações.
Se você fizer o pré-processamento de forma clássica, os resultados se tornarão piores do que nos dados brutos.
Ou melhorias aleatórias nas métricas são passadas como sistêmicas.

Nada pode ser feito assim, depois de ler livros e artigos - esse é um estágio separado e é chamado de aprendizado. Sem conhecimento sistemático de estatística, não há nada a fazer no MOE.

É sempre necessário fazer, tentando atingir a meta.

Se considerarmos uma meta intermediária - capacidade máxima de previsão do preditor, então:

1. É obrigatório remover os outliers. Se os valores maiores que 0,5% do quantil forem considerados discrepantes, então os discrepantes serão menores que 1%. A propósito, essa é a porcentagem de paradas acionadas no futuro. Desenvolvemos o próprio sistema de negociação e temos limitações digitais.

2. O pré-processamento é obrigatório, mas, novamente, depende do tipo. Se estivermos falando sobre a capacidade preditiva do preditor, então não é possível corrigir inclinações que aumentem a capacidade preditiva. Este é um exemplo. Em geral, usamos algum algoritmo de pré-processamento e avaliamos seu efeito na capacidade de previsão. A resposta aqui é.

3. Tenha sempre em mente o significado de MO, que, em minha opinião, é a busca de alguns padrões. Obviamente, na RF, qual é o número de padrões contidos em, por exemplo, 5.000 barras? Ou a partir de qual valor de janela o aumento do número de padrões não reduz o erro? Ou, para alguma janela fixa, a partir de qual valor do número de padrões o erro para de cair?

Respostas para RF.

1. não faz sentido aumentar a janela acima de 1.500 barras.

2. a relação entre o erro e o número de padrões (árvores) pode ser vista claramente no gráfico:

Mínimo 50. Em geral, de 100 a 200. O gráfico não muda quando se aumenta a janela para 5000.

Você deve sempre formular claramente a meta e o critério para atingi-la. Todo o resto é blá blá blá.

[Excluído]  
СанСаныч Фоменко #:

Nada pode ser feito sem mais nem menos, depois de ler livros didáticos e artigos - é uma etapa separada, chamada de estudo. Sem conhecimento sistemático de estatística, não há nada a fazer no MoE.

É sempre necessário fazer, tentando atingir a meta.

Se considerarmos uma meta intermediária - capacidade máxima de previsão do preditor, então:

1. É obrigatório remover os valores atípicos. Se os valores maiores que 0,5% do quantil forem considerados discrepantes, então os discrepantes serão menores que 1%. A propósito, essa é a porcentagem de paradas acionadas no futuro. Estamos desenvolvendo o próprio sistema de negociação, temos restrições digitais.

2. O pré-processamento é obrigatório, mas, novamente, depende do tipo. Se estivermos falando sobre a capacidade preditiva do preditor, então não é possível corrigir inclinações que aumentam a capacidade preditiva. Este é um exemplo. Em geral, usamos algum algoritmo de pré-processamento e avaliamos sua influência na capacidade de previsão. Aqui está a resposta.

3. Tenha sempre em mente o significado de MO, que, em minha opinião, é a busca de alguns padrões. Obviamente, em RF, qual é o número de padrões contidos em, por exemplo, 5.000 barras? Ou a partir de qual valor de janela o aumento do número de padrões não reduz o erro? Ou, para alguma janela fixa, a partir de qual valor do número de padrões o erro deixará de cair?

Respostas para RF.

1. Não faz sentido aumentar a janela acima de 1500 barras.

2. a relação entre o erro e o número de padrões (árvores) pode ser vista claramente no gráfico:

Mínimo de 50. Em geral, de 100 a 200. O gráfico não se altera quando a janela é aumentada até 5000.

É sempre necessário formular claramente a meta e o critério para atingi-la. Todo o resto é blá blá blá.

Detectei emissões por meio da floresta de isolamento, excluí-as e o resultado do treinamento não mudou. Tentei treinar com as emissões - nenhuma mudança. Fiquei com a impressão de que o modelo (catbust) não se importa com as emissões. Como se elas fossem bem reconhecidas por meio da busca de anomalias, mas sua remoção não fosse necessária.
 
Maxim Dmitrievsky #:
Detectamos emissões por meio da floresta de isolamento, as excluímos e o resultado do treinamento não mudou. Tentei treinar com emissões - nenhum resultado. Fiquei com a impressão de que o modelo (catbust) não se importa com as emissões. Como se elas fossem bem reconhecidas por meio da pesquisa de anomalias, mas sua remoção não fosse necessária.

Os outliers afetam fortemente a capacidade de previsão, e a estabilidade da capacidade de previsão afeta a estabilidade do erro de previsão.

E para o modelo em si, isso depende do modelo, especialmente se a amostra de treinamento for obtida da amostra.

 
Aleksey Nikolayev #:

Veio-me à mente a ideia de uma árvore de decisão local. É algo como um análogo de KNN ou regressão local (também potencialmente adequado para não estacionariedade). A ideia é que dividimos em caixas apenas a caixa que contém o ponto de interesse (até pelo menos um determinado número de K pontos nela) e não nos importamos com o restante das caixas. Pode ser melhor que o KNN ou a regressão local se os limites entre as classes forem nítidos e o ponto estiver próximo a esse limite.

Gostaria de saber se a abordagem faz sentido.

Parece-me que você está comparando coisas incomparáveis - escalonamento é escalonamento (mesmo multidimensional, se você quiser, desde que a distância seja adequada) e filtragem de ruído - você pode fazer com derivadas (1ª e 2ª).-- ... bem, ou mude para matrizes vetoriais de maneira completamente não supervisionada, em vez de provar a importância das diferenças de classe (rotuladas) por meio de matrizes de covariância dos dados rotulados e explorar ainda mais a importância confirmada para a classificação do assunto de seu interesse...

Hipóteses, senhores, hipóteses não são uma forma de cálculo, mas um assunto de prova (ou refutação)....

 
JeeyCi #:

Parece-me que você está comparando coisas incomparáveis - escalonamento é escalonamento (mesmo multidimensional, se você quiser, desde que a distância seja adequada) e filtragem-ruído - você pode fazer isso com derivadas (1ª e 2ª).-- ... bem, ou mude para matrizes vetoriais de uma maneira completamente não supervisionada, em vez de provar a importância das diferenças de classe (rotuladas) por meio de matrizes de covariância dos dados rotulados e explorar ainda mais a importância confirmada para a classificação do assunto de seu interesse...

Hipóteses, senhores, hipóteses não são uma forma de cálculo, mas um assunto de prova (ou refutação) ....

Não entendi nada, mas muito interessante.

 
СанСаныч Фоменко #:

Os outliers afetam fortemente a capacidade de previsão, e a estabilidade da capacidade de previsão influencia a estabilidade do erro de previsão.

E para o modelo em si, isso depende do modelo, especialmente se a amostra de treinamento for obtida da amostra.

Qual é o valor de R2 entre seu método de determinar a capacidade de previsão e a importância do recurso da floresta aleatória?

 

Olá a todos.
Tenho uma pergunta: é realista usar um hash como um preditor?

Por exemplo,
LlLCmywDpe8dj_j8t8DWwoMjaIhTLnOedRh6KET7R7k

onde o objetivo é
1.04.

Faz sentido convertê-lo de alguma forma em um número ou em outra forma?

 
Roman #:

Olá a todos.
Surgiu uma dúvida: é realista usar um hash como indicador?

Como este
LlLCmywDpe8dj_j8t8DWwoMjaIhTLnOedRh6KET7R7k

onde o alvo
1.04

Faz sentido convertê-lo de alguma forma em um número ou outra forma?

Portanto, é um número em notação de 256 itens (se a cadeia de caracteres for codificada em ANSI). Como os hashes têm um comprimento fixo, você ainda pode representá-los como vetores de números de 0 a 255.

Você quer decifrar o bitcoin?)

 
Aleksey Nikolayev #:

Portanto, é um número em um registro de 256 itens (se a cadeia de caracteres for codificada em ANSI). Como os hashes têm um comprimento fixo, eles também podem ser representados como vetores de números de 0 a 255.

Deseja decifrar o bitcoin?)

Cara,como o tipo de cadeia de caracteres relaxa e você se esquece da codificação ANSI.
Não, não é bitcoin, são sorteios on-line :))))


 
Evgeni Gavrilovi #:

Qual é o valor de R2 entre seu método de determinar a capacidade de previsão e a importância do recurso da floresta aleatória?

Explicado várias vezes.