Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 365

 
elibrarius:

Eu já fiz a remoção dos inputs correlatos, apenas me perguntando como melhorar os inputs.

Portanto, concordo com vocês que deve haver correlação com o alvo, é por isso que quero remover os inputs não relacionados com o alvo, por exemplo com Ккорр<0,5 ou 0,3. Isto deve acelerar o processo de aprendizagem sem afectar demasiado a qualidade. Mas há uma suposição de que terei que remover todas as entradas ))))

Nos inputs utilizados (retirados aleatoriamente dos indicadores tecnológicos), até agora não encontrei nenhuma correlação com o alvo, erro de aprendizagem = 0,44, ou seja, quase uma moeda. Bem, o equilíbrio está a baixar.


de forma alguma deve haver correlação com o alvo, onde é que está escrito? que sentido é que isso faz? Se você tem uma correlação de 1 com o alvo, então você conhece o futuro e não precisa de uma rede neural.
 
Maxim Dmitrievsky:

de forma alguma deve haver uma correlação com o alvo, onde é que está escrito? que sentido faz isso? Se você tem uma correlação de 1 com o alvo, você conhece o futuro e não precisa de uma rede neural


Todos os MO se baseiam no fato de que as variáveis de entrada devem estar correlacionadas com a variável de saída.

Caso contrário, não faz sentido em TODOS os modelos MO.

Em Data Mining ALL VARIABLE VARIABLE VARIABLE SELECTION MODELS implementam um mecanismo para a correlação máxima de variável de entrada e variável de saída:

Procedimento de Seleção Avançada,
Procedimento de Eliminação de Retrocesso,
o procedimento por etapas,
Procedimento dos melhores subconjuntos.
 
Dimitri:


Todos os MOEs são baseados no fato de que a variável de entrada deve estar correlacionada com a variável de saída.

Caso contrário, não faz sentido em TODOS os modelos MO.

Em Data Mining, ALL VARIABLE VARIABLE SELECTION MODELS implementa um mecanismo para maximizar a correlação entre a variável de entrada e a variável de saída:

Procedimento de Seleção Avançada,
Procedimento de Eliminação de Retrocesso,
o procedimento por etapas,
Procedimento dos melhores subconjuntos.

correlacionar no sentido dos vectores de entrada e saída (curvas) deve correlacionar ou a correlação significa simplesmente a dependência da variável de saída em relação à de entrada, num sentido geral?
 
Maxim Dmitrievsky:

correlacionar no sentido dos vectores de entrada e saída (curvas) deve correlacionar ou a correlação significa simplesmente a dependência da variável de saída em relação à variável de entrada, num sentido geral?


A dependência é um caso especial de correlação. Se duas variáveis são dependentes, então há definitivamente uma correlação. Se há correlação, então não há necessariamente dependência.

Não existem métodos para detectar a dependência em modelos estatísticos. Existe apenas a esperança de que a correlação identificada entre um conjunto de variáveis de entrada e uma variável de saída seja uma relação.

Portanto, as variáveis devem ser correlacionadas.

 
Dimitri:


A dependência é um caso especial de correlação. Se duas variáveis são dependentes, então há definitivamente uma correlação. Se há correlação, então não há necessariamente dependência.

Não existem métodos para detectar a dependência em modelos estatísticos. Existe apenas a esperança de que a correlação identificada entre um conjunto de variáveis de entrada e uma variável de saída seja uma relação.

Portanto, as variáveis devem ser correlacionadas.


E se houver um corredor inverso, já não é uma dependência ou o quê? ) E os NS vão ficar perplexos com esta abordagem.

Aleluia... ziguezague na entrada e ziguezague na saída com compensação... a correlação é quase perfeita, mas para que serve? )

 
Maxim Dmitrievsky:

Se corredor inverso, já não é uma correlação? ) E a NS fica atolada por esta abordagem.


Nenhuma correlação é quando o coeficiente de correlação é 0.

Como se pode construir um modelo se as entradas e saídas não estão de todo correlacionadas?

 
Dimitri:


Nenhuma correlação é quando o coeficiente de correlação é 0.

Como se pode construir um modelo se as entradas e saídas não estão de todo correlacionadas?


Sim, porque a correlação de entradas e saídas não importa em nada quando o modelo procura padrões em um conjunto de preditores... É uma contradição remover entradas correlacionadas, mas procurar entradas correlacionadas a saídas... )) Ou seja, pelo menos teremos uma entrada correlacionada com a saída, depois todas as outras entradas que temos que remover, pois elas também estão correlacionadas com a saída e, conseqüentemente, com as outras entradas... legal, não é?
 
Maxim Dmitrievsky:

Isso porque a correlação de entradas e saídas não é nada importante quando o modelo procura padrões em um conjunto de preditores... É uma contradição - remover entradas correlacionadas, mas procurar por entradas correlacionadas com saídas. )) Ou seja, pelo menos teremos uma entrada correlacionada com a saída, depois todas as outras entradas que temos que remover, pois elas também estão correlacionadas com a saída, e consequentemente com as outras entradas... legal, certo?


Não, não é fixe.

Se você tiver a primeira variável correlacionada com a variável de saída por um coeficiente de, digamos, 0,7 e a segunda por um coeficiente de 0,65, isso não significa que as duas variáveis estejam altamente correlacionadas uma com a outra.

Agora suponha que o primeiro está correlacionado com 0,7 e o segundo com o coeficiente de -0,69.

 
Dmitry:


Não, não é fixe.

Se você tiver a primeira variável correlacionada com a variável de saída por um coeficiente de, digamos, 0,7 e a segunda por um coeficiente de 0,65, isso não significa de forma alguma que as duas variáveis estejam altamente correlacionadas uma com a outra.

Agora imagine o primeiro com um coeficiente de 0,7 e o segundo com um coeficiente de -0,69.


E se você também imaginar que a correlação define "similaridade" de uma forma muito peculiar... Eu não lhe daria muita credibilidade.

Estamos a construir uma rede neural de alta tecnologia precisa e somos guiados pela correlação na escolha dos preditores? Isso é um pouco errado ou algo assim... mas é tudo "na minha opinião"... )

 
Maxim Dmitrievsky:

E se você também imaginar que a correlação define "similaridade" de uma forma muito peculiar... Eu não confiaria muito nisso.


Depois a segunda opção - colocar tudo o que você tem em NS. Mas há duas MAS:

1. esperar que variáveis não correlacionadas não degradem a qualidade do modelo (existe tal coisa para a regressão).

2. sacrificar a dimensionalidade e o tempo.

Razão: