Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 295
A questão da correlação das variáveis tem sido discutida muitas vezes.
Claro que a correlação é a mais duvidosa, muito rapidamente a correlação com os anéis de Saturno, as borras de café... começa a ser vista.
De alguma forma, isto foi esquecido:
Oteste decausalidade da Granger é um procedimento para testar a causalidade ("Granger causalidade") entreséries temporais. A idéia do teste é que os valores (mudanças) das séries cronológicas{\i1}, que causam mudanças nas séries cronológicas{\i}, devem preceder as mudanças nesta série cronológica e, além disso, devem contribuir significativamente para seus valores previstos. Se cada variável contribuir significativamente para a predição da outra, pode haver alguma outra variável que afete ambas.
O testeGrangertesta consistentemente duas hipóteses nulas: "x não é a causa de y de acordo com a Granger" e "y não é a causa de x de acordo com a Granger". Para testar estas hipóteses, duas regressões são construídas: em cada regressão, a variável dependente é uma das variáveis testadas para causalidade, e os regressores são os desfasamentos de ambas as variáveis (na verdade, éuma auto-regressiva vetorial).
E aqui está o código para este caso a partir daqui.
Ninguém se esqueceu de nada....
É aí que o google correlacionar vai perguntar, como você quer medir a correlação? Googling não vai perguntar sobre isso agora, e não vai. O serviço tem 6 anos, e se eles quisessem fazê-lo, eles já o teriam feito ...
E outra coisa...
O Google tem bilhões de BPs em sua base de dados, sempre haverá uma centena de BPs que estão perto por acaso, só porque a base de dados é enorme e não importa como eles medem a proximidade, simples correlação ou algo complicado e complicado.
A questão é como separar o aleatório do não aleatório.
A questão é como peneirar o aleatório do não aleatório
Nós poderíamos
1) dividir a série eura em duas partes "1" e "2".
2) insira a linha "1" no Google e ele encontrará todas as linhas próximas
3) memorizar os nomes de todas as filas próximas.
4) atire a linha "2" para o Google e encontrará todas as linhas próximas a ela
5) memorizar os nomes de todas as filas próximas
6) compare os nomes das linhas dos pontos 3) e 5) e procure uma linha que esteja presente tanto no ponto 3) como no ponto 5)
Assim, encontramos séries que não se correlacionam acidentalmente com o euro - esta é uma espécie de validação cruzada na sua forma mais primitiva.
Mas como conseguir estes nomes que não sei, provavelmente precisas de analisar a página.
Então peneirar por teste de todo o lixo que o google recolheu - era isso que eu queria dizer.
Não sei bem como fazer isto, mas não sei bem como o fazer).
Você pode pesquisar cem séries no Google que se correlacionam perfeitamente com o euro, por mais sofisticado que seja o teste, todas elas mostram uma excelente correlação, por isso é inútil nesta situação.
Não importa quão inteligente seja o teste que você aplica, todos eles mostram uma conexão perfeita.
Eu tenho as minhas dúvidas sobre isso. Uma alta correlação de tendências só significa que geralmente sobem e descem aproximadamente ao mesmo ritmo. Primeiro de tudo seria melhor procurar a correlação de não tendências mas sim aumentos, por exemplo, pode-se salvar tendências similares no csv, depois o google mostrará os atrasos e recalculará a correlação, será muito mais objetivo.
E a correlação não garante de forma alguma que uma variável possa prever a outra. Em geral, a seleção de preditores para previsão com base no princípio de alta correlação é lamentável. Ainda não tentei o que SanSanych sugeriu, mas parece mais confiável.
Chama-se um teste PSE.
Na verdade, verifica a heterogeneidade da amostra no contexto de um modelo de regressão.
Duvido disso. A alta correlação de tendências significa apenas que em geral elas aumentam e diminuem da mesma forma. Para começar, seria uma boa idéia procurar a correlação não de tendências, mas de aumentos, por exemplo, você pode salvar tendências similares no csv, então encontre desfasamentos e recalcule a correlação, será muito mais objetivo.
Sim, concordo, mas o google não nos dá toda a sua base de dados, mas apenas o que se correlaciona "por tendência", tomando o que se correlaciona por tendência e usando isso para fazer incrementos e medir corr... :) Precisamos de olhar para toda a base de dados
Eu li este folheto http://www.mirkin.ru/_docs/dissert065.pdfe quero usar o NeuroShell Day Trader Pro