Estatísticas de dependência entre aspas (teoria da informação, correlação e outros métodos de seleção de características) - página 16

 
E conceitualizei um novo curso de pesquisa (escrita para os interessados, não para aqueles que juram em linguagem de fórmula). Se temos dependência da volatilidade (dependência tanto de defasagens mais próximas quanto cíclicas - 24 horas para H1), então por que não calcular as mesmas informações mútuas para os retornos tomados modulo (que serão pura volatilidade), e então subtrair a quantidade de informações obtidas do similar (onde os retornos foram com sinal +-). Se tudo for calculado corretamente, então teremos uma dependência de sinais no backlog. Este caso já pode ser comparado a uma série cronológica de ruído.
 
alexeymosc:
E conceitualizei um novo curso de pesquisa (escrita para os interessados, não para aqueles que juram em linguagem de fórmula). Se temos dependência da volatilidade (dependência de ambas as defasagens mais próximas e cíclicas - 24 horas para H1), então por que não calcular as mesmas informações mútuas para os retornos tomados modulo (que serão pura volatilidade), e então subtrair a quantidade de informações obtidas do similar (onde os retornos foram com sinal +-). Se tudo for calculado corretamente, então teremos uma dependência de sinais no backlog. Este caso pode ser comparado com as séries cronológicas de ruído.

Mesmo que algo não trivial seja encontrado, sempre haverá uma questão de aplicação correta das fórmulas e, mais importante ainda, de como aplicá-lo na prática. Isto é, o interesse é puramente acadêmico))))
 
avatara:

Mas você poderia, Alexey, formular mais claramente (usando sua tabela) que hipótese sobre a distribuição dos retornos corresponde à estimativa do qui-quadrado?

A prima facie "marrom", ou algo mais fresco?

Nenhuma. Ao estimar a relação qui-quadrado, nenhuma hipótese sobre as distribuições é inventada. Acontece que é um critério não paramétrico.

 
Mathemat:

Nenhuma. Nenhuma hipótese de distribuição é inventada ao estimar a dependência com o chi-squared. Portanto, é um critério não paramétrico.

O que você quer dizer com nenhum?

Você pode anotar a dependência a ser estimada?

Talvez depois das fórmulas eu tenha a idéia. Ou você está esperando uma distribuição uniforme...

;)

 
Avals:

Mesmo que algo não trivial seja encontrado, sempre restará a questão da aplicação correta das fórmulas e, mais importante ainda, como aplicá-lo na prática. Isto é, o interesse é puramente acadêmico))))
Acho que os resultados das experiências de previsão são o principal critério. Se é óbvio que as estatísticas de TI ajudam, então tudo está bem. E para aplicar as fórmulas corretamente, é claro, estou agora lendo artigos sobre o assunto.
 
avatara: O que você quer dizer com nenhum?

Você pode anotar a dependência estimada?

Talvez depois das fórmulas eu tenha uma idéia do que é. Ou você está esperando uma distribuição uniforme...

Não, de modo algum, eu lhes digo a verdade. Hipóteses não fingo.

Você já tentou aplicar o critério do qui-quadrado de independência de valores? Eu mesmo não sabia como fazer isso há alguns meses, mas acabei de fazê-lo. Experimente, não há nada de difícil aí. Encontre um manual matstat para alguma instituição fora do estado e leia-o. Quanto mais simples e claro o método for descrito, mais rápido você o entenderá.

Na verdade, existem vários critérios de qui-quadrado. Mas estou falando daquele que avalia a independência dos valores. Este critério não o avalia com base em distribuições dadas a priori. Ele apenas testa a hipótese de independência de duas variáveis em um determinado nível de significância (geralmente 0,95 ou 0,99). Quanto mais próximo o nível de significância estiver de 1, mais confiável será a conclusão.

A base ideológica do critério é a fórmula usual para a probabilidade conjunta de duas quantidades. Sobre os dedos: se P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) para qualquer x1,y1 admissível, então X e Y são independentes. E vice versa. E o qui-quadrado calcula, grosso modo, uma soma ponderada de desvios desta igualdade para todos os casos possíveis e a compara com algum valor limite. Se a soma obtida for maior que este valor limite, então a hipótese de independência das variáveis (Nula) não é aceita. Se for menos, então a hipótese Nula não é rejeitada.

 
Mathemat:

Nada mesmo, estou dizendo a verdade. Hipóteses não fingo.

Você já tentou aplicar o critério do qui-quadrado de independência de valores? Eu mesmo não sabia como fazer isso há alguns meses, mas acabei de fazê-lo. Experimente, não há nada de difícil aí. Encontre um manual matstat para alguma instituição fora do estado e leia-o. Quanto mais simples e claro o método for descrito, mais rápido você o entenderá.

Na verdade, existem vários critérios de qui-quadrado. Mas estou falando daquele que avalia a independência dos valores. Ela não avalia a independência com base em distribuições a priori. Ele apenas testa a hipótese de que dois valores são independentes em um determinado nível de significância (geralmente 0,95 ou 0,99). Quanto mais próximo o nível de significância estiver de 1, mais confiável será a conclusão.

A base ideológica do critério é a fórmula usual para a probabilidade conjunta de duas quantidades. Sobre os dedos: se P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) para qualquer x1,y1 admissível, então X e Y são independentes. E vice versa. E o qui-quadrado calcula, grosso modo, uma soma ponderada de desvios desta igualdade para todos os casos possíveis e a compara com algum valor limite. Se a soma obtida for maior que este valor limite, então a hipótese de dependência dos valores é aceita. Se menos, a hipótese de independência não é rejeitada.

Não seja ridículo...

Você foi questionado sobre a hipótese da distribuição, e acabou de saber sobre este método ontem.

Eu quero saber persistentemente - qual é a hipótese nula? Que eles são independentes?

 

Zero - "os retornos são independentes". Não é engraçado, na verdade!

Nenhuma hipótese sobre as distribuições que eu testei! Esse é outro qui-quadrado. E eu só testei a dependência!

Se você quiser verificar a distribuição, seja meu convidado. É Laplaciano com uma precisão decente.

 
Mathemat:

Zero - "os retornos são independentes". Nada engraçado, na verdade!

Nenhuma hipótese sobre as distribuições que eu testei! Esse é outro qui-quadrado. E eu só testei a dependência!

Se você quiser testar a distribuição, seja meu convidado. É Laplaciano com uma precisão decente.

Certo.

Vamos dar uma olhada.

---

A hipótese de independência é a mesma que a hipótese de uma distribuição uniforme ou de uma distribuição normal?

Isso é o que eu quero descobrir.

Então com "Laplace-like" tudo faz sentido.

 
alexeymosc:
E conceitualizei mais um curso de pesquisa (escrever para os interessados, não praguejar em linguagem de fórmula). Se temos dependências da volatilidade (dependência de defasagens mais próximas bem como cíclicas - 24 horas para H1), então por que não calcular as mesmas informações mútuas para os retornos tomados modulo (que seria pura volatilidade), e então subtrair a quantidade de informações obtidas do similar (onde os retornos estavam com sinal +-). Se tudo for calculado corretamente, então teremos uma dependência de sinais no backlog. Este caso já pode ser comparado a uma série cronológica de ruído.

Posso colocá-lo no meu próprio caminho?

Portanto, a abordagem escolhida mostra que existem dependências. A mais óbvia, razoável e visível a olho nu é a periodicidade diária da volatilidade.

Portanto, o próximo passo lógico em minha pesquisa seria tentar excluir esta dependência óbvia e muito forte dos dados e ver se nosso (seu) método mostra a presença de outras dependências.

Como método de eliminação, proponho simplesmente relacionar os incrementos ao perfil de volatilidade diária.