A correlação de amostra zero não significa necessariamente que não exista uma relação linear

Vadim Zhunko 2013.04.09 07:32 #411

Sim... A palavra mágica "correlação" engana muitas pessoas.

Correlação == dependência probabilística. Ou seja, a auto-ilusão. Procure uma relação linear.

GaryKa 2013.04.09 07:45 #412

C-4: O que os logaritmos farão por você? Os logaritmos só podem ser usados quando os pontos inicial e final de uma série são muito diferentes em sua volatilidade e nível. Ou seja, se você estiver analisando o DowJons de 1900 a 2013, não poderá prescindir dele, mas em outros casos ele não poderá ser usado.

Mais uma vez, esta linha parece já ter falado sobre isso.

Pense sobre a definição de correlação - em palavras simples, é a relação de dois conjuntos. Para conjuntos do espaço linear esta correlação pode ser estimada através do produto escalar de vetores (equivalente ao CQ da Pearson), e por exemplo, é lógico que para os vetores ortogonais tal correlação seja zero. Para conjuntos que não pertencem ao espaço linear, esta relação deve ser estimada de forma diferente. Como? Já depende das características do espaço. Como exemplos, podemos considerar outros coeficientes de correlação.

Se as leituras estão em uma escala relativa, e para citações estão (mostrando quantas vezes uma moeda é "mais valiosa" que outra), então é incorreto aplicar métodos lineares (produto escalar) "diretamente" aos dados brutos. O logaritmo transfere leituras de uma escala relativa para uma escala de intervalo, onde a mesma correlação já pode ser estimada usando o CQ da Pearson.

Cursos absolutos Uma definição formal de Aprendizado de máquina no

Vasiliy Sokolov 2013.04.09 08:24 #413

GaryKa:

Mais uma vez, esta linha parece já ter falado sobre isso.

Pense sobre a definição de correlação - em palavras simples, é uma relação de dois conjuntos. Para conjuntos do espaço linear esta correlação pode ser estimada através do produto escalar de vetores (equivalente ao CQ da Pearson), e por exemplo, é lógico que para os vetores ortogonais tal correlação seja zero. Para conjuntos não pertencentes ao espaço linear, esta relação tem que ser estimada de forma diferente. Como? Já depende das características do espaço. Como exemplos, poderíamos considerar outros coeficientes de correlação.

Se as leituras estiverem em uma escala relativa, que é o caso das cotações (mostrando quantas vezes uma moeda é "mais valiosa" que outra), então é incorreto aplicar métodos lineares (produto escalar) "diretamente" aos dados brutos. O logaritmo transfere leituras de uma escala relativa para uma escala de intervalo, onde a mesma correlação já pode ser estimada usando o CQ da Pearson.

Você pode fornecer um exemplo específico onde tomar logaritmos muda a leitura do CQ de uma maneira chave? Por favor, me dê um exemplo onde a série original dá um CQ próximo a zero, enquanto seus logaritmos miraculosamente colocam o CQ em uma estimativa significativa.

Até agora, vamos tomar um exemplo:

Correlação Pearson entre os preços do ouro e os Juros Abertos calculados sobre as primeiras diferenças sem logaritmo: 0.1968

Correlação Pearson entre os preços do ouro e os juros abertos calculados para ln(Pi/Pi-1): 0,2067

Agora, devido à diferença de 1%, você pode gritar com prazer e dizer em cada esquina que não há como não ter logaritmo.

Índice Hearst Vagando aleatoriamente Como minimizar a correlação

Avals 2013.04.09 08:49 #414

alsu:

O tipo de distribuição da matriz de correlação depende das propriedades de ambas as séries e da relação entre elas, ou seja, não tem que ser a mesma para todas as séries possíveis... Para SB é um, para algumas erupções solares é outro...

isso é uma medida do erro. Se a distribuição for como C-4 mostrou, o erro é enorme e a probabilidade de obter um desvio maior do valor real é quase inexistente. De que serve tal indicador se com uma independência real se pode obter uma correlação de -0,6 a +0,6 com igual probabilidade?

Por que você limita E SE ELA EXISTIR? [Arquivo!

GaryKa 2013.04.09 08:59 #415

C-4: Você pode fornecer um exemplo específico em que tomar os logaritmos muda a leitura do CQ de uma maneira chave? Por favor, me dê um exemplo onde a série original dá um CQ próximo a zero, enquanto seus logaritmos miraculosamente colocam o CQ em uma estimativa significativa.

Vou tentar fazer isso.

C-4: Enquanto você pega um exemplo:

Correlação Pearson entre os preços do ouro e os Juros Abertos calculados sobre as primeiras diferenças sem logaritmo: 0.1968
Correlação Pearson entre o preço do ouro e os juros abertos calculados para ln(Pi/Pi-1): 0,2067

Agora, devido à diferença de 1% você pode gritar com prazer e dizer em cada esquina que sem logaritmo você não pode ir a lugar algum.

Eu não conto as primeiras diferenças ... décimos também )

Sobre os dados de seu exemplo:

A correlação de Pearson nos dados brutos é 0,767687.
A correlação de Pearson nos logaritmos dos dados brutos é de 0,819971.

Parece estar de acordo com a observação visual. A diferença é de mais de 5%.

Arquivos anexados:

pirsononlogdata.zip 27 kb

Canal de regressão linear Como posso saber a Avaliando a eficácia dos

Vasiliy Sokolov 2013.04.09 10:18 #416

GaryKa:

Vou tentar fazer um.

Eu não conto as primeiras diferenças ... décimos também...)

...

Vamos primeiro descobrir se é correto usar o CQ em séries de preços regulares. Até agora, forneci dados dizendo que o CQ em I(1) não pode ser contado.

Дмитрий 2013.04.09 10:41 #417

C-4:
Vamos primeiro descobrir se é correto usar QR em uma série de preços regulares. Até agora eu forneci dados dizendo que parece que o CQ em I(1) não pode ser calculado.

Onde você já viu um requisito de normalidade para o cálculo do CQ? Mais uma vez, é um requisito para utilizar a análise de correlação.

Que bobagem - QC é apenas para valores normalmente distribuídos.......... Acontece que você não pode calcular QC entre, por exemplo, as cotações de ouro e prata.........

Para aqueles que têm Spammers, mensagens privadas spam, Divulgação do comércio no

Vasiliy Sokolov 2013.04.09 10:50 #418

Demi:

Onde você já viu um requisito de normalidade para o cálculo do CQ? Mais uma vez, é um requisito para o uso da análise de correlação.

Que bobagem - QC é apenas para valores normalmente distribuídos..........

O que a normalidade tem a ver com isso? Novamente, I(1) é a soma consecutiva de uma série do formulário I(0). I(0) são os incrementos normais, ou retornos. O tipo de retorno não é importante. O importante é que o CQ só pode ser calculado sobre os retornos, mas não sobre o preço em si.

Interessante e Humor Ajuda na codificação Da teoria à prática

Дмитрий 2013.04.09 11:02 #419

C-4:
O importante é que o CQ só pode ser contado com os rendimentos, não com o preço em si.

Novamente, por quê?

Vasiliy Sokolov 2013.04.09 11:07 #420

Demi:
Novamente, por quê?

Porque: 1. veja a foto acima.

2. 2. leia o que Avals escreve:

Avals:
esta é uma medida do erro. Se a distribuição for como mostrado pelo C-4, o erro é enorme e a probabilidade de obter um desvio maior do valor real dificilmente diminui. Para que serve tal indicador se é possível obter uma correlação de -0,6 a +0,6 com a independência real?

A correlação de amostra zero não significa necessariamente que não exista uma relação linear - página 42