Discussão do artigo "Estimativas Estatísticas"

 

Novo artigo Estimativas Estatísticas foi publicado:

Estimativa de parâmetros estatísticos de uma sequência é muito importante, desde que muitos dos modelos e métodos matemáticos são baseados em diferentes suposições. Por exemplo, normalidade da lei de distribuição ou valor de dispersão, ou outros parâmetros. Assim, quando analisando e realizando previsões de séries de tempo, nós precisamos uma ferramenta simples e conveniente que permite rápida e clara estimativa dos principais parâmetros estatísticos. O arquivo descreve brevemente os parâmetros estatísticos mais simples de uma sequência aleatória e vários métodos de análise visual. Ele oferece a implementação desses métodos em MQL5 e os métodos de visualização dos resultados dos cálculos usando o aplicativo Gnuplot.

Correlação entre as indicações adjacentes.

Autor: Victor

 
Для тех, кто серьезно занимался (-ется) анализом совместного движения фин. инструментов (> 2-х) - MQL4 форум
  • www.mql5.com
Для тех, кто серьезно занимался (-ется) анализом совместного движения фин. инструментов (> 2-х) - MQL4 форум
 

"Eliminação de outliers.


Antes de prosseguir com a estimativa dos parâmetros estatísticos, deve-se observar que a precisão da estimativa pode ser insuficiente se a amostra contiver erros grosseiros (outliers). O impacto dos outliers na precisão das estimativas é particularmente forte quando o tamanho da amostra é pequeno. Os outliers são valores que se desviam de forma anômala do centro da distribuição. Esses desvios podem ser causados por vários tipos de eventos improváveis e erros que ocorreram durante a coleta de estatísticas e a geração de sequências.

É bastante difícil decidir se os valores discrepantes devem ser filtrados ou não, porque na maioria dos casos é impossível determinar sem ambiguidade se um determinado valor é um valor discrepante ou se pertence ao processo em consideração. Se forem detectados outliers e for tomada a decisão de filtrá-los, surge a pergunta: o que fazer com esses valores errôneos? A coisa mais lógica a fazer é simplesmente excluí-los da amostra, e a precisão da estimativa das características estatísticas da população geral pode aumentar, mas não se deve esquecer que, ao lidar com sequências de tempo, é preciso ter cuidado ao excluir amostras da sequência."

É melhor não fazer isso.

Sim, todos os dados devem ser validados, e sim, a validação deve ser automatizada.

Mas é melhor descartar uma fonte de dados do que manipular os dados originais, manual ou automaticamente.

Na vida real, aceitar ou excluir grandes riscos com base em sua "baixa probabilidade" é a causa de muitas tragédias e desastres.

 

Victor, esse é o tipo de pergunta.

Você acha que a curtose pode ser menor que 1?

Em caso afirmativo.

gs=(1.55+0.8*MathLog10((double)n/10.0)*MathSqrt(kurt-1))*MathSqrt(sum2/(n-1));

seria igual a -1.:-)

Ótimo artigo!

 
denkir:

Victor, esse é o tipo de pergunta.

Você acha que a curtose pode ser menor que 1?

Em caso afirmativo.

seria igual a -1. :-)

Ótimo artigo!


Provavelmente, teoricamente, a curtose não pode ser menor que um. Provavelmente, um valor igual a um seria obtido para uma sequência que consiste em amostras de linhas retas. Por exemplo, 1,2,3,4,5.

Não sei se, devido a erros, o algoritmo usado no artigo pode fornecer um valor de curtose menor que um. No final do artigo, foi mencionado que o comportamento do algoritmo de cálculo do coeficiente não foi investigado.

 

De fato, ao calcular estimativas imparciais, a curtose pode assumir um valor menor que um. Por exemplo, para a sequência de entrada 4,7,13,16.

Obrigado por sua observação. Farei as alterações.

 
As correções foram feitas.