Discussione sull’articolo "Stime statistiche"

 

Il nuovo articolo Stime statistiche è stato pubblicato:

La stima dei parametri statistici di una sequenza è molto importante poiché la maggior parte dei modelli e metodi matematici si basa su ipotesi diverse. Ad esempio, normalità della legge di distribuzione o valore di dispersione o altri parametri. Pertanto, durante l'analisi e la previsione delle serie temporali abbiamo bisogno di uno strumento semplice e conveniente che consenta di stimare in modo rapido e chiaro i principali parametri statistici. L'articolo descrive brevemente i parametri statistici più semplici di una sequenza casuale e diversi metodi della sua analisi visiva. Offre l'implementazione di questi metodi in MQL5 e i metodi di visualizzazione del risultato dei calcoli utilizzando l'applicazione Gnuplot.

In questo esempio, viene utilizzata una sequenza casuale per riempire l'array dat[] con i dati iniziali utilizzando la funzione MathRand(). L'esecuzione dello script dovrebbe comportare quanto segue:

4-Plot

 

Dovresti prestare attenzione all'ultimo parametro della funzione vis4plot(). È responsabile del formato dei valori numerici emessi. In questo esempio, i valori vengono emessi con sei cifre decimali. Questo parametro è uguale a quello che determina il formato nella funzione DoubleToString().

Autore: Victor

 
Для тех, кто серьезно занимался (-ется) анализом совместного движения фин. инструментов (> 2-х) - MQL4 форум
  • www.mql5.com
Для тех, кто серьезно занимался (-ется) анализом совместного движения фин. инструментов (> 2-х) - MQL4 форум
 

"Eliminazione degli outlier".


Prima di procedere alla stima dei parametri statistici, occorre notare che la precisione della stima può essere insufficiente se il campione contiene errori grossolani (outlier). L'impatto degli outlier sull'accuratezza delle stime è particolarmente forte quando la dimensione del campione è piccola. Gli outlier sono valori che si discostano in modo anomalo dal centro della distribuzione. Tali deviazioni possono essere causate da vari tipi di eventi improbabili e da errori verificatisi durante la raccolta delle statistiche e la generazione delle sequenze.

È piuttosto difficile decidere se filtrare o meno gli outlier, perché nella maggior parte dei casi è impossibile determinare in modo inequivocabile se un dato valore è un outlier o appartiene al processo in esame. Se vengono individuati degli outlier e si decide di filtrarli, sorge la domanda: cosa fare con questi valori errati? La cosa più logica da fare è semplicemente escluderli dal campione, e l'accuratezza della stima delle caratteristiche statistiche della popolazione generale potrebbe aumentare, ma non bisogna dimenticare che quando si ha a che fare con sequenze temporali, bisogna stare attenti a escludere i campioni dalla sequenza".

È meglio non farlo affatto.

Sì, tutti i dati dovrebbero essere validati e sì, la validazione dovrebbe essere automatizzata.

Ma è meglio scartare una fonte di dati che manipolare i dati originali, manualmente o automaticamente.

Nella vita reale, accettare o escludere grandi rischi sulla base della loro "bassa probabilità" è la causa di molte tragedie e disastri.

 

Victor, questo è il tipo di domanda.

Pensi che la curtosi possa essere inferiore a 1?

Se sì.

gs=(1.55+0.8*MathLog10((double)n/10.0)*MathSqrt(kurt-1))*MathSqrt(sum2/(n-1));

sarebbe uguale a -1.:-)

Ottimo articolo!

 
denkir:

Victor, questo è il tipo di domanda.

Pensi che la curtosi possa essere inferiore a 1?

Se sì.

sarebbe uguale a -1. :-)

Ottimo articolo!


Molto probabilmente, in teoria la curtosi non può essere inferiore a uno. Probabilmente un valore pari a uno si otterrebbe per una sequenza composta da campioni rettilinei. Ad esempio, 1,2,3,4,5.

Non so se, a causa di errori, l'algoritmo utilizzato nell'articolo possa dare un valore di curtosi inferiore a uno. Alla fine dell'articolo si dice che il comportamento dell'algoritmo di calcolo del coefficiente non è stato studiato.

 

In effetti, nel calcolo delle stime imparziali, la curtosi può assumere un valore inferiore a uno. Ad esempio, per la sequenza di input 4,7,13,16.

Grazie per la sua osservazione. Apporterò le dovute modifiche.

 
Sono state apportate delle correzioni.