Discussione sull’articolo "Approccio econometrico all'analisi dei grafici" - pagina 7

 
faa1947:

Bravo! Ottimo post, che tocca molti temi. Ma alcuni punti possono essere criticati. Ad esempio, uno di essi: su quale base avete deciso di rimuovere gli outlier? Non dovrebbero essere rimossi.
 
-Alexey-:
Bravo! Ottimo post, che tocca molti temi. Ma alcuni punti possono essere criticati. Ad esempio, uno di essi: su quale base avete deciso che è necessario rimuovere gli outlier? Non è possibile rimuoverli.
Un outlier non è la stessa cosa di un outlier. Bisogna guardare alle quotazioni. Se un outlier è relativamente raro, allora dovresti ridurlo a una soglia (non eliminarlo). Se non lo è, non è chiaro cosa fare. In linea di principio, gli outlier distorcono pesantemente le statistiche. Qualsiasi pacchetto statistico prevede questa possibilità e fornisce raccomandazioni appropriate.
 
faa1947:
Un'anomalia non è un'anomalia. Bisogna guardare alle citazioni. Se un outlier è un evento relativamente raro, allora dovrebbe essere ridotto alla soglia (non eliminato). In caso contrario, non è chiaro cosa fare. In linea di principio, gli outlier distorcono pesantemente le statistiche. Qualsiasi pacchetto statistico prevede questa possibilità e fornisce raccomandazioni appropriate.

Per quanto ne so, gli outlier vengono eliminati nelle misurazioni quando si sa in anticipo che i risultati sono uniti almeno da una qualche legge, cioè quando il processo che genera il valore misurato è non casuale o stazionario casuale, e l'outlier può essere causato dalla casualità (superando i limiti della non casualità o della stazionarietà), e tale casualità in questo caso è una distorsione. Se abbiamo a che fare con una serie di prezzi, non stazionaria, allora la casualità di qualsiasi livello è una parte della statistica (oltre alla parte non casuale, ma è difficile separarle), e la rimozione di una parte della statistica, rispettivamente, è una distorsione della statistica. Sono più vicino all'idea che quando si lavora con un processo casuale non stazionario non abbiamo il diritto di rimuovere (tagliare) qualcosa. A proposito, non hai risposto a quale pensi sia l'obiettivo finale, ad esempio, del trimming. I pacchetti statistici sono probabilmente destinati a lavorare con serie stazionarie e le raccomandazioni di tagliare i valori anomali sono valide in questo caso.

Se così non fosse, non è chiaro cosa fare.

Cosa si intende con questo?
 
-Alexey-:

Per quanto ne so, gli outlier vengono eliminati quando si effettuano misurazioni e si sa in anticipo che i risultati sono accomunati da almeno una legge, cioè quando il processo che genera il valore misurato è non casuale o stazionario casuale, e l'outlier può essere causato dalla casualità (che supera i limiti della non casualità o della stazionarietà), e tale casualità in questo caso è una distorsione. Se abbiamo a che fare con una serie di prezzi, non stazionaria, allora la casualità di qualsiasi livello è una parte della statistica (oltre alla parte non casuale, ma è difficile separarle), e la rimozione di una parte della statistica, rispettivamente, è una distorsione della statistica. Sono più vicino all'idea che quando si lavora con un processo casuale non stazionario non abbiamo il diritto di rimuovere (tagliare) qualcosa. Tra l'altro, non hai risposto a quale pensi sia l'obiettivo finale, ad esempio, del trimming. I pacchetti statistici sono probabilmente destinati a lavorare con serie stazionarie, e le raccomandazioni di tagliare i valori anomali in questo caso sono valide.

Cosa intende dire?

Anche il modello ARIMA tratta le serie non stazionarie riducendole a una forma stazionaria.

Mi sembra che il problema del taglio delle quotazioni abbia due livelli: superficiale e profondo.

In superficie ci sono i problemi, ad esempio, di abbattimento degli stop, che non hanno nulla a che fare con la non stazionarietà del mercato.

Il problema più profondo dell'applicazione della statistica matematica e dell'econometria è che sia i dati iniziali che i risultati intermedi e le conclusioni devono essere verificati con metodi extra-matematici - intuitivi. La scelta della soglia di cut-off (2, 3, 4 sigma o altro) è possibile solo dopo la visione del grafico e si riferisce al problema della scelta degli intervalli di confidenza. Il problema più grande dell'applicazione della statistica è che la sua applicazione non è concepibile senza l'arte dello statistico stesso. Nessuno formulerà la regola "tagliare - non tagliare". Se si taglia, si elimina la caratteristica di non stazionarietà, se non si taglia, si distorce la vera distribuzione della popolazione generale a causa di un campionamento non riuscito.

Il cuore dell'econometria è il test di ipotesi, dove è possibile commettere errori del primo e del secondo tipo: rifiutare l'ipotesi nulla corretta a favore dell'ipotesi alternativa errata e rifiutare l'ipotesi alternativa corretta a favore dell'ipotesi nulla errata.

Alla luce di quanto detto, posso essere d'accordo e in disaccordo con lei allo stesso tempo. È impossibile rispondere alla sua domanda in modo inequivocabile senza considerare in anticipo un campione specifico.

 

Даже модель ARIMA работает с нестационарными рядами путем приведения их к стационарному виду.

E anche in seguito gli ordini del modello possono cambiare nel tempo. Conclusione: una serie di dati non stazionaria è stata adattata a un modello (metodo) progettato per lavorare con una serie stazionaria a un certo punto. Poiché questo è il caso, è necessario indagare in qualche modo su quanto spesso fare l'inseguimento e su quanto a lungo funziona. In mancanza di ciò, come si fa a utilizzare un modello inadeguato?

non ha tagliato - ha distorto la vera distribuzione della popolazione generale grazie al campione fallito

Qui credo che il ragionamento sia sbagliato. Una serie non stazionaria non ha una popolazione generale, altrimenti è una serie stazionaria. E poiché lo è, non esiste una vera distribuzione.

Per quanto riguarda l'abbattimento, come si fa a sapere se c'è stato o meno? Naturalmente, se si analizzano i dati di diversi DC, in prossimità di livelli forti, anche rotondi, e si vede che alcuni di essi hanno abbattuto lo stop (per il quale è necessario introdurre un criterio), allora sono d'accordo con te, appaiono alcuni motivi quasi oggettivi per tagliare. Ma - per stabilire questo è necessario un intero lavoro, una grande ricerca.

Il problema più profondo dell'applicazione della statistica matematica e dell'econometria è che sia i dati iniziali che i risultati intermedi e le conclusioni devono essere verificati con metodi extra-matematici e intuitivi. La scelta della soglia di taglio (2, 3, 4 sigma o altro) è possibile solo dopo la visione del grafico e si riferisce al problema della scelta degli intervalli di confidenza. Il problema più grande dell'applicazione della matematica è che la sua applicazione non è concepibile senza l'arte dello statistico stesso.

Non è così che la chiamerei. L'arte, o forse solo il grado di preparazione dello statistico, è determinata dal modo in cui è in grado di stimare i limiti di applicabilità dei metodi orientati a lavorare con una serie stazionaria rispetto a una serie non stazionaria. Ma non in modo intuitivo, bensì quantitativamente (numericamente).
 
-Alexey-:

E anche in seguito gli ordini del modello possono cambiare nel tempo. Conclusione - una serie di dati non stazionaria è stata adattata a un modello (metodo) progettato per lavorare con una serie stazionaria, in un certo sito.

Ragionamento standard in AT: la serie non stazionaria è una somma di sezioni stazionarie con caratteristiche diverse. Se prendiamo il toolbox di Matlab, questo problema non viene affatto considerato: si considera che la BP abbia diverse differenze rispetto a quella normalmente distribuita e quindi si combatte con queste deviazioni. Non tutte vengono trattate.

Poiché questo è il caso, è necessario studiare in qualche modo la frequenza dell'inseguimento e la sua durata. Senza questo, come si fa a utilizzare un modello inadeguato?

Il problema non si pone. Esistono due tipi di previsioni: un passo avanti (per la candela successiva) e molti passi avanti.

Qui credo che il ragionamento sia sbagliato. Una serie non stazionaria non ha una popolazione generale, altrimenti è già una serie stazionaria. E poiché lo è, non esiste una vera distribuzione.

In linea di principio non sono d'accordo. La stazionarietà è una caratteristica della serie, non della dimensione della popolazione.

Per quanto riguarda l'abbattimento di uno stop, come si fa a sapere se lo è stato o meno? Naturalmente, se si analizzano i dati di diversi DC, in prossimità di livelli forti, anche rotondi, e si vede che alcuni di essi hanno fatto saltare lo stop (per il quale è necessario introdurre un criterio), allora sono d'accordo con te, appaiono alcuni motivi quasi oggettivi per il taglio. Ma per stabilire questo c'è tutto un lavoro, un sacco di ricerca.

L'abbattimento di una fermata è solo un esempio. Quando esaminiamo i preventivi, dobbiamo decidere cosa prendere come preventivo, e cosa invece viene eliminato per ragioni a noi sconosciute.

Non lo definirei così. L'arte, o forse solo il grado di preparazione di uno statistico è determinato da come è in grado di stimare i limiti di applicabilità dei metodi orientati a lavorare con una serie stazionaria rispetto a una serie non stazionaria. Ma non in modo intuitivo, bensì quantitativamente (numericamente).

Non sono d'accordo. È impossibile ricondurre completamente a una serie stazionaria. è da qui che nascono gli errori nella definizione delle ipotesi.


 
faa1947:

Ragionamento standard in AT: una serie non stazionaria è la somma di sezioni stazionarie con caratteristiche diverse.

Esiste una base per questo ragionamento? Dopo tutto, la serie ottenuta dalla somma citata può essere ottenuta senza di essa - per caso, e può essere ottenuta da un'altra somma di altri segmenti con altre leggi. E dato che è così - allora come può essere (ciò che è vero)?

Se prendiamo il toolbox di Matlab, questo problema non viene affatto considerato: si considera che la BP abbia delle differenze rispetto alla distribuzione normale e si lotta ulteriormente con queste deviazioni.

In base a cosa viene considerato?

Non c'è questo problema. Esistono due tipi di previsione: un passo avanti (per la candela successiva) e molti passi avanti.

Cosa c'entra questo con il fatto che un modello con parametri diversi possa essere più ottimale per i passi successivi?

In linea di principio non sono d'accordo. La stazionarietà è una caratteristica della serie, non della dimensione della popolazione.

Non è chiaro questo punto - può descrivere più dettagliatamente cosa intende? Una vera distribuzione caratterizza le proprietà di una serie, ma una distribuzione non stazionaria è per definizione una distribuzione in cui esse cambiano. Pertanto, non esiste una distribuzione vera appartenente alla popolazione generale. La N.R. ne ha solo una vera, e in un determinato momento e per un numero finito di candele.

L'abbattimento di uno stop è solo un esempio. Quando si esaminano le quotazioni, dobbiamo decidere cosa prendere come quotazioni e cosa invece non lo è per ragioni a noi sconosciute.

E su quale base si può decidere qualcosa se le ragioni sono sconosciute?

Non sono d'accordo. È del tutto impossibile ridurre a una serie stazionaria, da qui gli errori nella definizione delle ipotesi.

Ora non sono d'accordo in linea di principio. Con la formulazione stessa. Come si può rendere stazionaria una serie le cui caratteristiche cambiano in modo casuale? Cioè, questo approccio non è fondato su nulla, di quali ipotesi possiamo parlare?
 
-Alexey-:

C'è qualche base per questo ragionamento? Dopo tutto, la serie ottenuta dalla somma citata può essere ottenuta senza di essa - per caso, e può essere ottenuta da un'altra somma di altre trame con altre leggi. E poiché questo è il caso, qual è il caso (che è vero)?

Nel mio post ho sostenuto che non c'è alcuna base per questo. in AT non c'è semplicemente un altro modo.

Su quale base si ritiene che questo sia il caso?

Non è la mia opinione: è su questo che si basa tutta la statistica.

Cosa c'entra questo con il fatto che un modello con parametri diversi possa essere più ottimale nelle fasi successive?

Non esiste una cosa "ottimale". O c'è un adattamento con un certo livello di confidenza o non c'è. Se c'è un adattamento, c'è una previsione.

Non è chiaro questo punto: può descrivere più dettagliatamente cosa intende?

Il numero di SV in BP non è coinvolto nella determinazione della stazionarietà.

E su quale base si può decidere qualcosa se le cause sono sconosciute?

Questo è lo standard per i processi casuali. Se le cause sono note, è molto probabile che si tratti di un processo deterministico.

Ora, in linea di principio, non sono d'accordo. Con la formulazione stessa. Come si può rendere stazionaria una serie le cui caratteristiche cambiano in modo casuale? Cioè questo approccio non è fondato su nulla, di quali ipotesi possiamo parlare?

GARCH è un modello con volatilità variabile, per esempio.

Abbiamo una discussione a due ed è diventata troppo astratta. Anche il topkstarter non partecipa. Vorrei una certa coerenza nella discussione e nello sviluppo dell'articolo in discussione. Per esempio, nel primo passo, su un esempio concreto, considerare in dettaglio l'analisi preliminare dei dati e la loro preparazione per la modellazione. Ad esempio:

1. Giustificazione della dimensione del campione.

2. Giustificazione della necessità di trasformazione dei dati.

3. Scegliere come trasformare i dati:

- gestione degli outlier e dei dati mancanti.

- Trasformazione dei dati - rimozione di tendenze e ciclicità.

4. Determinazione dei tipi di trend e loro contabilizzazione.

5. Adattamento della distribuzione ai dati trasformati.

6. Analisi della stazionarietà dei dati trasformati.

7. Contabilizzazione dell'eteroscedasticità

Per ora è sufficiente. Un altro piano è lecito. Vorrei organizzare una presentazione sistematica del problema della preparazione del quoziente per la modellizzazione descritta nel documento in discussione.
 

Topikstarter[herringbones, non è ancora stato chiamato così] è in crisi creativa :-))))

Ma sta seguendo la discussione....

Ringrazia faa1947 per i commenti costruttivi...

-Alexey-, ti consiglio di studiare la matrice...

Prenderò in considerazione tutti i commenti, in seguito presenterò le mie controargomentazioni e argomentazioni...

 
denkir:


-Alexey-, ti consiglierei di studiare la matrice....

Quali sezioni può consigliare? Ad ogni mia affermazione (comprese le domande) posso fornire un link alla matrice.

P.S. E a quale momento è collegata la crisi creativa, se non è un segreto? :)