Discussione sull’articolo "Approccio econometrico all'analisi dei grafici" - pagina 2

 
Rosh:
Aggiungi. Ripubblicheremo.
Suggerisco di discutere ancora un po' il materiale. Ci sono alcuni commenti preziosi. Allora aggiornate l'articolo :-)
 
-Alexey-:
Sbagliato, e wiki contiene errori. Prendiamo la distribuzione uniforme. È possibile calcolare la curtosi, ma non ci sono code. Quindi vi è stato detto correttamente che nel caso generale non c'è alcuna relazione tra la gravità, la lunghezza, la presenza stessa di code e il coefficiente di curtosi. Prendiamo una distribuzione triangolare: la stessa cosa.

Cosa c'è di sbagliato esattamente?

-Alexey-, onestamente, nel campo della ricerca sulle serie temporali, in particolare la serie di rendimenti che ho descritto nell'articolo, non ho mai incontrato distribuzioni come quella di cui parli (triangolare e uniforme). È molto probabile che servano a uno scopo completamente diverso. Quindi non c'è bisogno di fare riferimento a qualche esempio marginale, non riesco a trovare un'altra parola, mi perdoni. E se affermate qualcosa, siate così gentili da fornire un esempio analitico concreto.

Le distribuzioni che vengono utilizzate più spesso, se non sempre, nell'analisi di cui sopra sono la distribuzione normale, la distribuzione di Student e la distribuzione di Cauchy.

 
-Alexey-:

...per utilizzare questo coefficiente è necessario, in primo luogo, determinare la funzione di distribuzione empirica, compito non banale dal punto di vista matematico, e in secondo luogo, nell'ambito di alcuni criteri probabilistici, verificare e accettare l'ipotesi che la distribuzione abbia un'unica modalità, cosa che non sempre si verifica per le serie finanziarie e che è anch'essa un compito non banale. Senza l'esecuzione di questi passaggi, il calcolo successivo è impossibile, se richiede il "coefficiente di eccesso".


Osservazione preziosa. Se si trattasse di Distribution Fitting in un articolo, ci sarebbe abbastanza materiale per un secondo articolo. Forse in futuro io o qualcun altro scriveremo un articolo su questo argomento. Lo scopo era semplicemente quello di evidenziare le caratteristiche di una serie temporale che richiedono l'uso di modelli non lineari.

 

-Alexey-:


Non è scritto nulla su cosa fare se il test dice che la serie non è applicabile al modello ipotizzato.

Non si dice nulla sul perché e su quale base si utilizzi una serie di cosiddetti "rendimenti" e non un'altra.

Quali sono attraenti e a quale scopo? Perché attraenti e non convenienti? Qual è un criterio matematico valido per scegliere il tipo di conversione?

Sì, non c'è scritto nulla :-)

Perché la logica è semplice. Se un test, in questo caso un test Q, non mostra autocorrelazione, allora non ha senso usare un modello non lineare. Utilizziamo quelli lineari.

La serie di rendimenti viene utilizzata sulla base del fatto che la stazionarietà della serie temporale è garantita. Questo è importante, ad esempio, per la modellazione successiva.

Il prezzo dell'attività è non stazionario. I rendimenti sono solitamente stazionari.

Inoltre, è possibile confrontare serie diverse tra loro, ossia, in senso figurato, incrociare ricci con ricci.

Di solito, la frequenza delle serie è relativamente alta (giornaliera, oraria, ecc.), quindi le serie di rendimenti possono essere ottenute sia con la capitalizzazione continua (che è ciò che abbiamo fatto) sia con la capitalizzazione semplice. La differenza sarebbe minima.

Credo che la questione della differenza tra i termini "attraente" e "conveniente" sia discutibile.

 
-Alexey-:
Pensa che i critici debbano assistere alle difese della tesi o che debbano semplicemente accettarla senza difenderla e iniziare la ricerca pratica? Credo che le interesserà sapere che le correlazioni non sono calcolate correttamente. Le critiche hanno lo scopo di migliorare il materiale, nessuno sostiene che l'articolo sia buono. In modo che il profitto dei vostri sistemi non sia piccolo, ma maggiore.

Le critiche sono molto necessarie. Perché in una disputa troviamo la verità, di norma.

-Alexey, e qual è la scorrettezza del calcolo, puoi specificarlo?

L'autocorrelazione nelle serie di rendimento è solitamente debole o assente.

 
denkir:

Cosa c'è di sbagliato esattamente?

-Alexey-, onestamente, nel campo della ricerca sulle serie temporali, in particolare sulla serie di rendimenti che ho descritto nell'articolo, non ho mai incontrato distribuzioni come quella di cui parli (triangolare e uniforme). È molto probabile che servano a uno scopo completamente diverso. Quindi non c'è bisogno di fare riferimento a qualche esempio marginale, non riesco a trovare un'altra parola, mi perdoni. E se affermate qualcosa, siate così gentili da fornire un esempio analitico concreto.

Le distribuzioni che vengono utilizzate più spesso, se non sempre, nell'analisi di cui sopra sono la distribuzione normale, la distribuzione di Student e la distribuzione di Cauchy.

Queste distribuzioni possono essere utilizzate più spesso, ma la distribuzione reale non è normale, né di Cauchy né di Student, ma di solito si avvicina di più alla distribuzione di Laplace. È stato correttamente affermato in precedenza che il compito di identificare la distribuzione non è banale, ma ciò non significa che sia impossibile. In ogni caso, personalmente sono convinto dai test di conformità alla doppia esponenziale con il risultato R^2 = 0,999 abbastanza bene.

Ora parliamo di questo grafico:


Qui, tra l'altro, sono disegnate solo distribuzioni di Laplace, il che significa che tutte hanno un rapporto di eccesso esattamente pari a 3. Quindi, anche in questo caso, non ha alcun legame con le distribuzioni di Laplace. Quindi, ancora una volta, non ha alcuna relazione con lo "spessore delle code" - è lo stesso per tutti i grafici presentati qui.

PS Vorrei anche parlare degli econometrici che si ristampano a vicenda da un libro di testo all'altro e poi alla pedivikia, ma va bene, lo lascio alla prossima volta.

 
A proposito, forse vi sorprenderà, ma non ho mai visto una distribuzione normale nel mercato.
 

domanda per l'autore dell'articolo.

Lei interpreta il test di Lewing-Box come segue (citazione):

la nostra funzione esegue Q-тест Льюнга-Бокса-Пирса e restituisce un array di valori logici per determinati lag. Se un elemento dell'array è falso, allora l'ipotesi nulla che non vi sia autocorrelazione a un dato lag non viene rifiutata.

L'interpretazione corretta secondo la definizione del criterio dovrebbe essere la seguente:

la nostra funzione esegue un test Q di Lewng-Box-Pierce e restituisce un array di valori logici per i lag dati. Se un elemento dell'array è falso, l'ipotesi nulla che non vi sia autocorrelazione ai lag da 1 fino a quello specificato non viene rifiutata.
Domanda. Rientra nella categoria "espresso in modo non corretto" o si tratta di un errore di calcolo nell'interpretazione dei risultati del test?
 
alsu:

Possono essere usate più spesso, ma la distribuzione reale non è normale, né di Cauchy o di Student, ma di solito si avvicina di più alla distribuzione di Laplace. È stato correttamente affermato sopra che il compito di identificare la distribuzione non è banale, ma ciò non significa che sia impossibile. In ogni caso, personalmente sono convinto dai test di conformità alla doppia esponenziale con il risultato R^2 = 0,999 abbastanza bene.

Ora, a proposito di questo grafico...

Qui, tra l'altro, sono disegnate solo distribuzioni di Laplace, il che significa che tutte hanno un rapporto di eccesso esattamente pari a 3. Quindi, anche in questo caso, non ha alcun legame con la distribuzione di Laplace. Quindi non ha alcun legame con lo "spessore delle code": è lo stesso per tutti i grafici presentati qui.

alsu, sono d'accordo sul fatto che la distribuzione di Laplace abbia sempre un rapporto di eccesso di 3. Sono stato frettoloso con la sua stima, perché non la vedevo da molto tempo... Ma ancora una volta ripeto che gli econometrici nel campo di ricerca di cui ho scritto usano queste distribuzioni. Se per lei i premi Nobel non sono autorità (ad esempio Robert Engel), allora passo.

Se non fornisce un esempio analitico concreto, considero l'argomento speculativo.

 

denkir:

Cosa c'è di sbagliato esattamente?


1) Ogni coefficiente è determinato utilizzando una quantità diversa di dati, cioè sono statisticamente disuguali. Pertanto, ogni coefficiente deve essere testato per la significatività separatamente dagli altri. Questo non è il caso del test di Ljung-Box.

2) Il livello di significatività per il test viene scelto in base a cosa - proprio così?

-Alexey-, onestamente, nel campo della ricerca sulle serie temporali, in particolare sulle serie di rendimento, che ho descritto nell'articolo, non ho mai incontrato distribuzioni come quella di cui parli (triangolare e uniforme). È molto probabile che servano a uno scopo completamente diverso. Quindi non c'è bisogno di fare riferimento a qualche esempio marginale, non riesco a trovare un'altra parola, mi dispiace.

Quindi non hai risposto: da dove viene questa serie di rendimenti, qual è la giustificazione per la scelta della trasformazione? Senza dubbio si può ottenere una linea retta dal grafico dei prezzi con l'aiuto di trasformazioni, ma a cosa serve? Ho letto quello che scrivi:

La serie dei rendimenti viene utilizzata sulla base del fatto che la stazionarietà della serie temporale è garantita.

Questo approccio è solo un terribile ingombro con una grande perdita di informazioni. Cosa c'è da prevedere allora? Nel linguaggio matematico si chiama "adattamento dei dati al metodo di previsione". Ma questo non è il modo giusto per farlo. Il metodo può essere utilizzato solo se i dati iniziali sono accettabili per esso, e non per tagliarli in modo che lo diventino. Questo è un problema ben noto della statistica moderna.


E se affermate qualcosa, siate così gentili da fornire un esempio analitico concreto.

Ecco un esempio concreto, non analitico ma pratico, sulla situazione attuale dell'euro a 4 ore. Distribuzione su una serie di residui che ottengo con altre trasformazioni, e so perché. Si può notare che la distribuzione è quasi triangolare.

E la sua forma può cambiare nel modo più bizzarro, perché questa serie non è stazionaria. Da dove viene l'idea che la serie dei prezzi sia distribuita secondo la

distribuzione normale, la distribuzione di Student e la distribuzione di Cauchy.

- È un'assurdità, praticamente molto rara. Forse state parlando di qualcos'altro e non vi ho capito.