Discussione sull’articolo "Approccio econometrico all'analisi dei grafici" - pagina 10
Ti stai perdendo delle opportunità di trading:
- App di trading gratuite
- Oltre 8.000 segnali per il copy trading
- Notizie economiche per esplorare i mercati finanziari
Registrazione
Accedi
Accetti la politica del sito e le condizioni d’uso
Se non hai un account, registrati
Capisco, per questo utilizzo il concetto di "classe" o "intervallo".
faa1947, nella tua figura vedo che la distribuzione non è unimodale. Questo è un altro problema.
Allora anche il numero di classi (rack) viene calcolato con qualche formula, regole... le più famose sono:
Formula di Sturges, regola di Freedman-Diaconis, regola di Scott, scelta della radice quadrata, ecc.
denkir :
Penso che sia possibile. Non dovrebbero influenzare in alcun modo i parametri statistici del campione (in particolare i parametri di distribuzione). Ecco perché sono outlier.
Sulla base del fatto che la dimensione del campione è abbastanza grande da non essere influenzata dagli outlier. Questo è uno dei motivi per cui sono favorevole alle grandi dimensioni del campione. Poi il collega faa1947 ha detto, se non sbaglio, che gli outlier non sono la stessa cosa degli outlier. È chiaro che se, ad esempio, il tasso dell 'eurusd ha fluttuato nel campione all'interno dell'intervallo 1,20-1,50 dollari, e poi c'è stato un errore del server che ha restituito il valore di 15,77 dollari, allora un tale outlier incasinerà tutti i parametri statistici del campione.
-Alexey:
Una distribuzione vera e propria caratterizza le proprietà di una serie, ma una distribuzione non stazionaria è per definizione una distribuzione in cui esse cambiano.
Ma mi dica, qual è il legame tra la distribuzione vera e la stazionarietà? Confesso di non aver mai incontrato una tale connessione. Da dove l'hai tratta, se non è un segreto? ;-)
См. мой пост выше -Alexey. Все-таки надо начинать с длины выборка, которая определяется целью прогноза для ТС. Т.е.: достаточна ли длина выборки для ответа на вопрос: можно входить в позу (выходить из позы) или нельзя? Скорее всего длина выборки будет не значительной (до сотни) и исчезнут фантастические распределения, подобные выше приведенному.
Vedete, il punto è questo. Riducendo la dimensione del campione, potremmo perdere un fenomeno come il clustering della volatilità. Allora non ha senso utilizzare un modello non lineare. Quindi possiamo usare un modello lineare. E questo non riflette la natura della serie finanziaria, la sua derivata (da non confondere con la derivata dell'analisi matriciale).
E quali sono i dati sulla base dei quali avete ottenuto la distribuzione bimodale? Potrebbe caricare un file con i dati?
Vedete, il punto è questo. Riducendo la dimensione del campione, potremmo perdere un fenomeno come il clustering della volatilità. Allora non ha senso utilizzare un modello non lineare. Quindi possiamo usare un modello lineare. E questo non riflette la natura della serie finanziaria, la sua derivata (da non confondere con la derivata dell'analisi matriciale).
Se professiamo l'approccio sistemico, dovremmo partire dall'obiettivo: entrata/uscita per arrivare alla posa. Quale sarà il quoziente nel residuo secco? Se prendiamo un campione limitato, non è affatto necessario avere volatilità o non stazionarietà, no? È necessario scegliere il modello. L'ARMA (nemmeno l'ARIMA) è ampiamente utilizzato. Non abbiamo l'obiettivo di applicare un determinato modello. L'obiettivo è ottenere una previsione con un livello ragionevole di limiti di confidenza. È interessante calcolare la previsione per, ad esempio, 100, 500, 1000 candele. Forse vedremo qualcosa.
E quali sono i dati sulla base dei quali avete ottenuto una distribuzione bimodale? Potrebbe caricare un file con i dati?
EURUSD D1 dal 1999/01/04 al 2011/01/13, 3063 candele prese dal terminale.
Sulla base del fatto che il campione è sufficientemente grande da non rispondere ai valori anomali. Questo è uno dei motivi per cui sono a favore di un campione di grandi dimensioni. Poi il collega faa1947 ha detto, se non sbaglio, che un outlier non è la stessa cosa di un outlier. È chiaro che se, ad esempio, il tasso dell'eurusd fluttuava nel campione all'interno dell'intervallo 1,20-1,50 dollari, e poi c'era qualche errore del server che restituiva il valore di 15,77 dollari, allora tale outlier scombussolava tutti i parametri statistici del campione.
Ma ditemi voi, qual è il legame tra la vera distribuzione e la stazionarietà? Confesso di non aver mai visto tale connessione. Da dove l'hai tratta, se non è un segreto? ;-)
Ti ho risposto nell'ultima pagina con una citazione dal libro di testo. Se non è chiaro, lo spiegherò in modo più dettagliato:
Il concetto di popolazione generale è in un certo senso simile al concetto di variabile casuale (legge di distribuzione delle probabilità, spazio di probabilità), perché è completamente condizionato da un certo insieme di condizioni.
Un certo insieme di condizioni genera un processo stazionario. Se è indefinito - non esiste una popolazione generale, rispettivamente una vera distribuzione. La logica è più o meno questa. Anche se, naturalmente, potrei sbagliarmi.
Secondo la vostra risposta - la risposta è sbagliata. A proposito, speravo di vedere un riferimento alla matrice sulla base della quale avete fatto l'affermazione di cui sopra. Se non ce l'hai (cioè non sai perché gli outlier vengono rimossi e come influenzano la distribuzione), allora ti consiglio, come hai fatto con me prima, di imparare il materiale. Tutto è chiaro con gli outlier di grandi dimensioni, e hai ragione a notare che ci dovrebbe essere un controllo per loro (tale controllo può rilevare una lacuna nelle virgolette), ma la domanda non riguarda loro, ma 3-4-5 sigma. È anche interessante che, anche senza toccare la questione se debbano essere rimossi o meno, la metodologia della loro rimozione (almeno secondo il libro citato sopra, anche se non dice tutto) è un lavoro molto grande e lungo, come penso, e piuttosto complicato.
Un certo insieme di condizioni genera un processo stazionario. Se è incerto, non esiste una popolazione generale e quindi una vera distribuzione. La logica è più o meno questa. Anche se, ovviamente, potrei sbagliarmi.
Secondo Wikipedia: la popolazione generale è l'insieme dei valori che un ricercatore ha selezionato per l'analisi. Un ricercatore può campionare la popolazione generale in base a qualsiasi regola, compresa una cosa dubbia come la "stazionarietà". È normale quando una regola viene selezionata al di fuori dei concetti della statistica, ad esempio "tutte le transazioni di acquisto di euro per rubli". Le transazioni sono generate da un processo economico che conosciamo solo approssimativamente, non conosciamo il numero di transazioni. Queste due circostanze ci fanno considerare la non stazionarietà come la caratteristica principale delle quotazioni valutarie, tutto il resto sono i suoi segni.
Tutto è chiaro con i grandi outlier, e lei ha giustamente osservato che dovrebbe esserci un controllo per questi ultimi (tale controllo può rilevare un gap nelle quotazioni), ma il discorso (e la domanda) non riguarda questi ultimi, bensì 3-4-5 sigma.
Inoltre, riporto gli istogrammi delle quotazioni D1 della coppia euro-dollaro nella quantità di 100 candele.
Ecco le statistiche descrittive del campione
Inoltre, uno dei valori di chiusura è stato costantemente modificato in 3 sigma, 5 sigma e 5 media.
Vediamo:
1. Coda sinistra ovunque.
2. Il numero di colonne dell'istogramma cambia, anche se ovunque sono specificati 20 intervalli per 100 candele.
3. Il valore p dell'adattamento alla legge normale e, di conseguenza, l'intervallo di confidenza dell'adattamento cambiano.
Metà è sbagliata e l'altra metà è sottostimata, una parte è corretta. Per questo è auspicabile verificare Wiki con la letteratura specializzata, e che sia raccomandata dal Ministero dell'Istruzione e tutto il resto. Più tardi scriverò una definizione tratta dal dizionario enciclopedico di statistica. Credo che tu abbia le idee completamente confuse.
Una popolazione è un insieme di valori che un ricercatore ha selezionato per l'analisi.
Metà delle informazioni sono sbagliate e l'altra metà è sottostimata, alcune sono corrette. Pertanto, è auspicabile verificare Wiki con la letteratura specializzata, e che sia raccomandato dal Ministero dell'Istruzione e tutto il resto. Più tardi scriverò una definizione tratta dal dizionario enciclopedico di statistica. Credo che lei sia completamente confuso.
Questo avviene solo quando si prendono tutti i dati esistenti e si sa che non ce ne sono altri. Altrimenti, se prendo 10 candele, si tratta di una popolazione campione, non di una popolazione generale. Per esempio, quando si misura il lavoro di una macchina, si sa che domani ci saranno nuovi dati - non c'è mai una popolazione generale. La popolazione generale viene valutata su di essa (campione) - leggi le valutazioni. E al momento della stima non viene adattata alla legge normale (se non si sa che è tale), ma la legge viene identificata con metodi speciali, e mentre non si sa come si può eliminare qualcosa (vi ho dato un link al libro - è scritto lì). Inoltre, viene valutata non da un solo campione, ma da più campioni, vengono confrontati test speciali, ecc.Purtroppo, ti sei permesso di estrapolare dal contesto frasi distinte, senza cercare di capire il significato del mio post. Ancora una volta. Nel forex, la regola per selezionare la popolazione generale è costituita da tutte le operazioni che non ci sono note. Non mi interessa la definizione dell'enciclopedia o di Wiki - mi interessa la previsione, non le proprietà statistiche della popolazione generale. Sotto la vostra pressione sono quasi caduto nella fornicazione botanica e sono andato persino nel pacchetto STATISTICHE per vedere la definizione di "popolazione generale": il famoso pacchetto non considera questo concetto.
Pulizia delle emissioni. Ha dato indicazioni specifiche sull'effetto delle emissioni sull'adattamento, guardate bene. Se non si rimuovono le emissioni, si otterrà un fit sbagliato, questo è il punto, e molto probabilmente con caratteristiche molto buone. Se si modifica l'outlier, cambieranno i parametri della legge o la legge, tutto a causa di uno o due valori nel campione. Dopo il fitting, non è necessario pulire i dati.
È comunque auspicabile che leggiate i libri di testo e la migliore documentazione dei pacchetti mat sull'econometria, non sulla matstatistica - questo migliorerà la vostra comprensione. Qualsiasi pacchetto di econometria inizia con la preparazione dei dati per l'analisi, non viceversa, prima il fitting e poi la preparazione dei dati.
. :) Non volevo che i lettori fossero fuorviati, ma spero che chi ne ha bisogno lo capisca.
Ok, vi lascio al vostro compito.
Non credo che sia la decisione giusta
Qualsiasi pacchetto è solo uno strumento, niente di più. Sembra che parliamo lingue diverse.
Ti prego di perdonarmi se ti lascio dare consigli sui pacchetti. In argomenti teorici, come tesi e dissertazioni, il suo approccio è abbastanza valido e preferibile al mio. Ma abbiamo un problema pratico e un pacchetto non è solo uno strumento, ma un sistema in cui molti concetti sono riuniti per produrre un risultato pratico. Non otteniamo solo un'interpretazione univoca dei termini, ma anche il loro calcolo univoco. L'autore dell'articolo ha menzionato GARCH, e questo è un concetto molto elastico, molto meno univoco di "popolazione generale".
Spero che continuerete a partecipare all'argomento.