Statistiche di dipendenza nelle citazioni (teoria dell'informazione, correlazione e altri metodi di selezione delle caratteristiche) - pagina 3

 
alexeymosc:

Ho provato a cercare delle correlazioni nelle quotazioni di uno strumento finanziario usando metodi statistici. Per cominciare ho preso l'indice industriale Dow Jones, dati giornalieri, e ho trasformato la serie in una serie di incrementi percentuali.

Gli incrementi sono eteroscedastici. Se vuoi prevedere la direzione del movimento dei prezzi - devi tenerne conto.

Per prevedere la volatilità, è meglio usare modelli più specifici invece di NS.

 

Risposta faa1947:

"Sulla "linearità" e la "non linearità" sarei anche cauto, poiché questa domanda può e deve essere posta nel quadro del modello con cui si approssima la serie temporale. Analizzando i coefficienti di questo modello si può concludere che questi coefficienti sono: costanti (o quasi costanti), funzioni deterministiche o funzioni stocastiche. Questo è un processo perfettamente concreto e costruttivo di analisi del tipo di dipendenze. E cosa c'è di costruttivo nello scoprire questa dipendenza dalle informazioni? E ancora, come lo vedete nella serie temporale originale?".


Potrei fare un link anche alla componente economica, ma scusate, basta leggere le risposte al mio primo post nel thread, si tratta solo di questo: la volatilità intraday è ciclica. E l'informazione reciproca lo ha dimostrato. Per i timeframe giornalieri e superiori la situazione è completamente diversa, non ci sono cicli evidenti.

Come vederlo nella serie iniziale? Niente di più facile, guarda lo storico per almeno mezzo anno sulle barre orarie e nota se c'è una differenza di volatilità (nella dimensione delle candele) in base al tempo. E quando si tratta delle barre giornaliere, personalmente non ho trovato nessun ciclo naturale o qualsiasi altra logica giornaliera o economica. È solo una struttura di dipendenza interna dei prezzi.

E non sto ancora approssimando la serie temporale, sto estraendo dati dai prezzi che mi permettono di guardare i prezzi familiari da un'angolazione leggermente diversa. Qui si vede la mancanza di dipendenze negli incrementi, e vedo che stai usando l'autocorrelazione. Questo mi dice molto. Non c'è nessuna dipendenza lineare e non c'è mai stata, e non c'è bisogno di mostrare costantemente gli autocorrelogrammi, io stesso ne avevo già abbastanza da tempo, ed erano uguali ai tuoi. )

 
anonymous:

Gli incrementi sono eteroscedastici. Se vuoi prevedere la direzione del movimento dei prezzi - devi tenerne conto.

Per prevedere la volatilità, è meglio usare modelli più specifici invece di NS.


E quali modelli che sono più specifici per il forex rispetto a, diciamo, NS? Sono solo interessato alla sua opinione. Ci sono molti modelli nel mondo.
 
alexeymosc:

E quali modelli che sono più specifici per il forex rispetto a, diciamo, NS? Sono solo interessato alla sua opinione. Ci sono molti modelli nel mondo.

Non stavo parlando di modelli specifici per il forex (ce ne sono molti, soprattutto per i derivati: https://en.wikipedia.org/wiki/Vanna_Volga), ma di modelli specifici per la volatilità (ce ne sono molti, oltre a ARCH).

NS non è un approccio specifico del Forex, perché è usato ovunque (o anche viceversa - dove è troppo pigro per costruire modelli normali e ha un sacco di risorse di calcolo, è usato lì).

Gli approcci alla previsione della volatilità e della direzione dei prezzi dovrebbero essere diversi. Per la prima, non c'è bisogno di usare NS (complicazione ingiustificata), per la seconda, si può provare.

 

faa1947, per favore fai più attenzione all'impaginazione dei tuoi post. A volte non si può separare immediatamente ciò che si cita dalla risposta.

Ora veniamo al punto:

faa1947: Как мне кажется, увеличение объема выборки представляет интерес только в рамках предельной теоремы о сходимости по вероятности к нормальному закону. Хочу Вас разочаровать, что если мы не ставим перед собой такой задачи, то простое увеличение выборки ничего не дает. Ниже привожу увеличение выборки в 10 раз.

Un dito nel cielo, scusate. Di quale normalità nel limite stai parlando? Normalità di cosa? La distribuzione dei rendimenti? In questa fase questa ipotesi non mi fa né caldo né freddo. Non ho bisogno di alcuna ipotesi sulla distribuzione dei rendimenti e a quale legge tendono.

Personalmente, ho il seguente requisito sul mio orologio: dato che intendevo utilizzare il criterio del chi-quadrato di indipendenza delle variabili casuali (volevo così), la dimensione del campione doveva essere tale che qualsiasi frequenza di un evento congiunto fosse garantita per essere almeno 5. Questo vincolo dovrebbe essere noto anche a voi. Ecco perché è uscito un campione così debole sugli orologi.

Ma questo sono io. Perché alexeymosc abbia usato il suo campione esattamente così grande, non lo so. Ma posso indovinare: probabilmente voleva stabilire un modello per tutta la serie e non una parte di essa.

faa1947: farei piuttosto attenzione alla "linearità" e alla "non linearità", perché questa domanda può e deve essere posta nel quadro di un modello, con cui si approssimano le serie temporali. Analizzando i coefficienti di questo modello si può concludere che questi coefficienti sono: costanti (o quasi costanti), funzioni deterministiche o funzioni stocastiche. Questo è un processo perfettamente concreto e costruttivo di analisi del tipo di dipendenze.

Non ci sono ancora modelli. Solo Data Mining con metodi statistici non parametrici.

Sono sicuro che si tratta proprio di una relazione non lineare: non c'è una relazione lineare significativa rilevabile dalla correlazione di Pearson a ritardi superiori a 10. Tu stesso lo sai. Ma le relazioni si trovano anche a ritardi moltopiù grandi. Quindi sono non lineari!

faa1947: E cosa c'è di costruttivo nel rilevare questa dipendenza dalle informazioni? E ancora, come lo vedete nella serie temporale originale?

Non è facile da vedere, qui sono d'accordo con te. Conosciamo solo la quantità media di informazioni trasmesse alla barra zero da una storia piuttosto lontana - e il meccanismo di questo "attacco di informazioni dal passato" non ci è noto. Dobbiamo ancora riuscire a convertire quei bit nudi in uno strumento di previsione. Chi ha detto che sarebbe stato facile?

Gli incrementi sono eteroscedastici. Se vuoi prevedere la direzione del movimento dei prezzi, devi necessariamente tenerne conto.

Sono estremamente ignorante dei modelli econometrici moderni, compreso ARCH e la famiglia correlata. Puoi spiegare sulle tue dita perché questo deve essere preso in considerazione in una fase in cui non sono stati costruiti modelli di comportamento incrementale? Nessun modello, solo una schietta applicazione della teoria dell'informazione. Grazie.

 
anonymous:

Non stavo parlando di modelli specifici per il forex (ce ne sono molti, soprattutto per i derivati: https://en.wikipedia.org/wiki/Vanna_Volga), ma di modelli specifici per la volatilità (ce ne sono molti, oltre a ARCH).

NS non è un approccio specifico del Forex, perché è usato ovunque (o anche viceversa - dove è troppo pigro per costruire modelli normali e ha un sacco di risorse di calcolo, è usato lì).

Gli approcci alla previsione della volatilità e della direzione dei prezzi dovrebbero essere diversi. Per la prima non c'è bisogno di usare NS (complicazione irragionevole), per la seconda si può provare.


Sono d'accordo in linea di principio su NS, anche se il metodo stesso non è così semplice. Ci sono anche un sacco di convenzioni, che è auspicabile e talvolta obbligatorio seguire (dalla pre-elaborazione dei dati e la selezione delle variabili rilevanti, alla costruzione di reti). E in generale, ci sono persone che amano applicare le conoscenze che conoscono ai fenomeni studiati, e ci sono quelli che iniziano a studiare da zero, e gli ultimi probabilmente preferirebbero NS. IMHO.

Ma non ho intenzione di prevedere la volatilità, cerco sempre di prevedere la direzione del movimento dei prezzi. In questo problema uso NS.

 
alexeymosc:

Risposta faa1947:


...la volatilità intraday è ciclica. E l'informazione reciproca lo ha dimostrato.

Le vostre informazioni reciproche non mi hanno mostrato nulla. Dovreste assicurarvi che non ci siano costituenti deterministici nella BP prima di fare l'elaborazione delle statistiche. Se sono presenti nella BP, "segneranno" le statistiche e tutti i sondaggi non possono essere attendibili. Devo deluderti: la definizione di volatilità per BP iniziale è sbagliata. Riesco a costruire modelli con i seguenti parametri: 44 pips di volatilità e la sua fluttuazione più meno due pips, cioè posso considerarla costante. La volatilità che rimane per l'analisi dipende fortemente dal modello applicato.

E non approssimo ancora la serie temporale, estraggo i dati dai prezzi che mi permettono di guardare i soliti prezzi da un'angolazione leggermente diversa. Qui si vede la mancanza di dipendenze negli incrementi

Fumo davanti alla locomotiva. In realtà, a livello del libro di testo, l'ordine dell'analisi BP è definito: stazionario/non stazionario - per il non stazionario la scelta del metodo di trasformazione è stazionario. Sicuramente questo primo passo comporterà la rimozione della tendenza. Poi, vediamo.

 

Non capisco cosa stai facendo qui. Ho deciso di rinfrescare la mia comprensione della Teoria dell'Informazione (IT) e l'ho cercata nel glossario dei termini:

TI considera la nozione di "informazione" solo dal punto di vista quantitativo, senza riferimento al suo valore o anche al suo significato. Con un tale approccio una pagina di testo dattiloscritto al massimo contiene sempre approssimativamente la stessa quantità di informazioni, determinata solo dal numero di caratteri e spazi (cioè di caratteri) sulla pagina e non dipende da ciò che è stampato su di essa, compreso il caso di set di caratteri senza senso e caotico. Per la modellazione dei sistemi di comunicazione, questo approccio è valido, poiché sono progettati per trasmettere informazioni rappresentate da qualsiasi set di caratteri senza errori sul canale di comunicazione. Nei casi in cui è essenziale considerare il valore e il significato delle informazioni, l'approccio quantitativo è inapplicabile. Questa circostanza impone delle restrizioni essenziali ai campi di applicazioni possibili del TC. Non tenerne conto ha portato nelle prime fasi di sviluppo a sovrastimare l'importanza applicata.

A questo proposito ho tre possibili risposte:

1. Siete sicuri che il dizionario stia mentendo e non è proprio così.

2. Siete nelle "prime fasi di sviluppo" e non avete ancora intrapreso una valutazione della "rilevanza applicata".

3. Tu sei qualcos'altro.

 
Mathemat:

Sono estremamente ignorante dei moderni modelli econometrici...

Questo chiarisce molto. In realtà, l'econometria è una scienza (sottolineo scienza) che studia le serie temporali economiche da almeno 100 anni. La Society of Econometricians negli Stati Uniti si è formata negli anni 30. A giudicare dai tuoi post, questa è una scienza in cui sei bravo. Non sei solo in questo forum e come nota a margine: secondo gli sviluppatori di questo sito c'è un errore grammaticale nella parola "econometria" e nei suoi derivati.

 
faa1947: Le vostre informazioni reciproche non mi hanno mostrato nulla. Dovreste assicurarvi che non ci siano componenti deterministiche prima di fare l'elaborazione statistica della BP.

Di nuovo 25, un dito nel cielo. Lo studio non è stato fatto in relazione a una serie di prezzi, ma ai loro rendimenti. Questo è in primo luogo.

In secondo luogo, la pre-elaborazione dei dati come quella da lei menzionata è determinata principalmente dagli obiettivi dell'analisi, non da requisiti dogmatici imposti allo studio senza tener conto degli obiettivi.

Fumo davanti alla locomotiva. In realtà, a livello del libro di testo, l'ordine dell'analisi BP è definito: stazionario/non stazionario - per il non stazionario la scelta del metodo di trasformazione è stazionario. Sicuramente questo primo passo comporterà la rimozione della tendenza. Poi vedremo.

Vedi la mia obiezione sopra. Abbinare i metodi di ricerca ai suoi obiettivi! E infine smettete di borbottare i vostri incantesimi su stazionarietà, detrending e altre cose che sono irrilevanti per l'argomento dello studio.

2 HideYourRichess: Oggi sono un po' in vacanza, quindi sono temporaneamente libero di dire quello che penso :) Stiamo avendo una resa dei conti religiosa su cosa sia l'informazione?

2 faa1947:

In realtà l'econometria è una scienza (sottolineo scienza) che studia le serie temporali economiche da almeno 100 anni.

Ok, che sia una scienza. Se ricordo bene, l'econometria ama molto imporre i suoi modelli ai dati finanziari. Non li impongo. Allora non mi occupo di econometria. Ci sono altre domande?

Motivazione: