Discussione sull’articolo "Analisi di regressione dell'influenza dei dati macroeconomici sulla fluttuazione dei prezzi delle valute" - pagina 2

 
Salavat:

Finora non sono stati trovati altri approcci....

È qui che ti sbagli di grosso.
 
Ok. Non discuto, riformulo: Tra le molte alternative, propongo di prestare attenzione al metodo descritto nell'articolo come un metodo promettente.
 
Salavat:
Ok. Non discuto, riformulo: Tra le molte alternative, suggerisco che anche il metodo descritto nell'articolo dovrebbe essere considerato promettente.

Lo strumento che avete delineato può rivelarsi indubbiamente utile nelle seguenti circostanze.

1. Nei lavori di costruzione di una CT con un gran numero di variabili indipendenti, diverse decine o centinaia, l'approccio che avete delineato sarà utile per segnare alcune direzioni di ricerca. Se queste indicazioni formali sono accompagnate da un ragionamento sostanziale sull'influenza della variabile indipendente sulla variabile dipendente e sull'influenza reciproca delle variabili indipendenti, va bene.

2. Lo strumento da voi proposto è una fase di transizione verso un insieme più ampio di strumenti. Il punto è che, per quanto mi ricordo, STATISTICS è uno strumento molto limitato e non è aggiornato. Dopo aver fatto questo primo passo verso l'analisi della significatività delle variabili per la variabile target, sarà naturale passare a un set di strumenti più ampio, come quelli offerti dalla shell caret di R.

 
Molto più discutibile è la fonte dei dati. Quale release di indicatori macroeconomici è stata utilizzata? Spesso tali dati sono contrassegnati non con la data di rilascio, ma con la data di fine periodo a cui si riferiscono. Pertanto, utilizzando, ad esempio, una serie del PIL non della prima release si può facilmente guardare sei mesi nel futuro (per non parlare della revisione dei metodi di calcolo e del ridisegno di decenni di storia, come è avvenuto di recente con il PIL statunitense).
 

L'articolo è interessante. Grazie. Ma è più che altro una guida all'uso della statistica. E contiene molte idee sbagliate.

  1. Prevedere (e questa parola compare nell'intestazione Equazione di regressione e previsione finale) per 5 giorni utilizzando indicatori macroeconomici è un'assurdità. Gli indicatori macroeconomici vengono rilasciati su base mensile e trimestrale e poi aggiustati per diversi mesi. Inoltre, gli indicatori macroeconomici hanno molto rumore anche su intervalli trimestrali e annuali, per non parlare di quelli giornalieri.
  2. L'articolo spiega poco come sono stati scelti questi indicatori macroeconomici. Si limita a prendere i 99 più popolari che vengono spesso citati nelle notizie. Quasi tutti non sono in grado di prevedere il mercato perché sono in ritardo, non in testa. Anche se si prendono gli Ordini di Fabbrica o i Permessi di Costruire, pur essendo considerati leading, non lo sono realmente, perché includono indicatori costitutivi che sono già stati annunciati un paio di mesi fa e ai quali il mercato ha già reagito. Vi svelo un segreto gratuito: cercate indicatori di Consumo diversi che non sono presenti nel vostro elenco di dati. Sono davvero trainanti. Quando i consumi sono scesi, gli ordini di fabbrica e i permessi di costruzione sono scesi, e con essi il PIL e il mercato. Quindi tutto parte dai consumi. Questo aspetto è ben descritto anche nel Capitale di Marx.
  3. L'analisi di regressione è persino molto applicabile ai modelli economici. faa1947 usa alcuni dogmi invece di entrare nell'essenza del metodo matematico. Il problema non è nel metodo, ma nei dati e nella loro preparazione. I dati devono essere stazionari, non importa se si tratta di una regressione o di un "processo controllato". I dati economici sono non stazionari nella loro forma originale. Ma possono essere facilmente trasformati in dati stazionari, ad esempio mediante differenziazione e normalizzazione.
  4. Il problema della regressione è che qualsiasi altra serie, anche completamente estranea a quella modellata, può essere inserita in qualsiasi serie modellata, se tali serie di input sono scelte in numero sufficiente. Ad esempio, le fluttuazioni della temperatura dell'aria in Alaska, i dati sull'inquinamento atmosferico a Los Angeles, ecc. possono essere incorporati con successo nei prezzi del forex. L'errore di regressione può essere portato a zero includendo questi "dati estranei". Anche l'accuratezza della previsione sarà pari a zero. Pertanto, è necessario sapere come scegliere i dati giusti, quanto e con quale ritardo.
  5. È utile anche conoscere il meccanismo di funzionamento delle aziende. Ad esempio, a tutti piace citare il tasso di disoccupazione. Lo considerano un barometro dell'economia. Ma in realtà, una volta che il tasso di disoccupazione è salito, è troppo tardi per reagire, perché l'economia è già in declino e lo è da molto tempo. Il problema dell'UR è che comprende tutti coloro che hanno più di 16 anni. Ci sono decine di tassi di disoccupazione diversi per segmenti diversi della popolazione e per occupazioni diverse. Ecco una domanda per il backfill: se le aziende vedono un calo della domanda dei loro prodotti, chi licenziano per primo? E la seconda domanda è: quali aziende sono le prime a percepire un calo della domanda?
 
gpwr:

L'articolo è interessante. Grazie. Ma è più che altro una guida all'uso della statistica. E contiene molte idee sbagliate.

  1. Prevedere (e questa parola compare nell'intestazione Equazione di regressione e previsione finale) per 5 giorni utilizzando indicatori macroeconomici è un'assurdità. Gli indicatori macroeconomici vengono rilasciati su base mensile e trimestrale e poi aggiustati per diversi mesi. Inoltre, gli indicatori macroeconomici hanno molto rumore anche su intervalli trimestrali e annuali, per non parlare di quelli giornalieri.
  2. L'articolo spiega poco come sono stati scelti questi indicatori macroeconomici. Si limita a prendere i 99 più popolari che vengono spesso citati nelle notizie. Quasi tutti non sono in grado di prevedere il mercato perché sono in ritardo, non in testa. Anche se si prendono gli Ordini di Fabbrica o i Permessi di Costruire, pur essendo considerati leading, non lo sono realmente, perché includono indicatori costitutivi che sono già stati annunciati un paio di mesi fa e ai quali il mercato ha già reagito. Vi svelo un segreto gratuito: cercate indicatori di Consumo diversi che non sono presenti nel vostro elenco di dati. Sono davvero trainanti. Quando i consumi sono scesi, gli ordini di fabbrica e i permessi di costruzione sono scesi, e con essi il PIL e il mercato. Quindi tutto parte dai consumi. Questo aspetto è ben descritto anche nel Capitale di Marx.
  3. L'analisi di regressione è persino molto applicabile ai modelli economici. faa1947 usa alcuni dogmi invece di entrare nell'essenza del metodo matematico. Il problema non è nel metodo, ma nei dati e nella loro preparazione. I dati devono essere stazionari, non importa se si tratta di una regressione o di un "processo controllato". I dati economici sono non stazionari nella loro forma originale. Ma possono essere facilmente trasformati in dati stazionari, ad esempio mediante differenziazione e normalizzazione.
  4. Il problema della regressione è che qualsiasi altra serie, anche completamente estranea a quella modellata, può essere inserita in qualsiasi serie modellata, se tali serie di input sono scelte in numero sufficiente. Ad esempio, le fluttuazioni della temperatura dell'aria in Alaska, i dati sull'inquinamento atmosferico a Los Angeles, ecc. possono essere incorporati con successo nei prezzi del forex. L'errore di regressione può essere portato a zero includendo questi "dati estranei". Anche l'accuratezza della previsione sarà pari a zero. Pertanto, è necessario sapere come scegliere i dati giusti, quanto e con quale ritardo.
  5. È utile anche conoscere il meccanismo di funzionamento delle aziende. Ad esempio, a tutti piace citare il tasso di disoccupazione. Lo considerano un barometro dell'economia. Ma in realtà, una volta che il tasso di disoccupazione è salito, è troppo tardi per reagire perché l'economia è già in declino e lo è da molto tempo. Il problema dell'UR è che comprende tutti coloro che hanno più di 16 anni. Ci sono decine di tassi di disoccupazione diversi per segmenti diversi della popolazione e per occupazioni diverse. Ecco una domanda per il backfill: se le aziende vedono un calo della domanda dei loro prodotti, chi licenziano per primo? E una seconda domanda: quali aziende sono le prime a percepire un calo della domanda?

Non ho esposto completamente il mio punto di vista e cercherò di rimediare brevemente qui di seguito, forse ripetendomi.

1. Il problema della selezione dei dati iniziali - predittori - è fondamentale, poco formalizzato e tende più all'arte che alla scienza. Non dimentichiamo uno dei postulati fondamentali della statistica: "Garbage in - rubbish out".

2. Come ho scritto sopra, più della metà del tempo che si impiega nella costruzione di un modello è dedicato alla selezione e alla giustificazione dell'elenco e del tipo di dati iniziali. Inoltre, è l'interpretazione significativa dei dati iniziali, non le loro caratteristiche formali e statistiche, ad essere di primaria importanza. Il matematico è un mezzo ausiliario per la selezione significativa dei dati iniziali.

3. In base alla letteratura, distinguo due tipi di previsioni: una previsione, l'altra predizione.

4. Previsione: prendiamo la storia e la estrapoliamo nel futuro con qualche passo in avanti. Classico: prendiamo il mach e lo estrapoliamo in avanti. Il problema principale è che l'errore si accumula all'aumentare del numero di passi in avanti, poiché il valore successivo si basa su quello precedente.

5. Previsione: si prende l'insieme dei dati di input attuali e si prevede il futuro senza alcuna preistoria. Il valore precedente non viene utilizzato, ad esempio se prevediamo +5, non abbiamo bisogno dei 4 valori precedenti, a differenza della previsione.

5. Oltre ai dati iniziali, è molto importante COSA PREVISIONIAMO. Quando facciamo trading, abbiamo due tipi di ordini (con le opzioni) di acquisto e di vendita. Per qualche motivo prevediamo il valore futuro del prezzo tramite regressioni e concludiamo "acquisto e vendita" da questo valore. Se teniamo conto dell'errore e costruiamo la decisione "acquisto-vendita" tenendo conto dell'intervallo di confidenza, diventa subito chiaro che è impossibile prendere una decisione. Ne consegue che i MODELLI REGRESSIONALI CHE PROGNOSANO LA SIGNIFICANZA - NON SONO RAPPRESENTABILI.

6. Si deve prevedere la direzione del trend, che coincide con gli ordini dei sistemi di trading. Questo viene fatto da modelli di classificazione che sono in grado di prevedere i valori: "long-short" o "long-side-short", o qualcos'altro di qualitativo, ma non quantitativo, come ad esempio: il valore futuro della coppia = 1,3500.

7. Per la costruzione di modelli di classificazione, questo articolo può essere molto utile.

 
gpwr:

L'articolo è interessante. Grazie. Ma è più che altro una guida all'uso della statistica. E contiene molte idee sbagliate.

Bentornato sul sito. ;-) Speriamo per un lungo periodo. Finalmente ci sarà qualcosa di utile e informativo da leggere.
 

Ecco un esempio del mio modello di regressione che prevede l'S&P500. La linea nera è l'indice storico, la linea blu solida orizzontale è la media trimestrale e la linea tratteggiata è la previsione. Le previsioni sono in trimestri. L'accuratezza delle previsioni non è molto elevata, ma è sufficiente per prevedere il carattere dei movimenti: in discesa, in salita, in piano. Il modello prevede che il mercato scenderà nei restanti 3,5 mesi di quest'anno o, nel migliore dei casi, sarà piatto. Utilizzo queste previsioni solo per uscire in tempo dal mercato.

 

Domanda o richiesta all'autore - nel modello ottenuto, andare alla scheda Avanzate nei risultati e fare clic sul pulsante Correlazioni parziali.

Se non è difficile, si prega di pubblicare qui il valore dei coefficienti PC per ciascuno dei fattori del modello.

 
Demi:

Domanda o richiesta all'autore - nel modello ottenuto, andare alla scheda Avanzate nei risultati e fare clic sul pulsante Correlazioni parziali.

Se non è difficile, pubblicate qui il valore dei coefficienti PC per ciascuno dei fattori del modello.

Tutte le operazioni si possono fare da soli, il file con i dati preparati è allegato all'articolo nell'archivio calendar_2010-2011_usd_out. zip .


b*in Cor. parziale Semipartito Cor. Tolleranza R-quadrato t(357) p-valore
variazione del prezzo per 1 giorno 0.3500049 0.3883344 0.3045530 0.7571426 0.2428574 7.9622506 0.0000000
variazione del prezzo per 10 giorni 0.3271369 0.3623699 0.2809839 0.7377407 0.2622593 7.3460567 0.0000000
USD Vendite di case esistenti (mensile) 0.4499016 0.2746573 0.2064353 0.2105391 0.7894609 5.3970552 0.0000001
USD Richieste di mutui MBA -0.1070692 -0.1315908 -0.0959356 0.8028431 0.1971569 -2.5081463 0.0125795
USD Indice dei costi dell'occupazione 1.1924082 0.3459071 0.2664363 0.0499272 0.9500728 6.9657258 0.0000000
USD NAPM-Milwaukee 0.4918679 0.3281278 0.2510388 0.2604862 0.7395138 6.5631723 0.0000000
USD Vendite di case esistenti -0.6131716 -0.3510242 -0.2709271 0.1952275 0.8047725 -7.0831333 0.0000000
Tasso di disoccupazione USD -0.2303595 -0.1174173 -0.0854492 0.1375953 0.8624047 -2.2339883 0.0261025
USD ISM manifatturiero 0.4683029 0.2807841 0.2114298 0.2038349 0.7961651 5.5276311 0.0000001
USD Ordini di beni strumentali Non difesa, escluso il settore aereo -1.0522008 -0.3326872 -0.2549579 0.0587137 0.9412863 -6.6656324 0.0000000
USD Beni durevoli esclusi i trasporti 1.0195595 0.3332286 0.2554246 0.0627625 0.9372375 6.6778344 0.0000000
Indice dei prezzi delle case in USD (QoQ) -0.6493641 -0.3164098 -0.2410558 0.1378030 0.8621970 -6.3021765 0.0000000
USD Manager degli acquisti di Chicago -0.7364752 -0.2854029 -0.2152134 0.0853930 0.9146070 -5.6265502 0.0000000
USD Spesa per consumi personali core (a/a) -0.5430761 -0.2067342 -0.1527068 0.0790670 0.9209330 -3.9923747 0.0000794