Previsione di mercato basata su indicatori macroeconomici - pagina 2

 
Un soggetto interessante per la ricerca. Riflettendo su questo argomento sono giunto alla conclusione sulla necessità di analizzare i dati macroeconomici in modo dinamico - secondo me non è sufficiente dire che le richieste di disoccupazione sono aumentate, poiché questo può essere dovuto a fluttuazioni stagionali ed è di natura a breve termine - il mercato può reagire o meno e ancora a seconda della tendenza che prevale nel mercato. Quindi forse provare a indagare la forza degli indicatori in termini di capacità di invertire una tendenza? Per esempio prendere uno zigzag, o identificare i punti di inversione di tendenza e correzione sul grafico e cercare un'inversione di indicatori macroeconomici entro tre giorni prima della rottura, e raccogliendo un gruppo di tali indicatori per analizzare ciò che questi indicatori mostrano e poi cercare i modelli. Non tutti gli indicatori saranno la ragione dell'inversione del mercato - il potenziale, la tendenza del mercato e l'indicatore per i periodi passati sono importanti, così come la totalità degli altri indicatori economici.
 
-Aleks-:
Questo è un oggetto interessante da studiare. Pensando a questo argomento sono arrivato alla conclusione sulla necessità di analizzare i dati macroeconomici nel tempo - secondo me non è sufficiente dire che le richieste di lavoro senza lavoro sono aumentate, perché questo può essere dovuto a fluttuazioni stagionali ed è a breve termine - il mercato può reagire o meno e ancora a seconda della tendenza che prevale nel mercato. Quindi forse provare a indagare la forza degli indicatori in termini di capacità di invertire una tendenza? Per esempio prendere uno zigzag, o identificare i punti di inversione di tendenza e correzione sul grafico e cercare un'inversione di indicatori macroeconomici entro tre giorni prima della rottura, e raccogliendo un gruppo di tali indicatori per analizzare ciò che questi indicatori mostrano e poi cercare i modelli. Non ogni indicatore sarà la ragione dell'inversione del mercato - il potenziale, la tendenza del mercato e l'indicatore per i periodi passati sono importanti, così come la totalità degli altri indicatori economici.

Questa è un'idea molto interessante. Cioè, concentrarsi solo sulle rotture di tendenza e identificare gli indicatori chiave che influenzano queste rotture.

Ho pensato molto agli outlier. Bisogna ignorarli, o viceversa, bisogna prestare loro più attenzione. La teoria classica della regressione insegna a ignorarli. Ma a volte mi sembra che le piccole fluttuazioni di prezzo intorno a una tendenza siano un rumore, mentre la regressione classica dà loro la massima importanza. Le svolte ripide nelle tendenze (outlier) sono probabilmente un segnale più importante. Ma tutti i miei tentativi di costruire un modello facendo più attenzione agli outlier (per esempio scegliendo u>1) hanno portato a un più alto errore quadratico medio di previsione. Lo smussamento degli outlier ha portato a un errore di predizione inferiore.

 
faa1947:

Quindi, dovete guardare manualmente l'intera lista di variabili di input e decidere intuitivamente, o sulla base di qualche altra considerazione, che "questa variabile di input è probabile che influenzi e questa probabilmente no".

...Selezionato manualmente qualche lista, poi filtrato da un algoritmo e ottenuto la lista. E il valore di una tale lista è fondamentale: i modelli che utilizzano un tale insieme di input "influenti" (utilizzando 3 diversi tipi di modelli) NON hanno la proprietà di sovraapprendimento, che è l'agguato principale. L'overfitting è la principale conseguenza dell'utilizzo di dati di input "rumorosi".


La trama della storia in-sample è stata campionata e testata nella trama out-of-sample? Se si campionano i predittori su tutta la trama e poi si calcola l'errore fuori campione su una parte della stessa trama, questo è guardare al futuro.
 
gpwr:
Avete campionato una parte di storia in-sample e testato una parte out-of-sample? Se si selezionano i predittori in tutta la trama e poi si calcola l'errore fuori campione in una parte della stessa trama, questo è guardare nel futuro.

Ancora più difficile.

Seguendo il thread con grande interesse.

Dato il post di-Aleks-, non è chiaro cosa vuoi prevedere: direzione o grandezza? Se "direzione", allora si tratta di modelli di classificazione, e se "grandezza", allora si tratta di modelli di regressione, e hanno problemi con diversi ARIMA e ARCH. Il detrending con differenziazione non risolve completamente il problema, a tutti in macroeconomia la stagionalità è confusa....

L'idea di-Aleks- per la selezione dei predittori è molto interessante. In generale, nella prima fase farei due passi preliminari:

1. selezionare per-Aleks- qualche insieme abbastanza grande di variabili indipendenti.

2. Costruito una regressione e scartato tutte le variabili che hanno coefficienti insignificanti.

L'ultimo passo non è davvero facile. Tutto è come ho scritto, a condizione che non ci sia una correlazione tra le variabili indipendenti. E c'è sempre una correlazione superiore a 0,7 e la lista dei predittori scartati dipende dall'ordine in cui viene fatta.

Dopo di che si può guardare e decidere cosa fare dopo.

 
avtomat:

Il requisito di stazionarietà è molto rigido e completamente ingiustificato.

.

E i modelli "non stazionari" funzionano bene ;)

gpwr:
Si può dire così di qualsiasi modello, non solo di regressione, ma anche di modelli neurali, ARMA e altri. Se non c'è relazione tra input e output, allora qualsiasi modello genererà una previsione, solo imprecisa.
Qualche consiglio su dove iniziare per capire la stazionarietà, ARMA, modelli neurali. Era da molto tempo che volevo esplorare questa direzione. Un sacco di fonti ed è difficile capire tutto da zero.
 
faa1947:

Una grande o piccola quantità di dati in ingresso è tutto relativo.

Per come la vedo io, devi controllare i dati uno per uno, identificare quelli rilevanti e poi usarli nel tuo EA. Solo se si inizia a ottimizzare i valori dei dati sono possibili dei colpi casuali. Quindi, probabilmente, l'intervallo di enumerazione nell'ottimizzazione dovrebbe essere affrontato con molta attenzione.
 
gpwr:

Questa è un'idea molto interessante. Cioè, concentrarsi solo sulle rotture di tendenza e identificare gli indicatori chiave che influenzano queste rotture.

Ho pensato molto agli outlier. Bisogna ignorarli, o viceversa, bisogna prestare loro più attenzione. La teoria classica della regressione insegna a ignorarli. Ma a volte mi sembra che le piccole fluttuazioni di prezzo intorno a una tendenza siano un rumore, mentre la regressione classica dà loro la massima importanza. Le svolte ripide nelle tendenze (outlier) sono probabilmente un segnale più importante. Ma tutti i miei tentativi di costruire un modello facendo più attenzione agli outlier (per esempio scegliendo u>1) hanno portato a un più alto errore quadratico medio di previsione. Lo smussamento degli outlier ha portato a un errore di predizione inferiore.

Elaborando l'idea, dovremmo dividere i diversi indicatori in base alla frequenza del loro rilascio - probabilmente più raro è il rilascio dell'indicatore, più a lungo ha un impatto sul mercato - questo deve essere testato. Personalmente, trovo più facile percepire le informazioni visivamente e nella dinamica del cambiamento nel tempo - è necessario trasferire gli indicatori per comodità a MT sotto forma di grafico (il mio sogno), ma questi indicatori dovrebbero essere sincronizzati - diciamo che le notizie vengono rilasciate una volta al mese, allora che dire dei timeframes inferiori? Come opzione - riempiteli con barre da un indicatore all'altro secondo una funzione lineare - in questo modo vedremo chiaramente il vettore di movimento in MT. Conoscendo il vettore, possiamo analizzare il vettore di movimento e il suo cambiamento - il tempo della rottura rispetto alla rottura del vettore del prezzo del simbolo dallo zig-zag.
Così, possiamo considerare il ritardo - e calcolare la deviazione percentuale dalla rottura del prezzo quando l'indicatore economico esce. Ci sono ancora alcune idee, ma l'ovvietà del loro uso può essere compresa sul posto.
In generale, molti dati economici sono relativi al mese o all'anno precedente, il che dovrebbe essere preso in considerazione anche nella visualizzazione grafica...
Un'altra idea - probabilmente non sono i dati stessi che influenzano il cambiamento di tendenza, ma la sua deviazione dai dati attesi o dalla dinamica passata - qui si può anche controllare - confrontando la dinamica passata del movimento dell'indice con il suo cambiamento (forte cambiamento lungo il vettore o contro - almeno usando SMA) e guardare il cambiamento del vettore di movimento del prezzo con un ritardo.
Non sono sicuro che tutto questo lavoro possa essere fatto da una sola persona - c'è bisogno di un piano d'azione chiaro e di una metodologia di analisi dei risultati intermedi - potrebbe essere il lavoro di una vita, che risponderà alla domanda come è stata influenzata la performance economica passata del mercato... Tuttavia, la metodologia sviluppata vi permetterà di cercare dei modelli nei movimenti attuali del mercato.
 
-Aleks-:
Elaborando l'idea, dovremmo dividere i diversi indicatori in base alla frequenza del loro rilascio - probabilmente più raro è l'indicatore che esce, più a lungo ha un impatto sul mercato

No. Quelli più influenti per gli Stati Uniti sono itassi percentuali dell' UR e dellariunione del FOMC. Sono mensili.

Se i dati sulla disoccupazione sono formalizzati, allora i verbali delle riunioni della Fed numericamente non possono essere formalizzati affatto.

Altrimenti sarebbe come due dita...

 

Per questo numero di variabili, 65 osservazioni sono molto poche.

Almeno i*10 osservazioni + 15-20% per un test in avanti.

 
Demi:

No. Quelli più influenti per gli Stati Uniti sono itassi percentuali dell' UR e dellariunione del FOMC. Sono mensili.

Se i dati sulla disoccupazione sono formalizzati, allora i verbali delle riunioni della Fed numericamente non possono essere formalizzati affatto.

Altrimenti sarebbe come due dita...

Questi verbali contengono dati economici, capisco che possono essere ottenuti. In caso contrario, dovete stimare questi incontri in tre modi - +1/-1/0 - le informazioni per la stima possono essere prese dai media come opzione.