Previsione di mercato basata su indicatori macroeconomici - pagina 50

 
Дмитрий:

È così difficile dirlo a occhio in questa scala.

Una volta giravo un modello multifattoriale, ma l'accuratezza del modello era inferiore alle previsioni disponibili al pubblico

Prendete solo un indicatore come HOUST1F o PRFI e già il vostro modello è più accurato delle previsioni pubblicamente disponibili. Aggiungete un paio di indicatori di consumo e la curva dei rendimenti e avrete un super modello.

Qui sotto c'è un grafico della crescita del PIL e dello S&P500 dal 1959. Non si può negare che l'S&P500 è sceso durante la crescita negativa del PIL (recessioni):

 

Anch'io ho molti "super modelli". Solo il test in avanti, per qualche motivo, mostra un'accuratezza di previsione peggiore rispetto alle previsioni pubblicate

 
Vladimir:

Prendete solo un indicatore come HOUST1F o PRFI e già il vostro modello sarà più accurato delle previsioni pubblicamente disponibili. Aggiungete un paio di indicatori di consumo e la curva dei rendimenti e avrete un super modello.

Qui sotto c'è un grafico della crescita del PIL e dello S&P500 dal 1959. Non si può negare che l'S&P500 è sceso durante la crescita negativa del PIL (recessioni):


In qualche modo stai rispondendo selettivamente ai miei post.

Naturalmente, il grafico qui sopra è come un tram. Il tram corre - e tutti i passeggeri vanno, stop.... E la connessione tra i passeggeri è una - sono sullo stesso tram - nel nostro caso la stessa economia

L'indice e il PIL sono derivati dalla situazione economica del paese e non c'è alcuna connessione tra loro.

La crisi del 2008 è stata una crisi immobiliare e i numeri del PIL e degli indici e molti altri numeri sono derivati da quella crisi. E l'indice non segue il PIL e l'indice non segue il PIL - sono nel migliore dei casi (e non sempre - si può vedere nel grafico che hai portato prima) e mostrano lo stesso quadro.

Ci sono processi nell'economia che determinano il suo movimento futuro e una serie di indicatori rifletteranno questo movimento.

Quali sono i movimenti di fondo dell'economia statunitense oggi?

Personalmente, mi unisco a quelle persone che credono che il problema principale dell'economia statunitense sia il tasso zero. L'intero settore sociale (assicurazioni e fondi pensione) ha tratto profitto dagli investimenti in titoli di stato. A tasso zero, queste organizzazioni non realizzano i profitti di cui hanno bisogno. Se iniziano a far fallire questo tipo di organizzazioni, sarà un altro livello di problemi, non sono dotcom. A proposito, il PIL e tutti gli indici andranno nella stessa direzione - verso il basso, verticalmente

 
СанСаныч Фоменко:

L'indice e il PIL sono derivati dalla situazione economica del paese e non c'è alcuna connessione tra loro.

La crisi del 2008 è una crisi immobiliare e le cifre del PIL e degli indici e molte altre cifre del tram sono derivate da quella crisi. E l'indice non segue il PIL e l'indice non segue il PIL - sono nel migliore dei casi (e non sempre - si può vedere nel grafico che hai portato prima) e mostrano lo stesso quadro.

Ci sono processi nell'economia che determinano il suo movimento futuro e una serie di indicatori rifletteranno questo movimento.

Quali sono i movimenti di fondo dell'economia statunitense oggi?

Personalmente, mi unisco a quelle persone che credono che il problema principale dell'economia statunitense sia il tasso zero. L'intero settore sociale (assicurazioni e fondi pensione) ha tratto profitto dagli investimenti in titoli di stato. A tasso zero, queste organizzazioni non realizzano i profitti di cui hanno bisogno. Se iniziano a far fallire questo tipo di organizzazioni, sarà un altro livello di problemi, non sono dotcom. A proposito, il PIL e tutti gli indici andranno nella stessa direzione, verso il basso, verticalmente.

Sono d'accordo con tutto ciò che è stato detto. Ho cercato di trovare dove ho detto che l'indice di mercato stava scendendo a causa di un calo del PIL e non l'ho trovato. Entrambe le cadute riflettono lo stato dell'economia, come lei ha giustamente detto. Una caduta dell'indice di mercato è difficile da prevedere, una caduta del PIL è molto più facile da prevedere. Poiché i cali dell'indice e del PIL si verificano in sincronia (l'hai scritto tu stesso, anche se dalle mie osservazioni l'indice inizia a scendere 1 trimestre prima del PIL), si può prevedere un calo dell'indice prevedendo un calo del PIL, che è quello che sto facendo qui. Le case iniziano a cadere molto prima del mercato e del PIL. Quindi, come ultima risorsa, se non riesco a creare un buon modello di S&P500 e del PIL, mi limiterò a osservare HOUST e i prezzi delle case e a uscire dal mercato quando scendono. Finora non è stata osservata una cosa del genere. Quando HOUST raggiungerà 1,6-1,7M, guarderò attentamente. Quando HOUST scende sotto 1,2-1,3M, le recessioni passate sono legittimamente iniziate.

https://research.stlouisfed.org/fred2/series/HOUST

Su quello che è il problema dell'economia oggi, penso che il debito privato continui ad avere un grande problema. Le banche continuano a prestare a persone che non possono ripagare. Negli Stati Uniti, le banche impazziscono e fanno sconti sugli acquisti con le carte di credito. Ogni negozio di marca ha una carta di credito: Walmart, Target, Macy's, Starbuks, e centinaia di altri. In Cina il debito privato rispetto al PIL ha raggiunto livelli ancora più alti che negli USA prima della recessione. Forse la Cina sarà la causa della prossima recessione, dopo tutto.

 
Vladimir:

Per quanto riguarda il problema dell'economia oggi, penso che il debito privato continui ad essere un grande problema. Le banche continuano a prestare a persone che non possono ripagare. Negli Stati Uniti, le banche impazziscono e fanno sconti sugli acquisti con le carte di credito. Ogni negozio di marca ha una carta di credito: Walmart, Target, Macy's, Starbuks, e centinaia di altri. In Cina il debito privato rispetto al PIL ha raggiunto livelli ancora più alti che negli Stati Uniti prima della recessione. Forse la Cina sarà la causa della prossima recessione, dopo tutto.

Il PIL della Cina è menzionato nel thread "interessante e umoristico" di ieri. Secondo la "Teoria generale del tutto" la crescita del PIL della Cina è proporzionale per 2/3 al tempo (t-t0).


 

Cominciamo ad esaminare i predittori passo dopo passo. Per prima cosa, trasformiamo tutti i dati come descritto sopra, normalizzando gli incrementi assoluti della loro media. Poi, eseguite l'intera storia e vedete gli errori di previsione del PIL trasformato usando la regressione lineare. Ecco una lista dei primi 10 predittori ordinati per errore di predizione crescente:

Serie Ritardo 'Errore' 'Corr Coeff'. 'Informazioni reciproche' Descrizione
'A012RC1Q027SBEA' 1 0.785084491 0.521239874 0.207278508 'Investimenti fissi privati: Residenziale: Strutture'
PRFI'. 1 0.785370338 0.52030199 0.205244075 'Investimenti fissi residenziali privati'
'A756RC1Q027SBEA' 1 0.788998988 0.513150108 0.203337794 Investimenti fissi privati in nuove strutture: strutture residenziali
'DFDHRA3Q086SBEA' 1 0.792817832 0.509246158 0.238935402 Spesa per consumi personali reali: beni durevoli: arredamento e attrezzature durevoli per la casa (indice di quantità a catena)".
'W988RC1Q027SBEA' 1 0.792819625 0.512427741 0.209527444 Investimenti interni privati lordi: famiglie e istituzioni
'A713RX1Q020SBEA'. 1 0.79292839 0.511152419 0.227008161 Vendite finali reali ad acquirenti nazionali
'B713RA3Q086SBEA' 1 0.792933677 0.511052828 0.227015597 Vendite finali reali ad acquirenti nazionali (indice di quantità a catena)
'W791RC1Q027SBEA' 1 0.795610445 0.509720881 0.220612324 'Investimenti interni netti: privati: famiglie e istituzioni'
'A943RC1Q027SBEA' 1 0.799721554 0.493581939 0.198662644 Investimenti fissi privati: Residenziale: Strutture: Sito permanente
A011RE1Q156NBEA 1 0.802124995 0.476308607 0.198071775 'Quote del prodotto interno lordo: Investimenti interni privati lordi: Investimenti fissi: Residenziale'

Come possiamo vedere, ci sono molti predittori dal tema degli investimenti, specialmente nel settore immobiliare e delle attrezzature domestiche. I predittori con l'errore di predizione più basso hanno anche i più alti coefficienti di correlazione con il PIL e un'alta informazione reciproca. Sia A012RC1Q027SBEA che PRFI sono adatti come primo predittore del modello. Per esempio, vediamo un grafico della dipendenza del PIL trasformato da PRFI(1):

Il colore dei punti cambia dolcemente lungo lo spettro secondo il tempo, cioè per esempio i punti blu appartengono allo stesso intervallo di tempo. Come si può vedere dal grafico, non c'è un cambiamento particolare nella dipendenza del PIL dal PRFI nel tempo. La dipendenza lineare non è peggiore di quella non lineare in questo caso, ed è preferibile per la sua semplicità. A proposito, possiamo discutere se le reti neurali non lineari danno qualche vantaggio nei modelli finanziari quando i dati di input sono così rumorosi.

Ora guardiamo le previsioni del PIL passate e future basate sul PRFI(1):

Abbastanza bene, e con un solo predittore, meglio delle previsioni della banca. Non c'è uno sguardo al futuro in queste previsioni, poiché in ogni punto passato della storia sono stati usati i dati del PIL e del PRFI disponibili fino a quel momento. L'unica intuizione lungimirante esiste nella scelta del predittore stesso (il PRFI è stato scelto nel corso della storia).

 

Andiamo avanti. La scelta del secondo predittore non è così semplice. Uso una specie di regressione graduale. L'idea è che dopo aver trovato il primo predittore e il modello del PIL sulla sua base, sottraggo il suo modello dal PIL. Il residuo risultante diventa una nuova serie modellata per la quale trovo il secondo predittore e così via. Chi ha familiarità con la matematica sa che tutti i predittori selezionati in questo modo dovrebbero essere ortogonali (correlazione zero tra i predittori), il che non è il caso della maggior parte degli indicatori economici. Ci sono alcune soluzioni per questo, di cui parleremo più avanti.

Quindi abbiamo un residuo (PIL meno il modello basato sul primo predittore). Cominciamo ad esaminare tutti i predittori disponibili e calcoliamo il loro errore nel predire il residuo così come la loro correlazione e mutua informazione con il residuo. Otteniamo la seguente tabella (solo i primi 11 predittori sono mostrati)

'Ritardo'. 'Errore' 'Corr Coeff'. 'Informazione reciproca'.
pred2 3 0.726557236 0.284915131 0.127184886
pred3 3 0.726787378 0.315902493 0.130087104
pred4 2 0.727334208 0.277286708 0.128992973
pred5 1 0.728784473 0.308420433 0.129030595
pred6 3 0.729279452 0.292608987 0.134332245
pred7 3 0.729297628 0.283750358 0.125613004
pred8 1 0.732298245 0.314324885 0.152677285
pred9 1 0.732362897 0.301421196 0.134899474
pred10 1 0.732917749 0.290449918 0.126357606
pred11 1 0.7342473 0.307902294 0.16423315
pred12 2 0.734315072 0.327789051 0.165246136

In questo caso l'errore di predizione è l'errore combinato del primo predittore e di ciascuno dei predittori in questa tabella. La scelta del secondo predittore deve essere fatta con cautela in questo caso. Anche se il pred2 ci darà l'errore più basso se combinato con il primo predittore (PRFI o pred1), il coefficiente di correlazione e l'informazione reciproca di questo predittore non sono così alti. Pred12 sembra più promettente, quindi lo sceglierò. Il grafico della dipendenza del residuo da pred12:

La nuvola è diventata più confusa. Previsioni basate su pred1 e pred12:

 
Vladimir:

Non c'è nessuna sbirciata nel futuro in queste previsioni, poiché i dati del PIL e del PRFI disponibili fino a quel momento sono stati usati in ogni punto passato della storia. L'unico sguardo al futuro esiste nella scelta del predittore stesso (il PRFI è stato scelto nel corso della storia).

Uno sguardo al futuro. Peccato che sia una sbirciata nel futuro.

Quando si ha un insieme MOLTO grande di variabili di input, si può sempre scegliere quella che sarà la più adatta per l'intervallo scelto della variabile predetta, ma non il fatto che la relazione funzionale tra il fattore e la funzione precedente esista.

Cioè, la variabile "Numero di pazienti ricoverati negli ospedali in Angola con intossicazione alimentare" può anche andare bene per il segmento selezionato del PIL statunitense proiettato, ma ovviamente non c'è alcuna relazione funzionale.

Ancora una volta, solo l'attaccante è decisivo, senza sbirciatine (anche nella selezione variabile).

La trappola di un gran numero di variabili.

 
Дмитрий:

Cioè, la variabile "Numero di pazienti ricoverati negli ospedali in Angola con intossicazione alimentare" può adattarsi perfettamente al grafico selezionato del PIL statunitense proiettato, ma ovviamente non c'è alcuna relazione funzionale.

Ho incontrato spesso problemi simili durante l'ottimizzazione degli esperti. Per esempio, è possibile ottimizzare un Expert Advisor per 10 anni di storia, ottenere il miglior risultato, e poi non ottenere nulla da tali impostazioni. Il problema è che l'Expert Advisor ha ristagnato per 9 anni utilizzando le impostazioni trovate ed è uscito al top solo nel giro di una settimana quando le impostazioni sono state accidentalmente abbinate e hanno portato ad un profitto. È improbabile che un tale incidente accada in futuro. Una buona soluzione è quella di dividere l'intera storia di trading per anni, calcolare il profitto per ogni anno separatamente, e prendere il peggior risultato annuale.

Per trovare la migliore correlazione userei la seguente funzione di errore: MAX(errore(2000-2016), errore(2000), errore(2001), ..., errore(2014), errore(2015)). Non garantisco nulla, non ho provato questo approccio per le statistiche.

 
Дмитрий:

Uno sguardo al futuro. Peccato che sia una sbirciata nel futuro.

Quando si ha un insieme MOLTO grande di variabili d'ingresso, si può sempre scegliere quella che si adatta meglio all'intervallo scelto di variabile predetta, ma non si può dire che la relazione funzionale tra il fattore e la funzione prevista esista.

Cioè, la variabile "Numero di pazienti ricoverati negli ospedali in Angola con intossicazione alimentare" può anche andare bene per il segmento selezionato del PIL USA proiettato, ma ovviamente non c'è alcuna relazione funzionale.

Ancora una volta, solo l'attaccante è decisivo, senza sbirciatine (anche nella selezione variabile).

La trappola di un gran numero di variabili.

Sono d'accordo, ho anche scritto io stesso una cosa del genere da qualche parte qui. Scegliere un predittore su tutta la storia e poi usare un test in avanti dalla stessa storia è un auto-inganno che fanno tutti, dai commercianti agli opinionisti. Molti articoli scritti sulla previsione dell'economia iniziano con una lista di predittori selezionati e poi riportano "grandi" risultati. I trader scelgono strategie basate ad esempio sul rimbalzo o sul breakout perché "ha funzionato in passato" e sperano che funzioni in futuro e mostrano i test in avanti del passato senza rendersi conto che la loro scelta della strategia stessa era basata sullo studio di TUTTA la storia, compresa la storia per i test in avanti. Per me, la prova in avanti del mio modello di PIL e di mercato sarà il futuro, così ho aperto questo thread - postare le previsioni, vedere come si sono avverate in tempo reale. Il lavoro non è finito. Ci sono molte idee per la trasformazione non lineare dei dati. Per esempio, alcuni predittori come HOUST influenzano la crescita del PIL attraverso una funzione di soglia.
Motivazione: