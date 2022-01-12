Introduzione

L'analisi fondamentale è ritenuta incomprensibile da molti. Non è chiaro come eseguirlo, quali parametri prendere in considerazione e quali no. Anche scoprire l'impatto dei parametri contabili e il periodo di tempo per cui deve essere considerato non è semplice.

Nel 2011 mi sono imbattuto nell'articolo Multiple Regression Analysis. Strategy Generator e Tester in One e hanno trovato interessante il metodo descritto lì. Ho condotto ricerche sull'applicazione di questo metodo all'analisi fondamentale. Descriverò i risultati in questo articolo.





Che cos'è l'analisi di regressione multipla?

L'analisi di regressione multipla è un metodo per stimare la dipendenza di una variabile da due o più variabili indipendenti.

Le menti non matematiche, probabilmente, non troveranno questa definizione comprensibile. L'esempio seguente illustrerà il significato dell'analisi e come può essere utilizzata.

Immagina un ricercatore che sta per stimare l'efficienza dell'attività fisica regolare quando prende un integratore alimentare. Il ricercatore conduce un esperimento che coinvolge 24 studenti universitari. Gli studenti sono divisi in quattro gruppi di sei persone ciascuno. Il primo gruppo ottiene 100 mg / die di supplemento, il secondo gruppo ottiene 200 mg / die, il terzo ottiene 300 mg / die, e il quarto - 400 mg / die. Questo esperimento coinvolge quattro livelli di assunzione di integratori e tre livelli di attività fisica. Sei persone in ogni gruppo sono divise in tre coppie. Una coppia esercita zero ore a settimana, la seconda coppia si esercita cinque ore a settimana e la terza ha dieci ore di attività fisica a settimana. Alla fine dell'esperimento ogni partecipante ha perso peso. I dati sono stati inseriti nella seguente tabella:

Partecipante all'esperimento Doze di supplemento (mg / giorno) Livello di attività fisica (ore/settimana) Perdita di peso (lb) 1 100 0 -4 2 100 0 0 3 100 5 -7 4 100 5 -6 5 100 10 -2 6 100 10 -14 7 200 0 -5 8 200 0 -2 9 200 5 -5 10 200 5 -8 11 200 10 -9 12 200 10 -9 13 300 0 1 14 300 0 0 15 300 5 -3 16 300 5 -3 17 300 10 -8 18 300 10 -12 19 400 0 -5 20 400 0 -4 21 400 5 -4 22 400 5 -6 23 400 10 -9 24 400 10 -7

Risultato della perdita di peso di ogni partecipante

Di conseguenza, abbiamo due domande:

Cosa ha causato la perdita di peso - integratori o attività fisica? Che tipo di relazione c'è tra il cambiamento di peso e il fattore di influenza?

È molto simile a una situazione comune sui mercati finanziari, non è vero? Ad esempio, quando il prezzo della valuta cambia, c'è sempre una domanda su quale notizia lo abbia influenzato. Se c'è un tale fattore economico che influisce su un prezzo, allora come cambia il prezzo quando il fattore viene variato?

L'analisi regressiva multipla e il programma STATISTICA aiutano a rispondere a queste domande. Trasferisci o importa le tabelle contenenti i dati nel programma e seleziona "Regressione multipla" nel menu:





Fig. 1. Importare i dati dell'esempio nel programma STATISTICA

Dopo aver selezionato questa barra dei menu, trova il pulsante "Variabili" e fai clic su di esso:





Fig. 2. Schermata Dei parametri di analisi multipli

Verrà visualizzata una finestra per la selezione delle variabili utilizzate per l'analisi. Si compone di due parti: sul lato sinistro possiamo selezionare ciò che, crediamo, sia una variabile dipendente (nel nostro caso è la perdita di peso) e sul lato destro, evidenziamo ciò che può influenzare questo cambiamento.





Fig. 3. Assegnazione di variabili dipendenti e indipendenti

Premendo 'OK' ci riporteremo alla finestra di dialogo delle impostazioni precedenti in cui dobbiamo spuntare una casella di controllo e quindi premere 'OK':





Fig. 4. Selezione dei parametri per l'analisi multipla

Nella seguente finestra selezioniamo il metodo 'Tutti gli effetti':





Fig. 5. Seleziona metodo

Dopo tutte le manipolazioni riceveremo una finestra con il risultato dell'analisi. Quei fattori che sono stati statisticamente dimostrati per influenzare il risultato sono in caratteri rossi nell'elenco dei fattori (nel nostro caso è il "Livello di attività fisica"). Altre variabili:

«No. dei casi" è un numero di incidenti per l'analisi;

"p" è il livello di validità statistica di questa correlazione (il livello inferiore a 0,05 è ritenuto affidabile);

"R multipla" è il valore della correlazione multivariabile tra le variabili dipendenti e indipendenti dell'equazione.





Fig. 6. Risultato dell'elaborazione dei dati

Il valore 'Multiple R= 0,71819113' deve essere interpretato come: "R multipla, il valore della correlazione multivariabile tra perdita di peso e fattori che la influenzano, è del 71,82%".

Uno dei due fattori, "Livello di attività fisica", è in testo rosso. È il fattore che ha influenzato la perdita di peso quando l'impatto dell'assunzione del supplemento dietetico è stato insignificante.

Ora dobbiamo solo calcolare come esattamente i fattori hanno influenzato la perdita di peso facendo un'equazione regressiva provvisoria. Per fare ciò, premi il pulsante 'Riepilogo: Risultati della regressione' per la rota di una nuova tabella. Utilizzare i valori della colonna 'b' di questa tabella per creare un'equazione di regressione:





Fig. 7. Variabili dell'equazione di regressione

Abbiamo ottenuto la seguente equazione:

Perdita di peso = 0,00117*[Dose di supplemento] - 0,63750*[Livello di attività fisica] - 2,5625

Inserendo valori nell'equazione (Ctrl+ C в STATISTICA -> Ctrl + V в Excel), possiamo calcolare la variazione di peso se l'assunzione di integratori o l'intensità degli esercizi fisici diventano diversi. Per esempio:

Variazione di peso 1 = 0,00117*100 - 0,6375*0 - 2,5625 = -2,4455. Significa che si può perdere fino a 2,4 libbre quando si assumono 100 mg al giorno e non si fanno esercizi.

Variazione di peso 2 = 0,00117*100 - 0,6375*10 - 2,5625 = -8,8205. Ciò significa che la perdita di peso può essere fino a 8,82 libbre quando si assumono 100 mg del supplemento al giorno e si esercitano 10 ore a settimana.

Spero che questo esempio dia un'idea chiara di ciò per cui l'analisi multipla può essere utilizzata. In realtà, qualcuno potrebbe trovarlo utile per verificare se la loro dieta è efficiente e se hanno bisogno di andare in palestra di più.

Ora applicheremo l'idea dell'esperimento alle valute. Supponiamo che la variabile dipendente sia una variazione di prezzo della coppia EURUSD e le variabili indipendenti siano le statistiche macroeconomiche, ricevute da calendario degli eventi della popolare risorsa Forex Factory.

Simile all'esempio precedente, possiamo identificare i fattori macroeconomici che influenzano i prezzi delle valute attraverso l'analisi multipla. Possiamo anche fare un'equazione che stima quale sarà il valore del prezzo della valuta dopo la pubblicazione delle statistiche macroeconomiche.





Preparazione dei dati e importazione nel programma STATISTICA

Lavorando con il sito Web Forex Factory, ho riscontrato il seguente problema che consiglio vivamente di considerare. Su questa risorsa, gli stessi dati vengono pubblicati in formati diversi. Ad esempio, i numeri possono avere un formato di testo o dati di testo aggiuntivi che rendono difficile la raccolta di dati normalmente. L'analisi del sito Web per raccogliere dati potrebbe non riuscire.

Ho raccolto manualmente i valori di tutti i 99 fattori del calendario delle notizie riguardanti gli Stati Uniti negli ultimi anni

Fig. 8. Indici macroeconomici pubblicati degli Stati Uniti

Ho elaborato tutti i numeri in un formato unificato, eliminato tutti i dati di testo aggiuntivi come "milione" e "miliardo" ecc. E ho portato tutti i dati in una tabella di sette colonne (vedi il file "calendar_usd.zip" allegato all'articolo) e ho aggiunto citazioni per EURUSD del periodo D1.

Intestazioni di colonna:

Data

MeseAnno

Ora

Fuso orario

Valuta

Descrizione

Precedente

L'elenco dei risultati ha più di 6700 voci di dati macroeconomici e quotazioni per EURUSD e non è di alcuna utilità pratica per una semplice analisi manuale. Portare tutti i dati in una tabella in cui sono stati ordinati in colonne separate in modo da tipo e disposti in righe per data richiedeva un gestore aggiuntivo. Abbiamo usato lo script ListConvertToTable per elaborare i dati e convertirlo in una tabella.

Nella finestra di dialogo delle impostazioni dello script è necessario assegnare un nome a un file di input e al documento di destinazione. Il file di input deve essere inizialmente inserito in terminal_data_directory / MQL5 / Files, quello di output viene creato anche lì.

Poiché ci sono molti dati, l'elaborazione dell'elenco delle notizie in una tabella può richiedere molto tempo. Gli avvisi, incorporati nello script, indicheranno a che punto si trova. L'avviso '8' ti farà sapere quando il processo è completo e puoi lavorare sul file. La tabella che verrà sottoposta a un'analisi multipla si trova nel file allegato a questo articolo.

Ho ottenuto il seguente risultato (vedere il file 'calendar_usd_out.zip' nell'allegato):

Fig. 9. Risultato dell'esecuzione dello script ListConvertToTable

Utilizzeremo nuovamente il programma STATISTICA per elaborare i dati. Per caricare un file CSV in STATISTICA, procedi nel seguente modo:

In STATISTICA apri 'File', poi 'Apri', scegli il tipo di file 'File di dati' e apri il tuo file CSV.

Nella finestra Tipo di importazione file di testo lasciare 'Delimitato' e premere 'OK'.

Nella finestra aperta includi gli elementi sottolineati

Nel campo 'Carattere separatore decimale' deve essere posizionato un punto, indipendentemente dal fatto che ce ne sia uno o meno:

Fig. 10. Importazione di una tabella del formato .csv nel programma STATISTICA

Premi 'OK' e riceverai una tabella con i tuoi dati. I dati sono pronti per l'analisi di regressione multipla. Per analizzare l'impatto dei dati sulla successiva variazione di prezzo, è necessario aggiungere i periodi in cui è avvenuta la variazione di prezzo. Ho selezionato la notizia dal 2010 e tre opzioni della variabile dipendente per l'analisi:

Variazione del prezzo della valuta 1 giorno dopo la pubblicazione della notizia;

Variazione del prezzo della valuta 5 giorni dopo la pubblicazione della notizia;

Cambio di prezzo della valuta 10 giorni dopo la pubblicazione della notizia.

Queste colonne possono essere aggiunte manualmente alla tabella CSV prima dell'esportazione nel programma STATISTICA o nella tabella della finestra del programma:





Fig. 11. Tabella dati estesa

I dati sono pronti e gli indicatori che, a nostro avviso, influenzano il tasso di cambio possono essere ottenuti.





Suscitare fattori che hanno un grande impatto sul prezzo della valuta

Avviare l'analisi di regressione ('Statistica'->'Regressione multipla'). Nella finestra visualizzata abilita gli elementi contrassegnati nella scheda "Avanzate". Premere il pulsante 'Variabili'.

Nel primo campo selezionare la variabile dipendente e nel secondo campo selezionare quelle indipendenti. La nostra equazione si baserà sui valori delle variabili selezionate:





Fig. 12. Finestra per la selezione degli indicatori

Utilizzando il pulsante 'Variabili', selezionare i dati da utilizzare per l'analisi:





Fig. 13. Assegnazione di variabili dipendenti e indipendenti

Apparirà una finestra di avviso con il segno "Alcune variabili non hanno varianza" per informare che alcune variabili indipendenti selezionate non possono essere modificate senza dati. Tali colonne devono essere eliminate. Attraverso l'eliminazione troveremo la colonna 49 'USD Federal Open Market Committee Rate Decision', la cancelleremo e riceveremo una tabella pronta per l'analisi (vedi il file "calendar_2010-2011_usd_out.zip" in allegato).

Clicca OK. Nella finestra aperta spuntiamo le caselle di controllo nella scheda "Avanzate":





Fig. 14. Selezionare il metodo Avanti graduale

Completa le opzioni di selezione premendo il pulsante 'ОK'. Nella finestra successiva scegliere il metodo 'Avanti graduale' per abilitare la selezione automatica dei dati e quindi premere nuovamente 'ОK':





Fig. 15. Selezionare il metodo Avanti graduale

Ci siamo quasi. Quando viene visualizzato un messaggio in una nuova finestra che informa che l'analisi di regressione ha avuto esito positivo, premere il pulsante "Riepilogo: Risultati della regressione».

La selezione automatica degli indicatori seleziona quelli che danno il maggior contributo alla correlazione multivariabile tra variabili indipendenti e quella dipendente. Nel nostro caso è un insieme di indicatori che ha il maggiore impatto sul prezzo. La selezione automatica, in sostanza, ha il ruolo di generatore di strategie. L'equazione generata includerà solo quegli indicatori che descrivono il comportamento del prezzo nel modo più affidabile.

Devo tuttavia ricordare che le regole per includere gli indicatori nell'analisi utilizzata in STATISTICA non sono sempre ottimali. Ad esempio, l'equazione di regressione può includere molti indicatori non affidabili (carattere nero nella tabella dei risultati). Se l'elenco include indicatori non affidabili, tornare alla fase di selezione degli indicatori e rimuovere quelli non affidabili dal lotto, destinati all'analisi.

Per restituire premere 'Annulla' nella finestra del risultato dell'analisi e ripetere l'analisi. Cerca di escludere tutti gli indicatori non affidabili in questo modo. Allo stesso tempo, tieni presente che il valore ottenuto della correlazione multivariabile (Multiple R) non dovrebbe essere significativamente inferiore a quello iniziale. È possibile rimuovere tutti gli indicatori non affidabili dall'analisi uno per uno o eseguirli tutti insieme. Il primo metodo è preferibile però.

Alla fine, solo gli indicatori affidabili che influenzano la fluttuazione dei prezzi sono destinati a rimanere nella tabella. Nelle tabelle, le variabili che sono state trovate per influenzare i prezzi sono state evidenziate in rosso e le variabili con effetto zero sono in nero.

Al termine dell'analisi, alcuni indicatori sono stati scoperti per avere un impatto sul prezzo della valuta dopo la loro pubblicazione. Un insieme di indicatori era diverso per ogni periodo. Scegliendo "variazione di prezzo in 1 giorno" (cioè analizziamo il comportamento del prezzo in un giorno dopo la pubblicazione dell'indicatore) come variabile indipendente nella finestra laterale sinistra, riceveremo quanto segue:





Fig. 16. Variabile indipendente 'variazione di prezzo in 1 giorno'

Ritorna facendo clic su "Annulla" e quindi seleziona "Variabili" per tornare agli elenchi di variabili tra cui scegliere. A poco a poco rimuoviamo le voci in nero dall'elenco delle variabili indipendenti e lasciamo solo quelle in rosso. Le restanti voci conterranno le notizie che riguardano i prezzi nel giorno successivo.

Si prega di notare che le voci nella tabella differiscono per colore. Le variabili indipendenti che hanno un impatto significativo su quella dipendente sono in rosso. Nella figura sottostante tutte le voci sono in rosso, cioè gli errori nei risultati dell'equazione dopo l'inserimento dei dati saranno inferiori rispetto al primo caso. L'impatto può essere valutato dal valore dei coefficienti dell'ultima colonna 'p-value' (più piccolo è il valore, meglio è). Le variabili che hanno impatto zero sul prezzo possono essere rimosse in base ai coefficienti.

Scegliendo "variazione di prezzo in 5 giorni" e ordinando notizie significative rimuovendo gradualmente le voci irrilevanti, riceveremo il seguente risultato:





Fig. 17. Variabile indipendente 'variazione di prezzo in 5 giorni'

Quando, infine, selezioniamo "variazione di prezzo in 10 giorni" come variabile indipendente, otterremo:





Fig. 18. Variabile indipendente 'variazione di prezzo in 5 giorni'

Quando selezioniamo come variabile indipendente la variazione di prezzo in un giorno dopo la pubblicazione dei dati dell'indicatore, possiamo vedere che nel periodo dal 2010 fino alla metà del 2011 i prezzi sono stati influenzati principalmente dai dati sulla sfera dello sviluppo immobiliare e degli indici, pubblicati dal Richmond Institute.

Nel periodo di 5 giorni dopo la pubblicazione dei dati, gli indici delle industrie di produzione e non di produzione, il costo del lavoro e i dati sulla disoccupazione vengono aggiunti ai dati sull'industria dello sviluppo.

Quando consideriamo 10 giorni, la ripartizione degli indici influenti cambia. Gli indici delle industrie di produzione e non di produzione, le applicazioni per lo sviluppo delle case, il livello di disoccupazione e i prezzi dell'energia vengono alla ribalta.

Pertanto, i fattori, che influenzano il prezzo della coppia EURUSD, sono molto simili ai dati macroeconomici dell'analisi fondamentale, la cui importanza è sottolineata in quasi tutti i libri di testo. Come possiamo vedere, è stato dimostrato dalla matematica e dalla statistica.





Equazione di regressione e previsione risultante

Non è sufficiente conoscere i fattori che influenzano il prezzo, è importante essere in grado di stimare come potrebbero cambiare i prezzi alla pubblicazione dell'indice. Per questo faremo un'equazione di regressione come nell'esempio all'inizio di questo articolo.

Faremo un'equazione di regressione basata sui dati raccolti dalla tabella della fig. 17 "variazione dei prezzi in 5 giorni". Per questo useremo le variabili della colonna con l'intestazione 'b'. La prima riga è una costante numerica, ricevuta alla fine dell'analisi. Il suo calcolo sarà considerato nei seguenti articoli.

Facciamo un'equazione di regressione basata su questi coefficienti:

R=-0.0761294138334434+0.355142961984956*[[variazione di prezzo in 1 giorno]+0.319936701020232*[variazione di prezzo in 10 giorni]+0.455193706894553*[USD Vendite di case esistenti (MoM)]-0.146961978306227*[USD MBA Mortgage Applications] + ...,

dove usiamo i valori della colonna "b" come coefficienti e i dati macroeconomici pubblicati come moltiplicatori delle parentesi quadre.

Inserendo i valori degli indici macroeconomici, pubblicati sul sito web di origine, in questa equazione, riceveremo un numero R, maggiore o minore di zero. Se il risultato dell'inserimento di nuovi dati è maggiore di zero, significa che i prezzi aumenteranno entro il periodo selezionato per l'analisi. Il valore di R mostrerà la crescita dei prezzi. R negativo significa che i prezzi possono scendere. Il valore della R in questo caso mostrerà la caduta del prezzo.

Inserisci i valori nella formula sopra e considera il risultato basato sull'esempio di EURUSD. Useremo i dati della voce per il 04.08.2010 come esempio per inserire i coefficienti nell'equazione:



b valore [b]х[value] Intercettare -0.0761 1.00000 -0.0761 variazione di prezzo in 1 giorno 0.3551 -0.0070 -0.0025 variazione di prezzo in 10 giorni 0.3199 0.0244 0.0078 Vendite di Abitazioni Esistenti 0.4552 -0.022 -0.0100 Applicazioni ipotecarie MBA in USD -0.1470 -0.044 0.0065 Indice dei Costi di Occupazione 144.0041 0.006 0.8640 DOLLARO NAPM-Milwaukee 0.0106 59 0.6278 Vendite di Abitazioni Esistenti 0.0000 5660000 -0.6596 Tasso di Disoccupazione -6.7866 0.099 -0.6719 USD ISM Manifatturiero 0.0197 56.2 1.1052 Usd Capital Goods Orders Non difesa Escluso Air -2.8934 0.048 -0.1389 USD Durevoli Ex Trasporto 4.9290 0.012 0.0591 Indice di acquisto dei prezzi delle case in USD (QoQ) -5.9295 -0.018 0.1067 Responsabile acquisti USD Chicago -0.0160 59.1 -0.9433 USD Consumo personale Spesa Core (YoY) -19.8579 0.015 -0.2979





-0.0230

R=-0,0230, quindi una trend al ribasso è proseguita per i cinque giorni successivi a partire dal 04.08.2010 e il prezzo è sceso a -230 punti. Diamo un'occhiata al grafico della coppia EURUSD per questo periodo:

Fig. 19. EURUSD agosto 2010

Come possiamo vedere dal grafico, la previsione era accurata e il prezzo è sceso da 1,3154 a 1,2844 in cinque giorni di negoziazione (chiusura l'11 agosto), cioè -310 punti. La previsione per il calo dei prezzi basata sul risultato dell'equazione di regressione è stata dimostrata. Allo stesso modo, altre date possono essere inserite.





Conclusione

Un modo di analizzare i dati sugli indicatori macroeconomici considerati in questo articolo, consente di semplificare e automatizzare l'analisi fondamentale in modo che anche un principiante possa gestire una grande quantità di statistiche economiche.

Inoltre, un tale approccio all'analisi fondamentale offre l'opportunità di reagire istantaneamente e regolare le offerte in base alle notizie.

Si prega di essere consapevoli del fatto che la previsione non deve essere considerata come una garanzia assoluta che il prezzo della valuta cambierà nella direzione prevista. Il risultato della previsione è probabilistico e dipende da molti fattori. Inoltre, l'equazione di regressione deve essere ricalcolata quando escono nuovi dati.

Buona fortuna con le tue previsioni!