Econometria: previsione a un passo avanti - pagina 116

 
faa1947:

Io stesso non lo capisco.

Modello rotto: zz_high eurusd(-1 a -100) c @trend

Sto prevedendo una variabile dipendente che prende i valori di "0" - nessun segnale e "1" - un segnale di inversione al ribasso. Prendiamo 100 barre EURUSD come variabile dipendente, cioè un valore casuale. Dopo aver stimato il coefficiente di regressione otteniamo:

ZZ_HIGH = 1-@CNORM(-(1033.56764818*EURUSD(-1) + 361.005725087*EURUSD(-2) - 659.271726689*EURUSD(-3) + 1289.20797453*EURUSD(-4) - 1024.9175822*EURUSD(-5) - 173.354947231*EURUSD(-6) - 500.755211559*EURUSD(-7) + 487.538133239*EURUSD(-8) - 1741.90012073*EURUSD(-9) + 1250.27027863*EURUSD(-10) + 1204.01840496*EURUSD(-11) - 625.209628018*EURUSD(-12) - 88.4193896778*EURUSD(-13) - 821.374855285*EURUSD(-14) - 754.491291165*EURUSD(-15) + 538.519551372*EURUSD(-16) + 3220.86311608*EURUSD(-17) - 518.070207767*EURUSD(-18) - 2332.53473806*EURUSD(-19) + 569.684891562*EURUSD(-20) - 1619.61207529*EURUSD(-21) + 1641.76931445*EURUSD(-22) - 1414.74117489*EURUSD(-23) - 114.280781428*EURUSD(-24) + 450.449461697*EURUSD(-25) - 337.460964818*EURUSD(-26) + 908.232164753*EURUSD(-27) + 601.738993689*EURUSD(-28) + 861.74494980071*EURUSD(-29) + 259.833316285*EURUSD(-30) - 46.5215488696*EURUSD(-31) - 820.583809759*EURUSD(-32) - 1423.98506887*EURUSD(-33) + 935.969451579*EURUSD(-34) - 803.436564451*EURUSD(-35) + 221.143701299*EURUSD(-36) + 335.777492236*EURUSD(-37) + 650.456824302*EURUSD(-38) + 350.318958532*EURUSD(-39) - 467.384535354*EURUSD(-40) - 1463.62960078*EURUSD(-41) + 1023.33692559*EURUSD(-42) + 531.53858297*EURUSD(-43) - 1804.43807812*EURUSD(-44) + 505.327400995*EURUSD(-45) - 20.3151847226*EURUSD(-46) + 1454.71062626*EURUSD(-47) + 149.481921853*EURUSD(-48) - 1985.4346906*EURUSD(-49) + 8.64522845766*EURUSD(-50) + 1301.22397609*EURUSD(-51) + 1398.9062339*EURUSD(-52) - 1812.25415112*EURUSD(-53) - 815.17727151*EURUSD(-54) - 465.973849717*EURUSD(-55) + 891.665097704*EURUSD(-56) - 33.8677278433*EURUSD(-57) + 1802.96642724*EURUSD(-58) + 103.739651059*EURUSD(-59) + 395.877119657*EURUSD(-60) - 1358.3140469*EURUSD(-61) + 17.0144218275*EURUSD(-62) + 645.959444744*EURUSD(-63) - 1935.40489961*EURUSD(-64) + 847.657103772*EURUSD(-65) - 348.287297241*EURUSD(-66) + 1674.82953896*EURUSD(-67) - 1399.09585978*EURUSD(-68) + 442.848712733*EURUSD(-69) + 498.667519817*EURUSD(-70) + 175.460595585*EURUSD(-71) - 3.23177058628*EURUSD(-72) - 502.970783886*EURUSD(-73) - 486.45378574*EURUSD(-74) - 1284.12753179*EURUSD(-75) + 2212.99339275*EURUSD(-76) + 1011.83438787*EURUSD(-77) - 2762.97407148*EURUSD(-78) + 1603.46426721*EURUSD(-79) - 441.847609369*EURUSD(-80) - 173.0306096*EURUSD(-81) - 672.051786135*EURUSD(-82) - 1106.57500684*EURUSD(-83) + 337.977251734*EURUSD(-84) + 1392.23135411*EURUSD(-85) + 1222.020799*EURUSD(-86) + 327.446848701*EURUSD(-87) - 1208.41468022*EURUSD(-88) + 741.85661795*EURUSD(-89) + 1585.08937121*EURUSD(-90) - 2098.86445785*EURUSD(-91) + 58.0598765644*EURUSD(-92) - 166.744222595*EURUSD(-93) + 67.6457712184*EURUSD(-94) + 98.7949064574*EURUSD(-95) + 1406.32082135*EURUSD(-96) - 1658.83294022*EURUSD(-97) - 273.851042947*EURUSD(-98) + 93.5879401275*EURUSD(-99) + 243.060588194*EURUSD(-100) - 1295.0210728 + 0.08150857192*@TREND))

Tutto sembra essere lì.

Il calcolo delle previsioni è in qualche modo completamente uguale al fatto.


Vorrei capire il modello. Cos'è il CNORM? Su quale intervallo è stato addestrato il modello e su quale è stato testato? Ho capito bene che le prime 100 righe dei fogli di calcolo Excel sono dati di allenamento? Perché sono così pochi (pari al numero di variabili dipendenti nel modello)?
 
gpwr:

Vorrei capire il modello. Cos'è il CNORM? Su quale intervallo è stato addestrato il modello e su quale è stato testato? Ho capito bene che le prime 100 righe dei fogli di calcolo Excel sono dati di allenamento? Perché sono così pochi (pari al numero di variabili dipendenti nel modello)?

@cnorm(x)

distribuzione cumulativa normale (CDF)


Ci vogliono 500 barre. Le prime 100 barre non vengono prese, poiché sono barre nella formula come periodo nell'ondulazione. Non formazione, stima dei coefficienti su 500 barre

 
faa1947:

@cnorm(x)

distribuzione cumulativa normale (CDF)


Vengono prese 500 barre. Le prime 100 barre non vengono prese perché queste sono le barre della formula come periodo nell'ondulazione. Non formazione, coefficiente di stima a 500 bar

Tali modelli possono a volte dare previsioni accurate semplicemente a causa dell'alta probabilità di coincidenza dovuta al piccolo numero di possibili stati finali e non significa nulla - basta prendere per esempio l'incremento effettivo per chiudere nel periodo delle prossime 500 barre per i coefficienti derivati nelle 500 barre precedenti e misurare la correlazione con l'incremento della previsione - cioè la differenza nei valori dettagliati. Il coefficiente ottenuto valuterà oggettivamente la qualità della previsione, nel tuo caso puoi usare la valutazione della correlazione quantitativa. Ma ancora una volta non è una soluzione per il problema della previsione, perché per usarlo come sistema "utile" devi essere in grado non solo di "entrare nel mercato" con successo, ma anche di "uscirne". Vi sbagliate a supporre che l'errore di previsione si accumula una barra in avanti se si prendono più barre, infatti, non è promesso... Così come selezionare la significatività delle variabili è un compito separato di estrazione della conoscenza risolvibile (Data Mining) e ci sono già metodi per questo e non si fa per principio - ci vogliono 100 o 500 barre...
 
dasmen:
Tali modelli possono a volte dare previsioni accurate, semplicemente dall'alta probabilità di coincidenza, a causa del piccolo numero di possibili stati finali e non significa nulla - basta prendere per esempio l'incremento effettivo per chiudere sul periodo delle prossime 500 barre per i coefficienti estratti sulle 500 barre precedenti e misurare la correlazione con la previsione dell'incremento - cioè la differenza nei valori di dettaglio. Il coefficiente ottenuto valuterà oggettivamente la qualità della previsione, nel vostro caso potete usare la valutazione della correlazione quantitativa. Ma ancora una volta non è una soluzione per il problema della previsione, perché per usarlo come sistema "utile" devi essere in grado non solo di "entrare nel mercato" con successo, ma anche di "uscirne". Vi sbagliate a supporre che l'errore di previsione si accumula una barra in avanti se si prendono più barre, infatti, non è promesso... Proprio come la selezione della significatività delle variabili è un compito separato di estrazione della conoscenza risolvibile (Data Mining) e ci sono già tecniche per questo e non si fa in base al principio se ci vogliono 100 o 500 barre...

L'intero argomento è più ricco dell'ultimo post che hai commentato. La questione della significatività delle variabili è stata trattata molte volte. L'accumulo dell'errore di predizione è un fatto medico, poiché si prende il valore di predizione precedente per la predizione successiva per mancanza di fatto. Se si prende un fatto, è una previsione un passo avanti.

Ma questi sono problemi minori e tecnici.

L'uso degli incrementi era. Non funziona niente, perché negli incrementi non c'è una tendenza, ma c'è una tendenza prevista. ed ecco la domanda principale dell'argomento: quali proprietà del modello danno una garanzia di prevedibilità? È stato suggerito un insieme di tali proprietà per un modello di regressione ordinaria. Quello che stai commentando è un modello di breakout e ci sono altri modelli qui che non capisco.

Vi sarei grato se poteste commentare uno qualsiasi dei molti punti di questo thread.

 
faa1947:

...L'uso degli incrementi è stato. Non funziona niente, perché non c'è una tendenza negli incrementi, ma la tendenza è prevista. e qui la domanda principale dell'argomento è: quali proprietà del modello danno una garanzia di prevedibilità? È stato suggerito un insieme di tali proprietà per un modello di regressione ordinaria. Quello che stai commentando è un modello probit e ci sono altri modelli qui che non capisco...

  1. È stato matematicamente provato da molti anni che se il modello e il processo analizzato sono gli stessi (nei vostri termini "il modello giusto"), allora la migliore previsione di 1 passo avanti è data dal filtro di Kalman. Cercatelo nel forum...
  2. Ti è stato detto molte volte che il tuo modello è sbagliato. Ti sei fissato con questo modello di regressione che non esistono altri modelli ?...tutto il mondo in tutta la sua diversità è descritto da questo semplice modello ?...
  3. E sul tipo di ACF ti è già stato detto qui più di una volta, e le sue proprietà...

Ecco un link al mio lavoro che è stato lì per molto tempo(https://www.mql5.com/ru/code/8295).... ACF e se guardate bene ci sono due curve. La prima curva è (linea blu), la seconda rossa è l'ACF delle quotazioni. Puoi confrontarli (visivamente)...

C'è un modello (esiste ed è noto da molto tempo) con cui si può descrivere il corit con sufficiente precisione per la pratica e non è un modello di regressione. È vero che i libri di testo di econometria probabilmente non dicono nulla di questo modello... cercate altri libri di testo

Buona fortuna a tutti. Felicità e salute nel prossimo anno!

 

Buon anno! Che tutti i modelli conquistino.

 
faa1947:

L'uso degli incrementi era. Non funziona niente, perché non c'è una tendenza negli incrementi, ma una tendenza è prevista.

Lei dichiara:

1. Che passando agli incrementi si perde la tendenza. Questo non è vero, poiché la presenza di una tendenza influenzerà direttamente l'aspettativa condizionata degli incrementi. Così la previsione dell'uno è equivalente alla previsione dell'altro.

2. Che il modello incrementale non ha la proprietà della reversibilità. Di nuovo, questo non è vero, perché conosciamo l'ultimo livello di prezzo. Prevedendo gli incrementi, prendendo una somma cumulativa da essi e aggiungendo l'ultimo valore noto del prezzo - otteniamo una transizione uno-a-uno nello spazio tempo/prezzo.

Abbiamo un modello di regressione primitivo. Si dimostra che all'interno del campione ha un fattore di profitto molto più grande di 10. Al di fuori del campione è un po' più di 1 e anche questo è dubbio. Questo modello è costruito "correttamente".

Domanda: perché questo modello "corretto" non ha la proprietà della stabilità o della prevedibilità?

Puoi essere un teorico e costruire modelli con R^2 vicino a uno e non guadagnare nulla. Puoi essere un professionista e valutare i modelli in termini di profitti attesi e rischi associati. Il primo caso è buono se vuoi scrivere un articolo/dissertazione/quello che vuoi. Se volete fare soldi, stimate i modelli in base al profitto/rischio prima, e solo dopo in base a R^2 e altre statistiche.

Puoi guardare i test all'interno del campione solo dopo aver ottenuto un risultato positivo stabile all'esterno del campione. Altrimenti state sprecando il vostro tempo.

Prossimo passo. Applicabilità dei diffusori stocastici al mercato, link, per favore.

I diffusori sono particolarmente popolari quando si valutano i derivati come le opzioni. Ci sono applicazioni anche nell'arbitraggio statistico.

È lo stesso per voi. NS nei pacchetti (EViews non ce l'ha, ma altri sì) prende il posto dello smoothing, e questa è solo una piccola parte del problema e non la più importante da risolvere. Nel caso di NS, è un'arte. Se si prendono spline e wavelets, è matematica.

NS prende il posto dei modelli di regressione non lineare.

 
gpwr:

Vorrei capire il modello. Cos'è il CNORM? Su quale intervallo è stato addestrato il modello e su quale è stato testato? Ho capito bene che le prime 100 righe dei fogli di calcolo Excel sono dati di allenamento? Perché sono così pochi (pari al numero di variabili dipendenti nel modello)?

Vorrei capire una cosa, se state prevedendo ZZ, come calcolate il passo di ZigZag previsto?
 
Trolls:
  1. È stato matematicamente dimostrato da molti anni che se il modello e il processo analizzato coincidono (nei vostri termini il "modello corretto"), allora il filtro di Kalman dà la migliore previsione di 1 passo avanti. Cercatelo nel forum...
  2. Ti è stato detto molte volte che il tuo modello è sbagliato. Ti sei fissato con questo modello di regressione che non esistono altri modelli ?...tutto il mondo in tutta la sua diversità è descritto da questo semplice modello ?...
  3. E sul tipo di ACF ti è già stato detto qui più di una volta, e le sue proprietà...

Ecco un link al mio lavoro che è stato lì per molto tempo(https://www.mql5.com/ru/code/8295).... ACF e se guardate bene ci sono due curve. La prima curva è (linea blu), la seconda rossa è l'ACF delle quotazioni. Potete confrontarli (visivamente) ...

C'è un modello (esiste ed è noto da molto tempo) con cui si può descrivere il corit con sufficiente precisione per la pratica e non è un modello di regressione. È vero che i libri di testo di econometria probabilmente non dicono nulla di questo modello... cercate altri libri di testo

Buona fortuna a tutti. Felicità e salute nel prossimo anno!!!

(nei vostri termini "modello corretto")

Corretto significa che ha certe proprietà. Queste proprietà non sono discusse da nessuno.

allora la migliore previsione 1 passo avanti è il filtro di Kalman. Puoi cercarlo nel forum qui...

In EViews c'è un modello chiamato spazio di stato, quindi filtro di Kalman. Ma non posso formulare un tale modello, anche se a detta di tutti è il più promettente.

  1. E sul tipo di ACF ti è già stato detto qui più di una volta, e le sue proprietà...

Ecco un link al mio lavoro che giace lì da molto tempo(https://www.mql5.com/ru/code/8295).... ACF e se guardate bene ci sono due curve. La prima curva è (linea blu), la seconda rossa è l'ACF delle quotazioni. Puoi confrontarli (visivamente)...

Il tuo post su AFC non ho capito nulla.

c'è un modello (esiste ed è noto da tempo) che può essere utilizzato per descrivere il kotir con sufficiente precisione per la pratica, e non è un modello di regressione.

E se non intriga?

 

anonymous:



1. Che la tendenza si perde nel passaggio agli incrementi. Questo non è vero, poiché la presenza di una tendenza influenzerà direttamente l'aspettativa condizionata degli incrementi. Così la previsione dell'uno è equivalente alla previsione dell'altro.

2. Che il modello incrementale non ha la proprietà della reversibilità. Di nuovo, questo non è vero, perché conosciamo l'ultimo livello di prezzo. Prevedendo gli incrementi, prendendo la somma cumulativa da essi e aggiungendo l'ultimo valore noto del prezzo - otteniamo una transizione senza ambiguità nello spazio tempo/prezzo

Affermo solo una cosa: il risultato sugli incrementi è molto peggio che sui livelli. Questo sono io e non generalizzo questo risultato. È possibile che qualcun altro lo ottenga.

Uno può essere un teorico, costruire modelli con R^2 vicino a uno e non guadagnarci nulla. È possibile essere un professionista e valutare i modelli dal punto di vista del profitto atteso e dei rischi associati. Il primo caso è buono se vuoi scrivere un articolo/dissertazione/quello che vuoi. Se volete fare soldi, stimate i modelli in base al profitto/rischio prima, e solo dopo in base a R^2 e altre statistiche.

Puoi guardare i test all'interno del campione solo dopo aver ottenuto un risultato positivo stabile all'esterno del campione. Altrimenti state sprecando il vostro tempo.

Non sono d'accordo con molti del forum su questo punto. Se si vuole un camion e si ottiene una bicicletta, un test della bicicletta riuscito non dimostrerà che si ha un camion. Sono tutte casualità che sono destinate ad emergere nel mondo reale.

NS prende il posto dei modelli di regressione non lineare.

Ancora una volta. NS non risolve i problemi in tutta la loro diversità. La sua osservazione sulla non linearità è indicativa di questo. Cosa sono i modelli di regressione non lineare ? per variabili o per parametri ? E i parametri sono approssimativamente costanti o variabili casuali ? e se casuali, quali sono le loro caratteristiche ? Questo è per la questione di NS. Hanno il loro posto.

Motivazione: