Econometria: previsione a un passo avanti - pagina 73

 
faa1947:

Sì, 40 non è molto. Ha fatto il test e ha scritto sopra. Dopo 70 ulteriori aumenti del campione non influenzano il risultato. Ecco il risultato sulla lunghezza del campione. È degno di nota. I coefficienti del modello sono stimati:

EURUSD = C(1)*HP1(-1) + C(2)*HP1(-2) + C(3)*HP1_D(-1) + C(4)*EQ1_HP2(-1) + C(5)*EQ1_HP2(-2) + C(6)*EQ1_HP2(-3) + C(7)*EQ1_HP2_D(-1) + C(8)*EQ1_HP2_D(-2) + C(9)*EQ1_HP2_D(-3) + C(10)*EQ1_HP2_D(-4)

Ce ne sono 10 in totale. Tutti i coefficienti sono variabili casuali. Domanda: a quale lunghezza del campione diventeranno approssimativamente una costante. Mostrerò tutti i coefficienti in una figura:

Qui campione = 80 osservazioni. Si può vedere che dopo la metà del campione tutto si aggiusta e soprattutto l'errore di valutazione del coefficiente. Per il primo coefficiente ne darò uno più grande:

Questa è una stima del coefficiente stesso - vediamo che il suo valore non è una costante.

E ora l'errore di stima del coefficiente:

Quindi concludo che il campione dovrebbe essere da qualche parte sopra le 60 osservazioni.

Abbiamo bisogno di coefficienti stabili con un piccolo errore - questa è una misura della lunghezza del campione!




La convergenza dei coefficienti del modello o dei loro errori verso un certo numero non determina il numero di osservazioni necessarie. Prendete una LR ordinaria e più piccoli sono i dati, più velocemente cambierà i suoi coefficienti, e più lentamente aumenterà. Ma questa è una proprietà della regressione stessa, non la sua accuratezza nel predire le serie. E non determina la dimensione della finestra di calcolo della regressione.

Se si applica un criterio che dà risultati numerici, si dovrebbe sapere non solo un numero, ma fino a che punto ci si può fidare in questo caso. Per esempio, a questo scopo, la statistica matematica usa il DI.

 
Avals:

E a proposito, sull'analisi dei residui per la distribuzione normale: solo 116 osservazioni sono molto poche perché i risultati siano affidabili. Cioè, certo, il test può essere applicato e attribuirà la distribuzione alla normalità con una certa probabilità, ma qual è l'intervallo di confidenza di questa previsione? Cioè il 25% è di nuovo un valore molto approssimativo e può essere l'intervallo di 0...50 con il 95% di confidenza per esempio, e può essere 22...28. Dipende sia dal numero di osservazioni che dalla varianza. Mi sembra che con 116 osservazioni l'IC sarebbe enorme.

Non analizzo per la normalità. Perché?

Prima di tutto dobbiamo estrarre dal quoziente ciò che possiamo usare: la correlazione delle osservazioni. Se otteniamo un residuo senza correlazioni, allora dobbiamo scoprire se c'è qualche altra informazione che può essere utilizzata - ARCH. Se c'è, allora modella (scrivi formula analitica) anche questa informazione. Il residuo ideale è quello da cui non possiamo (non sappiamo, non conosciamo) estrarre alcuna informazione per la modellizzazione.

 
paukas:
Deciditi in qualche modo.....
È una buona abitudine leggere una frase fino alla fine, o meglio ancora, un paragrafo fino alla fine, o meglio ancora, tutto quello che l'autore scrive.
 
Avals:


La convergenza dei coefficienti del modello o dei loro errori verso un certo numero non determina il numero di osservazioni necessarie. Prendete una LR ordinaria e più piccoli sono i dati, più velocemente cambierà i suoi coefficienti, e più lentamente aumenterà. Ma questa è una proprietà della regressione stessa, non la sua accuratezza nel predire le serie. E non determina la dimensione della finestra di calcolo della regressione.

Se si applica qualche criterio che dà risultati numerici, è necessario conoscere non solo il numero, ma quanto ci si può fidare in un dato caso. Per esempio, la statistica matematica usa un DI per questo scopo.

Il ragionamento non è molto chiaro: perché aumentare la finestra se il coefficiente è costante e il coefficiente di oscillazione è costante? Possiamo vederlo nelle cifre.

 
faa1947:
È un'abitudine molto utile quella di leggere una frase fino alla fine, o meglio ancora, un paragrafo fino alla fine, o meglio ancora, tutto quello che l'autore scrive.
Un'abitudine ancora più utile è quella di scrivere in un modo che abbia senso non solo per l'autore, ma anche per l'agricoltore collettivo medio.
 
Reshetov:

Finalmente l'adepto del culto ha rivelato il segreto principale del trucco religioso!

Elementare, Watson! Perché sono non stazionari. La stazionarietà è quando la dispersione e l'aspettativa sono costanti e non dipendono dal campione su cui sono misurate. Cioè, in qualsiasi altro campione indipendente, dovremmo ottenere approssimativamente le stesse costanti. Se non li abbiamo avuti, allora l'ipotesi della stazionarietà è confutata.

L'ipotesi di stazionarietà può essere testata in un altro modo aumentando la dimensione del campione. Nel caso della stazionarietà, sia la varianza che l'aspettativa devono rimanere costanti.


Oh, ma dai! Il problema principale del modello non è nella non stazionarietà del mercato, ma nel modello stesso, semplicemente non può funzionare, come evidenziato dal tester della strategia, che il topicstarter non vuole ammettere, e allo stesso tempo si chiede perché il suo modello non funziona. Non c'è bisogno di fare un tale casino con R^2, ecc. quando un semplice test è un modo molto più obiettivo per mostrare cosa è cosa.

Se volete questa stazionarietà, usate i grafici di equivolume. Perché, la volatilità è una costante, la dispersione e il m.o.s. devono essere finiti, ma sarà poco utile, dato che il modello non ha funzionato sui grafici ordinari e non funzionerà nemmeno sui grafici equivolume.

 
faa1947:

Non analizzo per la normalità. Perché?

Prima di tutto, ciò che si può estrarre dal quoziente è la correlazione tra le osservazioni. Se otteniamo un residuo senza correlazioni, allora dobbiamo scoprire se c'è qualche altra informazione che può essere utilizzata - ARCH. Se c'è, allora modella (scrivi formula analitica) anche questa informazione. Il residuo ideale è quello da cui non possiamo (non sappiamo, non conosciamo) estrarre alcuna informazione per la modellizzazione.


Come si fa a non analizzarlo? Lo avete scritto nel vostro articolo 1.3. Stima dei residui di un'equazione di regressione

Si ottengono numeri specifici -

"La probabilità che il residuo sia distribuito normalmente è del 25,57%".

ACF, ecc. ecc.

Ma questi numeri non hanno alcun valore senza un'indicazione di quanto si possa credere.

Ci si può fidare del fattore di profitto di 400 trade come di 40? Così come tutti gli altri valori statistici e criteri numerici - sono necessarie stime accurate. L'intervallo di confidenza è un modo per farlo. 116 osservazioni non è sufficiente per credere ai risultati dell'attribuzione o non attribuzione di una distribuzione alla normalità, qualunque sia il criterio applicato.

 
faa1947:

La sordità è stupefacente.

Ho insistito su questo per anni - il kotir non è stazionario e non può essere previsto.

Ho detto per tutto questo thread - il quoziente non è stazionario, ma può essere previsto se il residuo del modello è stazionario. Il residuo è interessante perché poi si può sommare il modello (analitico) con un residuo stazionario. Questa somma è uguale al quoziente, non si perde un pip. L'ho scritto cento volte sopra. No stessa cosa, chukchi abili che sono scrittori ma non lettori.

Continua a parlare. Il residuo è non stazionario, perché se un modello montato su un singolo campione viene testato su qualsiasi altro campione indipendente, il residuo non è più una costante. È possibile fare adattamenti ad altri campioni, ma dopo questi adattamenti si ottiene un modello diverso per ogni singolo campione.

Ancora una volta, lo ripeto per i particolarmente dotati: la stazionarietà può essere rivelata solo dalla coincidenza di dati statistici su campioni diversi e indipendenti. E non c'è questa coincidenza.

Il trucco con le manipolazioni econometriche è che hanno trovato un metodo per adattare un modello a un campione in modo tale che tutti i residui in quel campione siano approssimativamente uguali. Ma poiché un tale trucco si verifica solo per un singolo campione e in altri campioni il modello dà risultati diversi, i residui non sono stazionari, ma solo adattati a un singolo campione. I modelli econometrici non possono estrapolare il futuro perché non hanno ancora dati storici (che appariranno solo in futuro) che possono essere adattati al modello.

È la stessa cosa di un indicatore di ridisegno - adattando le sue letture a dati specifici, cambiandoli retroattivamente.

 
faa1947:

Il ragionamento non è molto chiaro: perché aumentare la finestra se il coefficiente è costante e il coefficiente osh. è costante? Possiamo vederlo nelle cifre.



Non sto suggerendo di allargare la finestra di calcolo dei coefficienti di regressione. La finestra per questo non è definita dalla loro convergenza verso un numero. Sto parlando del numero di osservazioni e di come influisce sull'accuratezza del vostro criterio e delle vostre stime statistiche
 
La regola empirica in statistica è che ci dovrebbero essere almeno 300 punti, che è il limite inferiore.
Motivazione: