Il modello di regressione di Sultonov (SRM) - che pretende di essere un modello matematico del mercato. - pagina 46

 
VladislavVG:


Non ha importanza. Il metodo di risoluzione dell'equazione non influenza la soluzione, se esiste ed è singolare, ma se ci sono molte soluzioni accettabili e Yusuf ha un minimo locale, allora la genetica o le api sono migliori. Per una soluzione manuale di testa, basta usare un tester: l'algoritmo genetico vi aiuterà.

C'è il pericolo di scivolare nell'adattamento - con così tanti parametri da variare è necessario prendere più esempi per ottimizzare.

E un'altra osservazione - non si conosce il periodo del campione in cui sono stati cercati i coefficienti. Se questo periodo ha coinciso con il periodo di crescita dell'equilibrio sul grafico, allora, ahimè, non è tutto così roseo.

Nel mio caso, c'è una sola soluzione, se c'è, e questa soluzione dà sempre somma zero dei residui (MO=0), cioè è la soluzione analiticamente esatta dell'equazione in questione e le soluzioni approssimate sono fuori questione, anche se hai ragione e hanno il diritto di esistere. Ma ora, con l'avvento del metodo di soluzione esatta, non ha più senso occuparsi di soluzioni approssimate. Il caso di degenerazione dei dati di input, quando è impossibile risolvere l'equazione, non è stato ancora osservato sui dati forex OHLC. L'algoritmo non è inciampato su di loro, quindi sono corretti.
 

Ora cerchiamo di esprimere la dipendenza del prezzo medio di formazione della prossima barra come una funzione lineare del tipo:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Per una storia selezionata di 15 barre giornaliere D1 si ottengono i seguenti valori di coefficienti:

a4 a3 a2 a1 a0 RR. %
1,17387 -0,71318 0,04476 0,27979 0,27433 0,2894








Abbiamo ottenuto informazioni molto importanti sulla natura del cambiamento dei prezzi:
1. I prezzi di chiusura della barra C corrente sono i più significativi per la formazione del prezzo della barra futura;
2. Il secondo più significativo sono i prezzi L, che indica una forza significativa degli orsi in relazione ai tori;
3. Allora i prezzi di apertura di O sono significativi;
4. L'insignificanza dei prezzi H indica che un significativo movimento dei prezzi verso l'alto è improbabile.
Conclusione: è preferibile vendere a breve termine.




 
yosuf:

Ora cerchiamo di esprimere la dipendenza del prezzo medio di formazione della prossima barra come una funzione lineare del tipo:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Per una storia selezionata di 15 barre giornaliere D1 si ottengono i seguenti valori di coefficienti:

a4 a3 a2 a1 a0 RR. %
1,17387 -0,71318 0,04476 0,27979 0,27433 0,2894














Non capisco affatto come si stimano i coefficienti di regressione.

Ecco il metodo dei minimi quadrati (OLS) per EURUSD_H1 lunghezza del campione = 50 barre.

Variabile dipendente: F

Metodo: Panel Least Squares

Data: 12/02/12 Ora: 10:26

Campione: 1 50

Periodi inclusi: 23

Sezioni trasversali incluse: 3

Totale osservazioni del pannello (non bilanciato): 47

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Coefficiente Std. Errore t-Statistica Prob.

C(1) 0.114716 0.046286 2.478392 0.0173

C(2) -0.051038 0.156544 -0.326030 0.7460

C(3) -0.343986 0.179835 -1.912786 0.0626

C(4) 0.139395 0.190961 0.729968 0.4695

C(5) 1.163942 0.207562 5.607671 0.0000

R-squared 0.947458 Var media dipendente 1.247037

R-squared aggiustato 0.942454 S.D. var dipendente 0.002839

S.E. di regressione 0.000681 Criterio informativo di Akaike -11.64578

Somma quadratica residua 1.95E-05 Criterio di Schwarz -11.44895

Log likelihood 278.6757 criterio di Hannan-Quinn. -11.57171

F-statistic 189.3409 Durbin-Watson stat 1.935322

Prob(F-statistica) 0.000000

Ecco il grafico

Ecco ilmetodo dei minimi quadrati (LOS) per EURUSD_H1 con lunghezza del campione = 2000 barre.

Variabile dipendente: F

Metodo: Panel Least Squares

Data: 12/02/12 Ora: 10:29

Campione: 1.000

Periodi inclusi: 23

Sezioni trasversali incluse: 85

Totale osservazioni del pannello (non bilanciato): 1915

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Coefficiente Std. Errore t-Statistica Prob.

C(1) 0.000190 0.000729 0.260526 0.7945

C(2) 0.026179 0.029181 0.897122 0.3698

C(3) -0.020055 0.028992 -0.691745 0.4892

C(4) -0.106262 0.032127 -3.307569 0.0010

C(5) 1.099945 0.031672 34.72901 0.0000

R-squared 0.999362 Var media dipendente 1.259869

R-squared aggiustato 0.999361 S.D. var dipendente 0.031014

S.E. di regressione 0.000784 Criterio informativo di Akaike -11.46178

Somma quadratica residua 0,001174 Criterio di Schwarz -11,44727

Log likelihood 10979.66 criterio di Hannan-Quinn. -11.45644

F-statistic 748391.1 Durbin-Watson stat 2.058272

Prob(F-statistica) 0.000000

Con qualsiasi lunghezza del campione è obbligatorio calcolare l'errore dei coefficienti stimati. Possiamo vedere che nell'ultima stima con il valore del coefficiente =0,000190 lo skop =0,000729. Non solo il valore del coefficiente è ridicolo, ma lo sco è 7 volte il valore nominale!

Scusa, Yusuf, ma questa è solo un'altra bicicletta. Qualsiasi libro di testo sull'analisi di regressione inizia con un'equazione come la tua. Ma a differenza di voi, gli studenti sanno come valutare il risultato dell'adattamento - chiunque di loro vi dirà che la suddetta regressione non può essere utilizzata.

 
faa1947:


Non capisco affatto come si stimano i coefficienti di regressione.

Ecco il metodo dei minimi quadrati (OLS) per EURUSD_H1 lunghezza del campione = 50 barre.


A qualsiasi lunghezza del campione è obbligatorio calcolare l'errore dei coefficienti stimati. E vediamo che nell'ultima stima con il coefficiente =0,000190 sko =0,000729. Non solo il valore del coefficiente è ridicolo, ma lo sco è 7 volte il valore nominale!

Per favore, datemi il tipo di equazione di regressione che state studiando.
 
yosuf:
Si prega di fornire il tipo di equazione di regressione che si sta studiando.


È elencato nel post. Ecco una copia:

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Per 50 bar, ecco il coefficiente.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

Ma si tratta di stimare questi coefficienti. Non volete capire che tutt'altro che sempre, ma piuttosto sempre, la stima dei coefficienti (il loro valore) non è affidabile. Questo è il cuore dell'analisi di regressione.

Bisogna rispondere alla domanda: su quali basi crediamo che i coefficienti che calcoliamo abbiano esattamente il valore che vediamo?

 
faa1947:


Si legge nel post. Ecco una copia:

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Per 50 bar, ecco il coefficiente.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

Ma si tratta di stimare questi coefficienti. Non volete capire che tutt'altro che sempre, ma piuttosto sempre, la stima dei coefficienti (il loro valore) non è affidabile. Questo è il cuore dell'analisi di regressione.

Dobbiamo rispondere alla domanda: su quali basi crediamo che i coefficienti che calcoliamo abbiano esattamente il valore che vediamo?

Per definizione, MNC dà la migliore stima dei coefficienti dell'equazione in questione e se non ti piace per qualsiasi motivo, cerca un altro modo per stimarli o cambia il tipo di equazione. Questo è l'approccio standard quando si studiano fenomeni e processi. Se l'equazione di regressione con l'ANC trovata fornisce un errore relativo inferiore all'1% (0,29% in questo caso), allora cos'altro voglio da questi coefficienti? Sei bloccato con il problema dell'affidabilità dei coefficienti, nessun modo più affidabile di determinarli che l'ANC è stato ancora concepito. Tuttavia, dobbiamo essere consapevoli che qualsiasi ragionamento e conclusione che facciamo sono veri solo all'interno del campione in questione e non c'è alcuna garanzia che al di fuori di esso, compreso il futuro, rimarranno veri. Ma siamo costretti, con un certo grado di probabilità, a supporre la loro applicabilità nel prossimo futuro. Niente e nessuno può prevedere il futuro con assoluta certezza.
 
yosuf:
Per definizione, MNC dà la migliore stima dei coefficienti dell'equazione in questione e se non ti piacciono per qualsiasi motivo, cerca un altro modo per stimarli o cambia la forma dell'equazione. Questo è l'approccio standard quando si studiano fenomeni e processi. Se l'equazione di regressione con l'ANC trovata fornisce un errore relativo inferiore all'1% (0,29% in questo caso), allora cos'altro voglio da questi coefficienti? Sei bloccato con il problema dell'affidabilità dei coefficienti, nessun modo più affidabile di determinarli dell'ANC è stato ancora concepito. Tuttavia, dobbiamo essere consapevoli che qualsiasi ragionamento e conclusione che facciamo sono veri solo all'interno del campione in questione e non c'è alcuna garanzia che al di fuori di esso, compreso il futuro, rimarranno veri. Ma siamo costretti, con un certo grado di probabilità, a supporre la loro applicabilità nel prossimo futuro. Niente e nessuno può prevedere il futuro con assoluta certezza.


In qualche modo non sei entrato nel rapporto di regressione. In quest'ultimo, i diversi coefficienti hanno una diversa precisione di calcolo. Il migliore è il 3%. Ma ci sono anche multipli del par.

Io non mi faccio prendere da nulla. Faccio solo la stima di regressione standard. Comunque, non do valori di coefficienti senza stimarli.

Circa l'ISC. Voglio deluderti. Il MNC non è l'unico metodo, inoltre è un metodo con un gran numero di vincoli. Ci sono altri metodi che non hanno queste limitazioni.

 
yosuf:

Ora cerchiamo di esprimere la dipendenza del prezzo medio di formazione della prossima barra come una funzione lineare del tipo:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Per una storia selezionata di 15 barre giornaliere D1, si ottengono i seguenti valori di coefficienti:






Queste 15 barre giornaliere - quali date sono state prese?
 
Demi:
Quelle barre di 15 giorni - che date sono state prese?

Dati utilizzati su D1 dal 16. 09. 12 al 05. 10. 12
 
yosuf:
Dati utilizzati su D1 dal 16. 09. 12 al 05. 10. 12




))))I ha pensato così:

1. i vostri dati non sono omogenei. Il modello include dati che descrivono la dinamica dei prezzi su 24 ore e dati che descrivono la dinamica dei prezzi su 4 ore. I dati della domenica dovrebbero essere rimossi. Tutti fanno questo errore.

2. Devi avere un numero ottimale di osservazioni. Non c'è una formula precisa, ma è da qualche parte tra 5 e 10 osservazioni per variabile. Avete quattro variabili e quindici osservazioni. Il modello è inadeguato. E non fate come un grande esperto di questo forum: prendete un modello con quattro variabili e 5.000 osservazioni! ))))

3. Una volta costruito il modello, determina i coefficienti di correlazione parziale per ogni variabile. E trovate che solo C è statisticamente significativo. Costruite un modello che includa solo C e il coefficiente prima di C sarà positivo.

Da questo si trae una conclusione comune a TUTTI i modelli autoregressivi - SE IL PREZZO STA SALENDO, allora c'è una maggiore probabilità che continui a salire in futuro e viceversa. Poi si butta via il modello.

Motivazione: