Le modèle de régression de Sultonov (SRM) - qui prétend être un modèle mathématique du marché. - page 46

 
VladislavVG:


Cela n'a pas d'importance. La méthode de résolution de l'équation n'affecte pas la solution, si elle existe et est singulière, mais s'il existe de nombreuses solutions acceptables et que Yusuf a un minimum local, alors la génétique ou les abeilles sont meilleures. Pour une solution manuelle frontale, il suffit d'utiliser un testeur : l'algorithme génétique vous aidera.

Il y a un danger de glisser dans l'ajustement - avec autant de paramètres à faire varier, il faut prendre plus d'exemples pour optimiser.

Et une autre remarque - vous ne connaissez pas la période de l'échantillon à laquelle les coefficients ont été recherchés. Si cette période coïncide avec la période de croissance équilibrée sur le graphique, alors, hélas, tout n'est pas si rose.

Dans mon cas, il n'y a qu'une seule solution, s'il y en a une, et cette solution donne toujours une somme nulle de résidus (MO=0), c'est-à-dire qu'il s'agit de la solution analytiquement exacte de l'équation en question et les solutions approximatives sont hors de question, bien que vous ayez raison et qu'elles aient le droit d'exister. Mais maintenant, avec l'avènement de la méthode des solutions exactes, il sera absurde de traiter des solutions approximatives. Le cas de dégénérescence des données d'entrée, lorsqu'il est impossible de résoudre l'équation, n'a pas encore été observé sur les données OHLC forex. L'algorithme n'a pas buté sur eux, ils sont donc corrects.
 

Essayons maintenant d'exprimer la dépendance du prix moyen de formation de la barre suivante comme une fonction linéaire du type :

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Pour un historique sélectionné de 15 barres quotidiennes D1, les valeurs suivantes des coefficients sont obtenues :

a4 a3 a2 a1 a0 RR. %
1,17387 -0,71318 0,04476 0,27979 0,27433 0,2894








Nous avons obtenu des informations très importantes sur la nature du changement de prix :
1. Les prix de clôture de la barre actuelle C sont les plus significatifs pour la formation du prix de la barre future ;
2. Le deuxième plus important est le prix L, qui indique une force significative des ours par rapport aux haussiers ;
3. Alors les prix d'ouverture O sont significatifs ;
4. L'insignifiance des prix H indique qu'un mouvement significatif à la hausse des prix est peu probable.
Conclusion : VENDRE est préférable à court terme.




 
yosuf:

Essayons maintenant d'exprimer la dépendance du prix moyen de formation de la barre suivante comme une fonction linéaire du type :

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Pour un historique sélectionné de 15 barres quotidiennes D1, les valeurs suivantes des coefficients sont obtenues :

a4 a3 a2 a1 a0 RR. %
1,17387 -0,71318 0,04476 0,27979 0,27433 0,2894














Je ne comprends pas du tout comment on estime les coefficients de régression.

Voici la méthode des moindres carrés (OLS) pour EURUSD_H1 longueur d'échantillon = 50 barres.

Variable dépendante : F

Méthode : Panel Least Squares

Date : 12/02/12 Heure : 10:26

Echantillon : 1 50

Périodes incluses : 23

Sections transversales incluses : 3

Observations totales du panel (non équilibré) : 47

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Coefficient Std. Erreur t-Statistique Prob.

C(1) 0,114716 0,046286 2,478392 0,0173

C(2) -0,051038 0,156544 -0,326030 0,7460

C(3) -0,343986 0,179835 -1,912786 0,0626

C(4) 0,139395 0,190961 0,729968 0,4695

C(5) 1,163942 0,207562 5,607671 0,0000

R-carré 0.947458 Var moyenne dépendante 1.247037

R-carré ajusté 0,942454 S.D. dependent var 0,002839

S.E. de régression 0.000681 Critère d'info d'Akaike -11.64578

Somme des carrés des résidus 1.95E-05 Critère de Schwarz -11.44895

Log-vraisemblance 278.6757 Critère de Hannan-Quinn. -11.57171

F-statistique 189.3409 Durbin-Watson stat 1.935322

Prob(F-statistique) 0.000000

Voici le graphique

Voici laméthode des moindres carrés (LOS) pour EURUSD_H1 avec une longueur d'échantillon = 2000 barres.

Variable dépendante : F

Méthode : Panel Least Squares

Date : 12/02/12 Heure : 10:29

Échantillon : 1 000

Périodes incluses : 23

Sections transversales incluses : 85

Observations totales du panel (non équilibré) : 1915

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Coefficient Std. Erreur t-Statistique Prob.

C(1) 0,000190 0,000729 0,260526 0,7945

C(2) 0,026179 0,029181 0,897122 0,3698

C(3) -0,020055 0,028992 -0,691745 0,4892

C(4) -0,106262 0,032127 -3,307569 0,0010

C(5) 1,099945 0,031672 34,72901 0,0000

R-carré 0,999362 Var moyenne dépendante 1,259869

R-carré ajusté 0,999361 S.D. dependent var 0,031014

S.E. de régression 0.000784 Critère d'info d'Akaike -11.46178

Somme des carrés des résidus 0,001174 Critère de Schwarz -11,44727

Log-vraisemblance 10979.66 Critère de Hannan-Quinn. -11.45644

F-statistique 748391.1 Durbin-Watson stat 2.058272

Prob(F-statistique) 0.000000

Avec n'importe quelle longueur d'échantillon il est obligatoire de calculer l'erreur des coefficients estimés. Nous pouvons voir que dans la dernière estimation avec la valeur du coefficient =0.000190 le skop =0.000729. Non seulement la valeur du coefficient est ridicule, mais le sco est 7 fois supérieur à la valeur faciale !

Désolé, Yusuf, mais c'est un autre vélo. Tout manuel sur l'analyse de régression commence par une équation comme la vôtre. Mais contrairement à vous, les étudiants savent comment évaluer le résultat de l'ajustement - n'importe lequel d'entre eux vous dira que ladite régression ne peut pas être utilisée.

 
faa1947:


Je ne comprends pas du tout comment on estime les coefficients de régression.

Voici la méthode des moindres carrés (OLS) pour EURUSD_H1 longueur d'échantillon = 50 barres.


Pour toute longueur d'échantillon, il est obligatoire de calculer l'erreur des coefficients estimés. Et nous voyons que dans la dernière estimation avec le coefficient =0.000190 sko =0.000729. Non seulement la valeur du coefficient est ridicule, mais le sco est 7 fois supérieur à la valeur nominale !

Veuillez me donner le type d'équation de régression que vous étudiez.
 
yosuf:
Veuillez indiquer le type d'équation de régression que vous étudiez.


C'est indiqué dans le post. En voici une copie :

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Pour 50 bars, voici le coefficient.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

Mais il s'agit d'estimer ces coefficients. Vous ne voulez pas comprendre que loin de toujours, mais plutôt toujours, on ne peut pas se fier à l'estimation des coefficients (leur valeur). C'est le cœur de l'analyse de régression.

Vous devez répondre à la question suivante : sur quelle base croyons-nous que les coefficients que nous calculons ont exactement la valeur que nous voyons ?

 
faa1947:


Il est indiqué dans le post. Voici une copie :

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Pour 50 bars, voici le coefficient.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

Mais il s'agit d'estimer ces coefficients. Vous ne voulez pas comprendre que loin de toujours, mais plutôt toujours, on ne peut pas se fier à l'estimation des coefficients (leur valeur). C'est le cœur de l'analyse de régression.

Nous devons répondre à la question suivante : sur quelle base croyons-nous que les coefficients que nous calculons ont exactement la valeur que nous voyons ?

Par définition, MNC donne la meilleure estimation des coefficients de l'équation en question. Si vous ne les aimez pas pour une raison quelconque, cherchez une autre façon de les estimer ou changez le type d'équation. Il s'agit de l'approche standard pour l'étude des phénomènes et des processus. Si l'équation de régression avec le CNA trouvé fournit une erreur relative inférieure à 1% (0,29% dans ce cas), alors qu'est-ce que j'attends d'autre de ces coefficients ? Vous êtes coincé avec le problème de la fiabilité des coefficients, aucun moyen plus fiable que l'ANC n'a encore été conçu pour les déterminer. Néanmoins, nous devons être conscients que tout raisonnement et toute conclusion que nous faisons ne sont vrais que dans le cadre de l'échantillon en question et qu'il n'y a aucune garantie qu'en dehors de celui-ci, y compris dans le futur, ils resteront vrais. Mais nous sommes obligés, avec un certain degré de probabilité, de supposer leur applicabilité dans un avenir proche. Rien ni personne ne peut prédire l'avenir avec une certitude absolue.
 
yosuf:
Par définition, MNC donne la meilleure estimation des coefficients de l'équation en question. Si vous ne les aimez pas pour une raison quelconque, cherchez une autre façon de les estimer ou changez la forme de l'équation. Il s'agit de l'approche standard pour l'étude des phénomènes et des processus. Si l'équation de régression avec le CNA trouvé fournit une erreur relative inférieure à 1% (0,29% dans ce cas), alors qu'est-ce que j'attends d'autre de ces coefficients ? Vous êtes coincé avec le problème de la fiabilité des coefficients, aucun moyen plus fiable que l'ANC n'a encore été conçu pour les déterminer. Néanmoins, nous devons être conscients que tout raisonnement et toute conclusion que nous faisons ne sont vrais que dans le cadre de l'échantillon en question et qu'il n'y a aucune garantie qu'en dehors de celui-ci, y compris dans le futur, ils resteront vrais. Mais nous sommes obligés, avec un certain degré de probabilité, de supposer leur applicabilité dans un avenir proche. Rien ni personne ne peut prédire l'avenir avec une certitude absolue.


D'une manière ou d'une autre, tu n'es pas entré dans le rapport d'ajustement de la régression. Dans ce dernier, les différents coefficients ont une précision de calcul différente. Le meilleur est de 3%. Mais il y a aussi des multiples de par.

Je ne m'accroche à rien. Je fais juste l'estimation de régression standard. De toute façon, je ne donne pas les valeurs des coefficients sans les estimer.

A propos de l'ISC. Je veux te décevoir. MNC n'est pas la seule méthode, c'est même une méthode avec un grand nombre de contraintes. Il existe d'autres méthodes qui ne présentent pas de telles limitations.

 
yosuf:

Essayons maintenant d'exprimer la dépendance du prix moyen de formation de la barre suivante comme une fonction linéaire du type :

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Pour un historique sélectionné de 15 barres quotidiennes D1, les valeurs suivantes des coefficients sont obtenues :






Ces 15 barres quotidiennes - quelles dates ont été prises ?
 
Demi:
Ces barres de 15 jours - quelles dates ont été prises ?

Données utilisées sur D1 du 16. 09. 12 au 05. 10. 12
 
yosuf:
Données utilisées sur D1 du 16. 09. 12 au 05. 10. 12




))))I le pensait :

1. vos données ne sont pas homogènes. Le modèle comprend des données décrivant la dynamique des prix sur 24 heures et des données décrivant la dynamique des prix sur 4 heures. Les données pour le dimanche doivent être supprimées. Tout le monde fait cette erreur.

2. vous devez avoir un nombre optimal d'observations. Il n'y a pas de formule précise, mais il faut compter entre 5 et 10 observations par variable. Vous avez quatre variables et quinze observations. Le modèle est inadéquat. Et ne faites pas comme un grand expert de ce forum - prenez un modèle avec quatre variables et 5.000 observations ! ))))

3) Une fois le modèle construit, déterminez les coefficients de corrélation partielle pour chaque variable. Et vous constatez que seul C est statistiquement significatif. Construisez un modèle incluant uniquement C et le coefficient avant C sera positif.

Vous en tirez une conclusion commune à TOUS les modèles autorégressifs : SI LE PRIX EST EN HAUSSE, il y a une plus grande probabilité qu'il continue à augmenter à l'avenir et vice versa. Ensuite, vous jetez le modèle.