Регрессионная модель Султонова (РМС) - претендующая на математическую модель рынка. - страница 46

 
VladislavVG:


Не имеет значения. Метод решения уравнения на решение, если оно существует и единственно, не влияет, если же приемлемых решений много и у Юсуфа это локальный минимум, то лучше генетика или пчелы. Для лобового решения вручную - просто воспользуйтесь тестером: генетический алгоритм Вам поможет.  

Есть опасность скатиться к подгонке - при таком количестве варьируемых параметров нужно брать больше примеров для оптимизации.

И еще одно замечание - Вы не знаете период выборки на котором производился поиск коэффициентов. Если этот период совпал с периодом роста баланса на графике, то, увы, не все так радужно. 

В моем случае, находится одно единственное решение, если оно есть и это решение всегда дает нулевую сумму остатков (МО=0), т.е., оно аналитически точное решение рассматриваемого уравнения и о приближенных решениях и речи быть не может, хотя Вы правы и они имеют право жить. Но теперь, с появлением точного метода решения, заниматься приближенными - это будет нонсенс. Случай вырождения исходных данных, когда невозможно решить уравнение, на данных OHLC Форекса пока не наблюдаются. Алгоритм не спотыкался на них, значит, они корректные.
 

Теперь попробуем зависимость средней цены образования очередного бара выразить в виде линейной функции типа:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Для выбранной истории из 15 дневных баров Д1 получены следующие значения коэффициентов:

a4 a3 a2 a1 a0 отн. ош. %
1,17387 -0,71318 0,04476 0,27979 0,27433 0,2894








Получили очень важные сведения о характере изменения цены:
1. Наиболее значимыми для формирования цены будущего бара являются цены закрытия текущего бара С;
2. Вторым по значимости следуют цены L, что указывает на значительную силу медведей по отношении к быкам;
3. Затем по значимости стоят цены открытия O;
4. Малозначимость цен H указывает на то, что маловероятно значительное движение цены вверх.
Вывод: на ближайшую перспективу предпочтительнее СЕЛЛ.




 
yosuf:

Теперь попробуем зависимость средней цены образования очередного бара выразить в виде линейной функции типа:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Для выбранной истории из 15 дневных баров Д1 получены следующие значения коэффициентов:

a4 a3 a2 a1 a0 отн. ош. %
1,17387 -0,71318 0,04476 0,27979 0,27433 0,2894














Совершенно не понимаю как оцениваются коэффициенты регрессии. 

Вот методом наименьших квадратов (МНК) для EURUSD_Н1 длина выборки= 50 баров.

Dependent Variable: F

Method: Panel Least Squares

Date: 12/02/12   Time: 10:26

Sample: 1 50

Periods included: 23

Cross-sections included: 3

Total panel (unbalanced) observations: 47

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Coefficient Std. Error t-Statistic Prob.  

C(1) 0.114716 0.046286 2.478392 0.0173

C(2) -0.051038 0.156544 -0.326030 0.7460

C(3) -0.343986 0.179835 -1.912786 0.0626

C(4) 0.139395 0.190961 0.729968 0.4695

C(5) 1.163942 0.207562 5.607671 0.0000

R-squared 0.947458    Mean dependent var 1.247037

Adjusted R-squared 0.942454    S.D. dependent var 0.002839

S.E. of regression 0.000681    Akaike info criterion -11.64578

Sum squared resid 1.95E-05    Schwarz criterion -11.44895

Log likelihood 278.6757    Hannan-Quinn criter. -11.57171

F-statistic 189.3409    Durbin-Watson stat 1.935322

Prob(F-statistic) 0.000000

Вот график

 Вот методом наименьших квадратов (МНК) для EURUSD_Н1 длина выборки= 2000 баров.

 Dependent Variable: F

Method: Panel Least Squares

Date: 12/02/12   Time: 10:29

Sample: 1 2000

Periods included: 23

Cross-sections included: 85

Total panel (unbalanced) observations: 1915

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Coefficient Std. Error t-Statistic Prob.  

C(1) 0.000190 0.000729 0.260526 0.7945

C(2) 0.026179 0.029181 0.897122 0.3698

C(3) -0.020055 0.028992 -0.691745 0.4892

C(4) -0.106262 0.032127 -3.307569 0.0010

C(5) 1.099945 0.031672 34.72901 0.0000

R-squared 0.999362    Mean dependent var 1.259869

Adjusted R-squared 0.999361    S.D. dependent var 0.031014

S.E. of regression 0.000784    Akaike info criterion -11.46178

Sum squared resid 0.001174    Schwarz criterion -11.44727

Log likelihood 10979.66    Hannan-Quinn criter. -11.45644

F-statistic 748391.1    Durbin-Watson stat 2.058272

Prob(F-statistic) 0.000000

При любой длине выборки обязательным является вычисление ошибки оцениваемых коэф. А мы видим, что в последней оценке при значении коэф =0.000190 ско =0.000729. Мало того, что значение коэф смехотворно, так еще ско в 7 раз больше номинала!

 Извини, Юсуф, но это очередной велосипед. Любой учебник по регрессионному анализу начинается с уравнение, подобных твоему. Но в отличие от тебя студенты умеют оценивать результат подгонки - любой из них скажет, что указанной регрессией пользоваться нельзя.

 
faa1947:


Совершенно не понимаю как оцениваются коэффициенты регрессии. 

Вот методом наименьших квадратов (МНК) для EURUSD_Н1 длина выборки= 50 баров.


При любой длине выборки обязательным является вычисление ошибки оцениваемых коэф. А мы видим, что в последней оценке при значении коэф =0.000190 ско =0.000729. Мало того, что значение коэф смехотворно, так еще ско в 7 раз больше номинала!

 

Приведите, пожалуйста, вид исследуемого Вами уравнения регрессии.
 
yosuf:
Приведите, пожалуйста, вид исследуемого Вами уравнения регрессии.


Оно указано в посте. Вот копия:

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1) 

Для 50 баров вот с коэф.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

 Но все дело в оценке этих коэф. Вы не хотите понять, что далеко не всегда, а скорее всегда оценке коэф (их значению) доверять нельзя. Это серцевина регрессионного анализа.

Нужно отвечать на вопрос: на каком основании мы верим, что вычисленные нами коэф. имеют именно то значение, которое мы видим? 

 
faa1947:


Оно указано в посте. Вот копия:

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1) 

Для 50 баров вот с коэф.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

 Но все дело в оценке этих коэф. Вы не хотите понять, что далеко не всегда, а скорее всегда оценке коэф (их значению) доверять нельзя. Это серцевина регрессионного анализа.

Нужно отвечать на вопрос: на каком основании мы верим, что вычисленные нами коэф. имеют именно то значение, которое мы видим? 

По определению, МНК дает наилучшую оценку коэффициентов рассматриваемого уравнения и если они Вам не нравятся по какой-либо причине, ищите другой способ их оценки или меняйте вид уравнения. Вот стандартный подход при исследовании явлений и процессов. Если уравнение регрессии с найденными методом МНК обеспечивают относительную ошибку менее 1% (0,29% в данном случае), то я что еще хочу от этих коэффициентов? Вы зациклились с проблемой надежности коэффициентов, более надежного способа их определения, чем МНК, еще не придумали. Тем не менее, мы должны отдавать себе отчет, что любые наши рассуждения и выводы верны только в пределах рассматриваемой выборки и нет гарантии, что вне ее, включая и будущее, они останутся верными. Но, вынуждены, с определенной доли вероятности, допустить их применимость в ближайшее время. Абсолютно точно предсказать будущее не способен никто и ничто.
 
yosuf:
По определению, МНК дает наилучшую оценку коэффициентов рассматриваемого уравнения и если они Вам не нравятся по какой-либо причине, ищите другой способ их оценки или меняйте вид уравнения. Вот стандартный подход при исследовании явлений и процессов. Если уравнение регрессии с найденными методом МНК обеспечивают относительную ошибку менее 1% (0,29% в данном случае), то я что еще хочу от этих коэффициентов? Вы зациклились с проблемой надежности коэффициентов, более надежного способа их определения, чем МНК, еще не придумали. Тем не менее, мы должны отдавать себе отчет, что любые наши рассуждения и выводы верны только в пределах рассматриваемой выборки и нет гарантии, что вне ее, включая и будущее, они останутся верными. Но, вынуждены, с определенной доли вероятности, допустить их применимость в ближайшее время. Абсолютно точно предсказать будущее не способен никто и ничто.


Вы почему-то не вникли в отчет по подгонке регрессии. В последней разные коэф имеют разную точность вычисления. Наилучшая 3%. Но есть и кратно превосходящие номинал. 

Я ни на чем не зацикливаюсь. Просто стандартно шурую при оценке регрессии. Во всяком величины коэф не привожу без их оценки.

 На счет МНК. Хочу Вас разочаровать. МНК  не единственный метод, более того, метод с большим числом ограничений. Есть другие методы, не имеющих таких ограничений.

 
yosuf:

Теперь попробуем зависимость средней цены образования очередного бара выразить в виде линейной функции типа:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Для выбранной истории из 15 дневных баров Д1 получены следующие значения коэффициентов:






Эти 15 дневных баров - какие брали даты?
 
Demi:
Эти 15 дневных баров - какие брали даты?

Использованы данные на Д1 с 16. 09. 12 по 05. 10. 12
 
yosuf:
Использованы данные на Д1 с 16. 09. 12 по 05. 10. 12




))))Ну я так и подумал:

1. у вас не однородная данные. В модель включены данные, характеризующие 24-х часовую динамику цены, и данные, характеризующие 4-х часовую динамику цены. Данные за воскресенье надо убирать. Это ошибку делают все.

2. у вас должно быть оптимальное количество наблюдений. Четкой формулы тут нет, но это где то от 5 до 10 наблюдений на одну переменную. У вас четыре переменные и пятнадцать наблюдений. Модель неадекватна. И не надо делать так, как делал один великий специалист на этом форуме - брать модель из четырех переменных и 5 000 наблюдений!))))

3. когда построили модель, определяете частные коеффициенты корреляции для каждой переменной. И у вас окажется, что статистически значимой является только С. Строите модель, включающую только С и коэффициент перед С будет положительный.

Из этого делаете вывод, общий для ВСЕХ моделей авторегрессии - ЕСЛИ ЦЕНА РОСЛА, ТО С БОЛЬШЕЙ ВЕРОЯТНОСТЬЮ РОСТ ПРОДОЛЖИТСЯ В БУДУЩЕМ И НАОБОРОТ. Потом выкидываете модель. 

Причина обращения: