Попробуйте оценить результат подгонки регрессии. Определите, на каком основании мы верим, что вычисленные нами коэф имеют разную точность вычисления.

Юсуфходжа 2012.12.01 01:18 #451

VladislavVG:

Не имеет значения. Метод решения уравнения на решение, если оно существует и единственно, не влияет, если же приемлемых решений много и у Юсуфа это локальный минимум, то лучше генетика или пчелы. Для лобового решения вручную - просто воспользуйтесь тестером: генетический алгоритм Вам поможет.

Есть опасность скатиться к подгонке - при таком количестве варьируемых параметров нужно брать больше примеров для оптимизации.

И еще одно замечание - Вы не знаете период выборки на котором производился поиск коэффициентов. Если этот период совпал с периодом роста баланса на графике, то, увы, не все так радужно.

В моем случае, находится одно единственное решение, если оно есть и это решение всегда дает нулевую сумму остатков (МО=0), т.е., оно аналитически точное решение рассматриваемого уравнения и о приближенных решениях и речи быть не может, хотя Вы правы и они имеют право жить. Но теперь, с появлением точного метода решения, заниматься приближенными - это будет нонсенс. Случай вырождения исходных данных, когда невозможно решить уравнение, на данных OHLC Форекса пока не наблюдаются. Алгоритм не спотыкался на них, значит, они корректные.

Обсуждение статьи "Модель движения [Архив!] Чистая математика, физика, торговая стратегия на базе

Юсуфходжа 2012.12.02 05:59 #452

Теперь попробуем зависимость средней цены образования очередного бара выразить в виде линейной функции типа:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Для выбранной истории из 15 дневных баров Д1 получены следующие значения коэффициентов:

a4	a3	a2	a1	a0	отн. ош. %
1,17387	-0,71318	0,04476	0,27979	0,27433	0,2894

Получили очень важные сведения о характере изменения цены:
1. Наиболее значимыми для формирования цены будущего бара являются цены закрытия текущего бара С;
2. Вторым по значимости следуют цены L, что указывает на значительную силу медведей по отношении к быкам;
3. Затем по значимости стоят цены открытия O;
4. Малозначимость цен H указывает на то, что маловероятно значительное движение цены вверх.
Вывод: на ближайшую перспективу предпочтительнее СЕЛЛ.

Системный индикатор Султонова Индикаторы: Price and Volume Индикатор BBMA (Bull -

СанСаныч Фоменко 2012.12.02 06:39 #453

yosuf:

Теперь попробуем зависимость средней цены образования очередного бара выразить в виде линейной функции типа:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Для выбранной истории из 15 дневных баров Д1 получены следующие значения коэффициентов:

a4	a3	a2	a1	a0	отн. ош. %
1,17387	-0,71318	0,04476	0,27979	0,27433	0,2894

Совершенно не понимаю как оцениваются коэффициенты регрессии.

Вот методом наименьших квадратов (МНК) для EURUSD_Н1 длина выборки= 50 баров.

Dependent Variable: F

Method: Panel Least Squares

Date: 12/02/12 Time: 10:26

Sample: 1 50

Periods included: 23

Cross-sections included: 3

Total panel (unbalanced) observations: 47

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Coefficient Std. Error t-Statistic Prob.

C(1) 0.114716 0.046286 2.478392 0.0173

C(2) -0.051038 0.156544 -0.326030 0.7460

C(3) -0.343986 0.179835 -1.912786 0.0626

C(4) 0.139395 0.190961 0.729968 0.4695

C(5) 1.163942 0.207562 5.607671 0.0000

R-squared 0.947458 Mean dependent var 1.247037

Adjusted R-squared 0.942454 S.D. dependent var 0.002839

S.E. of regression 0.000681 Akaike info criterion -11.64578

Sum squared resid 1.95E-05 Schwarz criterion -11.44895

Log likelihood 278.6757 Hannan-Quinn criter. -11.57171

F-statistic 189.3409 Durbin-Watson stat 1.935322

Prob(F-statistic) 0.000000

Вот график

Вот методом наименьших квадратов (МНК) для EURUSD_Н1 длина выборки= 2000 баров.

Dependent Variable: F

Method: Panel Least Squares

Date: 12/02/12 Time: 10:29

Sample: 1 2000

Periods included: 23

Cross-sections included: 85

Total panel (unbalanced) observations: 1915

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Coefficient Std. Error t-Statistic Prob.

C(1) 0.000190 0.000729 0.260526 0.7945

C(2) 0.026179 0.029181 0.897122 0.3698

C(3) -0.020055 0.028992 -0.691745 0.4892

C(4) -0.106262 0.032127 -3.307569 0.0010

C(5) 1.099945 0.031672 34.72901 0.0000

R-squared 0.999362 Mean dependent var 1.259869

Adjusted R-squared 0.999361 S.D. dependent var 0.031014

S.E. of regression 0.000784 Akaike info criterion -11.46178

Sum squared resid 0.001174 Schwarz criterion -11.44727

Log likelihood 10979.66 Hannan-Quinn criter. -11.45644

F-statistic 748391.1 Durbin-Watson stat 2.058272

Prob(F-statistic) 0.000000

При любой длине выборки обязательным является вычисление ошибки оцениваемых коэф. А мы видим, что в последней оценке при значении коэф =0.000190 ско =0.000729. Мало того, что значение коэф смехотворно, так еще ско в 7 раз больше номинала!

Извини, Юсуф, но это очередной велосипед. Любой учебник по регрессионному анализу начинается с уравнение, подобных твоему. Но в отличие от тебя студенты умеют оценивать результат подгонки - любой из них скажет, что указанной регрессией пользоваться нельзя.

Статья "Проект Meta COT Забудьте про случайные котировки Рынок -- управляемая динамическая

Юсуфходжа 2012.12.02 07:06 #454

faa1947:

Совершенно не понимаю как оцениваются коэффициенты регрессии.

Вот методом наименьших квадратов (МНК) для EURUSD_Н1 длина выборки= 50 баров.

При любой длине выборки обязательным является вычисление ошибки оцениваемых коэф. А мы видим, что в последней оценке при значении коэф =0.000190 ско =0.000729. Мало того, что значение коэф смехотворно, так еще ско в 7 раз больше номинала!

Приведите, пожалуйста, вид исследуемого Вами уравнения регрессии.

СанСаныч Фоменко 2012.12.02 07:20 #455

yosuf:
Приведите, пожалуйста, вид исследуемого Вами уравнения регрессии.

Оно указано в посте. Вот копия:

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Для 50 баров вот с коэф.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

Но все дело в оценке этих коэф. Вы не хотите понять, что далеко не всегда, а скорее всегда оценке коэф (их значению) доверять нельзя. Это серцевина регрессионного анализа.

Нужно отвечать на вопрос: на каком основании мы верим, что вычисленные нами коэф. имеют именно то значение, которое мы видим?

Эконометрика: прогноз на один Как получить параметры Open,Low,High,Close Эконометрика: библиография

Юсуфходжа 2012.12.02 07:49 #456

faa1947:

Оно указано в посте. Вот копия:

F= C(1)+C(2)*OPEN(-1)+C(3)*HIGH(-1)+C(4)*LOW(-1)+C(5)*CLOSE(-1)

Для 50 баров вот с коэф.

F= 0.114716047564-0.0510381399594*OPEN(-1)-0.343985953799*HIGH(-1)+0.139395237588*LOW(-1)+1.16394204527*CLOSE(-1)

Но все дело в оценке этих коэф. Вы не хотите понять, что далеко не всегда, а скорее всегда оценке коэф (их значению) доверять нельзя. Это серцевина регрессионного анализа.

Нужно отвечать на вопрос: на каком основании мы верим, что вычисленные нами коэф. имеют именно то значение, которое мы видим?

По определению, МНК дает наилучшую оценку коэффициентов рассматриваемого уравнения и если они Вам не нравятся по какой-либо причине, ищите другой способ их оценки или меняйте вид уравнения. Вот стандартный подход при исследовании явлений и процессов. Если уравнение регрессии с найденными методом МНК обеспечивают относительную ошибку менее 1% (0,29% в данном случае), то я что еще хочу от этих коэффициентов? Вы зациклились с проблемой надежности коэффициентов, более надежного способа их определения, чем МНК, еще не придумали. Тем не менее, мы должны отдавать себе отчет, что любые наши рассуждения и выводы верны только в пределах рассматриваемой выборки и нет гарантии, что вне ее, включая и будущее, они останутся верными. Но, вынуждены, с определенной доли вероятности, допустить их применимость в ближайшее время. Абсолютно точно предсказать будущее не способен никто и ничто.

Адаптивные цифровые фильтры торговая стратегия на базе Разговор с искусственным интеллектом

СанСаныч Фоменко 2012.12.02 08:09 #457

yosuf:
По определению, МНК дает наилучшую оценку коэффициентов рассматриваемого уравнения и если они Вам не нравятся по какой-либо причине, ищите другой способ их оценки или меняйте вид уравнения. Вот стандартный подход при исследовании явлений и процессов. Если уравнение регрессии с найденными методом МНК обеспечивают относительную ошибку менее 1% (0,29% в данном случае), то я что еще хочу от этих коэффициентов? Вы зациклились с проблемой надежности коэффициентов, более надежного способа их определения, чем МНК, еще не придумали. Тем не менее, мы должны отдавать себе отчет, что любые наши рассуждения и выводы верны только в пределах рассматриваемой выборки и нет гарантии, что вне ее, включая и будущее, они останутся верными. Но, вынуждены, с определенной доли вероятности, допустить их применимость в ближайшее время. Абсолютно точно предсказать будущее не способен никто и ничто.

Вы почему-то не вникли в отчет по подгонке регрессии. В последней разные коэф имеют разную точность вычисления. Наилучшая 3%. Но есть и кратно превосходящие номинал.

Я ни на чем не зацикливаюсь. Просто стандартно шурую при оценке регрессии. Во всяком величины коэф не привожу без их оценки.

На счет МНК. Хочу Вас разочаровать. МНК не единственный метод, более того, метод с большим числом ограничений. Есть другие методы, не имеющих таких ограничений.

От теории к практике Обсуждение статьи "Оптимизируем стратегию торговая стратегия на базе

Дмитрий 2012.12.02 08:54 #458

yosuf:

Теперь попробуем зависимость средней цены образования очередного бара выразить в виде линейной функции типа:

F(t+1)=a0+a1*O(t)+a2*H(t)+a3*L(t)+a4*C(t)

Для выбранной истории из 15 дневных баров Д1 получены следующие значения коэффициентов:

Эти 15 дневных баров - какие брали даты?

Юсуфходжа 2012.12.02 11:38 #459

Demi:
Эти 15 дневных баров - какие брали даты?

Использованы данные на Д1 с 16. 09. 12 по 05. 10. 12

Дмитрий 2012.12.02 14:29 #460

yosuf:
Использованы данные на Д1 с 16. 09. 12 по 05. 10. 12

))))Ну я так и подумал:

1. у вас не однородная данные. В модель включены данные, характеризующие 24-х часовую динамику цены, и данные, характеризующие 4-х часовую динамику цены. Данные за воскресенье надо убирать. Это ошибку делают все.

2. у вас должно быть оптимальное количество наблюдений. Четкой формулы тут нет, но это где то от 5 до 10 наблюдений на одну переменную. У вас четыре переменные и пятнадцать наблюдений. Модель неадекватна. И не надо делать так, как делал один великий специалист на этом форуме - брать модель из четырех переменных и 5 000 наблюдений!))))

3. когда построили модель, определяете частные коеффициенты корреляции для каждой переменной. И у вас окажется, что статистически значимой является только С. Строите модель, включающую только С и коэффициент перед С будет положительный.

Из этого делаете вывод, общий для ВСЕХ моделей авторегрессии - ЕСЛИ ЦЕНА РОСЛА, ТО С БОЛЬШЕЙ ВЕРОЯТНОСТЬЮ РОСТ ПРОДОЛЖИТСЯ В БУДУЩЕМ И НАОБОРОТ. Потом выкидываете модель.

От теории к практике Предсказание рынка на основе Машинное обучение в трейдинге:

Регрессионная модель Султонова (РМС) - претендующая на математическую модель рынка. - страница 46