Точность статистических оценок зависит от количества наблюдений

Avals 2011.11.29 06:22 #721

faa1947:

Да, 40 маловато. Делал проверку и писал выше. После 70 дальнейшее увеличение выборки не влияет на результат. Вот результат по поводу длины выборки. Он заслуживает внимания. Оцениваются коэф модели:

EURUSD = C(1)*HP1(-1) + C(2)*HP1(-2) + C(3)*HP1_D(-1) + C(4)*EQ1_HP2(-1) + C(5)*EQ1_HP2(-2) + C(6)*EQ1_HP2(-3) + C(7)*EQ1_HP2_D(-1) + C(8)*EQ1_HP2_D(-2) + C(9)*EQ1_HP2_D(-3) + C(10)*EQ1_HP2_D(-4)

Всего их 10. Все коэф - случайные величины. Вопрос: при какой длине выборки они станут примерно константа. Приведу на одном рис. все коэф:

Здесь выборка = 80 наблюдениям. Видно, что после половины выборки все устаканивается и особенно ошибка оценки коэф. Для первого коэф приведу крупнее:

Это оценка самого коэф - видим, что его значение не константа.

А теперь ошибка оценки этого коэф:

Отсюда я делаю вывод, что выборка должна быть где-то более 60 наблюдений.

Нужны стабильные коэф с небольшой ошибкой - это мерило длин выборки!

сходимость коэффициентов модели или их ошибки к какому-то числу не определяют необходимое число наблюдений. Возьмём обычную ЛР и чем меньше данных, тем она "шустрее" будет менять свои коэффициенты, а при увеличении всё медленнее. Но это же свойство самой регрессии, а не ее точность прогнозирования ряда. И этим не определяется размер окна для вычисления регрессии.

Если вы применяете какой-то критерий, дающий числовые результаты, то нужно знать не просто число, а насколько ему можно верить в данном случае. Мат.статистика например для этого применяет ДИ

Типы оптимизации - Алгоритмический Регуляризация Moving Average - Трендовые

СанСаныч Фоменко 2011.11.29 06:31 #722

Avals:

и кстати, по поводу анализа остатков на нормальное распределение: всего 116 наблюдений это очень мало чтобы результаты оказались достоверными. Т.е. конечно, можно тест применить и он с какой-то вероятностью отнесёт распределение к нормальному, но каков доверительный интервал этого прогноза? Т.е. 25% это опять же очень приблизительная величина и м.б. диапазон 0...50 при достоверности 95% к примеру, а может 22...28. Это зависит как от числа наблюдений так и от дисперсии. Сдается мне что при 116 наблюдениях ДИ будет огромным

Не анализирую на нормальность. Зачем?

Сначала из котира неадо выделить то что можно использовать: коррелированность наблюдений. Если получили остаток без зависимостей, то надо выяснить, нет ли в нем еще каких-либо сведений, которые можно использовать - ARCH. Если есть, то моделировать (написать аналитическую формулу) и эти сведения. Идеальнай остаток такой, из которого мы не можем (не умеем, не знаем) извлечь каких-либо сведений для моделирования.

Типы данных и значения Инструкции Управление ходом времени в

СанСаныч Фоменко 2011.11.29 06:34 #723

paukas:
Вы уж определитесь как нибудь.....

Очень полезная привычка - дочитывать предложение до конца, а лучше абзац до конца, а еще лучше все что пишет автор.

СанСаныч Фоменко 2011.11.29 06:37 #724

Avals:

сходимость коэффициентов модели или их ошибки к какому-то числу не определяют необходимое число наблюдений. Возьмём обычную ЛР и чем меньше данных, тем она "шустрее" будет менять свои коэффициенты, а при увеличении всё медленнее. Но это же свойство самой регрессии, а не ее точность прогнозирования ряда. И этим не определяется размер окна для вычисления регрессии.

Если вы применяете какой-то критерий, дающий числовые результаты, то нужно знать не просто число, а насколько ему можно верить в данном случае. Мат.статистика например для этого применяет ДИ

Не очень понятна аргументация: зачем увеличивать окно, если коэф константа и ош. коэф константа? Мы это видим на рисунках.

Vladimir Paukas 2011.11.29 06:39 #725

faa1947:
Очень полезная привычка - дочитывать предложение до конца, а лучше абзац до конца, а еще лучше все что пишет автор.

Ещё более полезная привычка писать так, чтобы было понятно не только автору, но и рядовому колхознику.

Vasiliy Sokolov 2011.11.29 06:40 #726

Reshetov:

Наконец-то адепт секты, раскрыл главный секрет религиозного фокуса!

Элементарно, Ватсон! Потому что они нестационарны. Стационарность - это когда дисперсия и матожидание - константы и не зависят от выборки, на которой они измеряются. Т.е. в любой другой независимой выборке, мы должны получить примерно такие же константы. Если не получили, то гипотеза о стационарности опровергнута.

Гипотезу о стационарности можно проверить еще одним способом, если увеличить размерность выборки. В случае стационарности и дисперсия и матожидание также должны оставаться константами.

Да бросьте Вы! Главная проблема модели вовсе не в нестационарности рынка, а в самой модели, она просто не работоспособна, о чем и говорит тестер стратегий, который топикстартер упорно не хочет признавать, и в то же время сам удивляется почему его модель не работает. Стоит городить весь этот огород с R^2 и т.п. когда простое тестирование гораздо объективней говорит о том, что есть что.

Если хочется Вам так стационарности - пожалуйста, используйте эквиобъемные графики. А что, волатильность - константа, дисперсия и м.о. стало быть конечны, только вот толку будет также мало, модель как не работала на обычных графиках так и не будет работать на еквиобъемных.

Сравнительное тестирование моделей с Пользовательские символы Сравнительное тестирование моделей с

Avals 2011.11.29 06:41 #727

faa1947:

Не анализирую на нормальность. Зачем?

Сначала из котира неадо выделить то что можно использовать: коррелированность наблюдений. Если получили остаток без зависимостей, то надо выяснить, нет ли в нем еще каких-либо сведений, которые можно использовать - ARCH. Если есть, то моделировать (написать аналитическую формулу) и эти сведения. Идеальнай остаток такой, из которого мы не можем (не умеем, не знаем) извлечь каких-либо сведений для моделирования.

как не анализируете? У вас в статье это написано 1.3. Оценка остатков от уравнения регрессии

Вы получаете конкретные цифры -

"Вероятность того, что остаток распределен по нормальному закону, равна 25.57%"

АКФ и т.д и т.п.

Но эти числа не представляют ценности без указания того, насколько им можно верить.

Разве профит-фактору по 400 сделкам можно вреить так же как по 40? Так и все остальные стат.величины и численные критерии - нужна точность оценок. Доверительный интеравл один из способов это сделать. 116 наблюдений недостаточно чтобы верить результатам отнесения или неотнесения распределения к нормальному, какой бы критерий не применялся

Неявное приведение типов Методы инициализации весовых коэффициентов Операции модификации

Yury Reshetov 2011.11.29 06:43 #728

faa1947:

Поразительная глухота.

Долдоню несколько лет - котир нестационарен и его прогнозировать нельзя.

Долдоню весь топик - котир нестационарен, но его можно прогнозировать, если остаток от модели стационарен. Интерес представляет остаток, так как тогда можно сложить модель (аналитическую) со стационарным остатком. Эта сумма равна котиру, ни пипса не теряется. Сто раз писал выше. Нет одно и то же, адепт чукч, которые писатели, но не читатели.

Долдоньте дальше. Остаток нестационарен, т.к. если подогнанную под одну единственную выборку модель проверить на любой другой независимой выборке, то остаток перестанет быть константой. Можно сделать подгонку под другие выборки, но после этих самых подгонок мы получим разные модели для каждой отдельной выборки.

Еще раз повторяю для особоодаренных: стационарность можно выявить только совпадением статистических данных на разных, независимых выборках. А этого самого совпадения нет.

Весь фокус эконометрических манипуляций в том, что они нашли метод с помощью которого можно подогнать модель под какую нибудь выборку таким макаром, что все остатки в этой самой выборке будут примерно равны. Но поскольку такой фокус происходит лишь для отдельно взятой выборке и в других выборках модель дает другие результаты, то остаток нестационарен, а всего лишь подогнан под отдельную выборку. Будущее эконометрические модели экстраполировать не могут, т.к. у них еще пока нет исторических данных (они появятся лишь в будущем) под которые можно было бы подогнать модель.

Это тоже самое, что и перерисовывающий индикатор - подгоняет свои показания под конкретные данные, меняя их задним числом.

Сравнительное тестирование моделей с Сравнительное тестирование моделей с Постановка задачи

Avals 2011.11.29 06:44 #729

faa1947:

Не очень понятна аргументация: зачем увеличивать окно, если коэф константа и ош. коэф константа? Мы это видим на рисунках.

я не предлагаю увеличивать окно для вычисления коэф-тов регрессии. Окно для этого определяется не сходимостью их к числу. Я говорю о кол-ве наблюдений и как оно влияет на точность оценок применяемых вами критериев и стат.оценок

Распределенные вычисления в сети Архитектурные решения повышения сходимости Механизмы внимания

[Удален] 2011.11.29 06:49 #730

в статистике эмпирическое правило такое выработано -- точек должно быть не менее 300 -- это нижняя граница.

Эконометрика: прогноз на один шаг вперед - страница 73