Статистика зависимостей в котировках (теория информации, корреляция и другие методы feature selection) - страница 23
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
... и в каком сочетании?"
Это сложнее. Намного сложнее и затратнее по вычислениям. Скажу так: набор информативных переменных отобрать просто, убрать из них избыточные (взаимоинформативные) посложнее; а подобрать пары, тройки.... до куда хватит компьютера, переменных, чьи сочетания влияют на целевую переменную - это сложнее в экспоненциальной прогресии, во-первых, из-за колоссальных вычислений.
Очень странно, что полученное распределение для GARCH(1,1) имеет вид нормального. Скажу больше, этого просто не может быть. Фирменной фишкой подобных моделей является толстохвостость и вытянутость, - прямо для подражания реальным рыночным распределениям. По всей видимости полученный график просто не показателен, либо период учета волатильности (P=1, Q=1) не достаточно большой, отсюда хвостатость проявляется слишком слабо.
Но интересно другое:
На расчетном графике четко виден след влияния GARCH(1,1), а именно на первом лаге видно показательное возмущение "взаимосвязи" и неопределенность на всех остальных данных. Именно так и должно быть, ведь модель помнит только волатильность предыдущего бара. Уверен, что для GARCH(3,3) будет четкое выделение первых трех лагов, для GARCH(20, 20) первых двадцати лагов и т.д.
Попробую повоевать с MathLab'ом и все-таки добиться от него данных GARCH(20, 20). Если их анализ покажет взаимосвязь на 20 периодов, дело ясное - формула показывает взаимосвязь волатильности.
Попробую повоевать с MathLab'ом и все-таки добиться от него данных GARCH(20, 20). Если их анализ покажет взаимосвязь на 20 периодов, дело ясное - формула показывает взаимосвязь волатильности.
Не стоит. Я и так знаю, что формула ЭТО учитывает... Взгляните на график 5-ти минуток. Очевидная зависимость волы на ближайших лагах и на лаге 288 - суточный цикл. Хотя, если хочется, валяйте. Проверю.
Мы то пытаемся отыскать "другие зависимости", ведь взаимная информация вбирает в себя ВСЕ возможные зависимости. Надо их уметь отделять.
EURUSD H1.
I по исходному ряду (та же дискретизация на 5 квантилей):
Сумма взаимной информации: 3,57 Бита! Самое большое значение из всех протестированных таймфреймов.
А теперь возьмем returns ^ 2, избавимся от знака, изучаем волатильность:
Похоже. Но сумма I = 5,35 Бита.
Логично! Ведь, неопределенность по ряду чистой волатильности меньше.
А что будет если из одно вычесть другое?
Черт побери. Мне в твоих матрицах почудились пробит и логит. Заглянул в поисковик - и к чему они тут... потом понял, что это просто вероятность и ее логарифм.
P.S. Лю-у-у-у-ди, вам все понятно в этих табличках? Если непонятно - спрашивайте, спрашивайте. За глупые вопросы бить не будем (т.к. я и сам себя тут немного дурачком ощущаю).
В кои-то веки нарисовалась приличная тема, в которой почти нет стёба, ехидства и ориентации на немедленную рыбу вместо удочки - зато есть очень интересный процесс поиска истины...
Где в эконометрике можно найти такие вопросы?
Верно, рынок сложнее. Однако это не повод игнорировать наблюдаемый феномен
Я не занимаюсь научными исследованиями на рынке. Цель конкретная - сделать прогноз на шаг вперед.
Насчёт тестов: гетероскедастичность returns - общепризнанный в литературе факт
Это лозунг, который говорит, что где-то что-то видел. От чтения этих публикаций денег у меня больше не становится.
Если быть точным, то на гетероскедастичность исследуется не только ретернс, которые вычисляются по разным формулам, а остатки моделей, причем именно это является стандартом в в пакетах эконометрики.
Иногда тесты на гетероскедастичность применяют к предикторам и ошибкам модели.
Если под "ошибки модели" вы имеете ввиду остаток от модели = разность между исходной котировкой и моделью, то я согласен. Причем тесты на гетероскедастичность применяются не иногда, а всегда. Если в остатке от модели имеется гетероскедастичность, то она моделируется, а конечная цель совокупной модели - это получение стационарного остатка (мо и дисперсия - константа). Если мо и/или дисперсия переменные величины - то прогноз не возможен, так как ошибка прогноза становится переменной величиной.
В кои-то веки нарисовалась приличная тема ..
Хотелось бы заметить, что все посты, которые ставили под сомнение приличность темы, были проигнорированы.
EURUSD H1.
I по исходному ряду (та же дискретизация на 5 квантилей):
Я правильно помню что в качестве исходных данных здесь модуль процентных приращений?
Но если так, то это по сути та же волатильность (то есть её монотонная и однозначная функция), можно ожидать что все связанные с волатильностью эффекты будут проявляться и здесь, пусть и в несколько фильтрованном виде. И поскольку эффекты волатильности видимо далеко превосходят по силе все остальные феномены рынка, перспектива разглядеть на их фоне "что-то ещё" выглядит довольно проблематично. Я, повторюсь, считаю более перспективным пытаться последовательно исключать из исходных данных известные, но "бесполезные" эффекты.
Кстати, Алексей (Mathemat), у тебя исходные данные тоже модули?