Статистика зависимостей в котировках (теория информации, корреляция и другие методы feature selection) - страница 16
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
А я концептуально додумал дальнейших ход исследований (пишу для заинтересованных, а не ругающихся на языке формул). Если мы имеем зависимости по волатильности (зависимость как от ближайших лагов, так и цикличную - 24-часовую для H1), то почему бы не посчитать ту же взаимную информацию для returns взятых по модулю (это и будет в чистом виде волатильность), а затем полученное количество информации вычесть из сходного (где возвраты были со знаком +-). Если все корректно обсчитать, то в отстаке будем иметь зависимость по знакам. Вот это дело уже можно сравнить с шумовым временным рядом.
даже если будет найдено что-либо нетривиальное, то всегда останется вопрос правильного применения формул и главное как это применять на практике. Т.е. интерес чисто академический)))
Но не могли бы Вы, Алексей, более чётко сформулировать ( по своей таблычке) какой гипотезе о распределении возвратов соответствую оценки хи-квадрат?
Приснописному "броуну", или что-то покруче?
А никакой. При оценивании зависимости хи-квадратом никаких гипотез о распределениях не измышляют. Получается, что это непараметрический критерий.
А никакой. При оценивании зависимости хи-квадратом никаких гипотез о распределениях не измышляют. Получается, что это непараметрический критерий.
В смысле никакой?
Можно написать оцениваемую зависимость?
Может после формулок я вкурю. Или Вы надеетесь на равномерное распределение...
;)
даже если будет найдено что-либо нетривиальное, то всегда останется вопрос правильного применения формул и главное как это применять на практике. Т.е. интерес чисто академический)))
Можно написать оцениваемую зависимость?
Может после формулок я вкурю. Или Вы надеетесь на равномерное распределение...
Да никакой, правду говорю. Hypotheses non fingo.
Вы когда-нибудь пробовали применять критерий хи-квадрат независимости величин? Я и сам несколько месяцев назад этого не умел, но вот взял и сделал. Попробуйте и Вы, там ничего сложного нет. Найдите методичку по матстату для какого-нибудь заштатного заведения и прочитайте. Чем проще и нагляднее будет расписана метода, тем быстрее вкурите.
На самом деле критериев хи-квадрат несколько. Но я говорю именно о том, который оценивает независимость величин. Этот критерий не оценивает ее, исходя из заданных априори распределений. Он всего лишь проверяет гипотезу о независимости двух величин при заданном уровне значимости (обычно 0.95 или 0.99). Чем ближе уровень значимости к 1, тем достовернее заключение.
Идеологическая основа критерия - обычная формула совместной вероятности двух величин. На пальцах: если P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) для любых допустимых x1,y1, то величины X и Y независимы. И наоборот. А хи-квадрат считает, грубо говоря, взвешенную сумму отклонений от этого равенства по всем возможным случаям и сравнивает с некоей граничной. Если полученная сумма больше этой граничной, то гипотеза о независимости величин (Нулевая) не принимается. Если меньше, то Нулевая не отвергается.
Да никакой, правду говорю. Hypotheses non fingo.
Вы когда-нибудь пробовали применять критерий хи-квадрат независимости величин? Я и сам несколько месяцев назад этого не умел, но вот взял и сделал. Попробуйте и Вы, там ничего сложного нет. Найдите методичку по матстату для какого-нибудь заштатного заведения и прочитайте. Чем проще и нагляднее будет расписана метода, тем быстрее вкурите.
На самом деле критериев хи-квадрат несколько. Но я говорю именно о том, который оценивает независимость величин. Этот критерий не оценивает ее, исходя из заданных априори распределений. Он всего лишь проверяет гипотезу о независимости двух величин при заданном уровне значимости (обычно 0.95 или 0.99). Чем ближе уровень значимости к 1, тем достовернее заключение.
Идеологическая основа критерия - обычная формула совместной вероятности двух величин. На пальцах: если P(X=x1 && Y=y1) = P(X=x1)*P(Y=y1) для любых допустимых x1,y1, то величины X и Y независимы. И наоборот. А хи-квадрат считает, грубо говоря, взвешенную сумму отклонений от этого равенства по всем возможным случаям и сравнивает с некоей граничной. Если полученная сумма больше этой граничной, то принимается гипотеза о зависимости величин. Если меньше, то гипотеза о независимости не отвергается.
Не смешите...
Вам задали про гипотезу о распределении, а Вы о том, что только вчера об этом методе узнали.
Я настойчиво хочу узнать - какая нулевая гипотеза? Что они независимы?
Нулевая - "возвраты независимы". Ничего смешного, чесслово!
Никаких гипотез о распределениях я не проверял! Это другой хи-квадрат. А я проверял только зависимость!
Если Вам так хочется проверить распределение, - пожалуйста. С приличной точностью оно лапласовское.
Нулевая - "возвраты независимы". Ничего смешного, чесслово!
Никаких гипотез о распределениях я не проверял! Это другой хи-квадрат. А я проверял только зависимость!
Если Вам так хочется проверить распределение, - пожалуйста. С приличной точностью оно лапласовское.
Ок!
бум смотреть.
---
гипотеза о независимости равнозначна гипотезе о равномерном распределении или нормальном?
Я хочу это выяснить.
Тогда при "лапласовости" - всё понятно.
А я концептуально додумал дальнейших ход исследований (пишу для заинтересованных, а не ругающихся на языке формул). Если мы имеем зависимости по волатильности (зависимость как от ближайших лагов, так и цикличную - 24-часовую для H1), то почему бы не посчитать ту же взаимную информацию для returns взятых по модулю (это и будет в чистом виде волатильность), а затем полученное количество информации вычесть из сходного (где возвраты были со знаком +-). Если все корректно обсчитать, то в отстаке будем иметь зависимость по знакам. Вот это дело уже можно сравнить с шумовым временным рядом.
Можно я по своему текущий момент сформулирую?
Итак, выбранный подход показывает наличие зависимостей. Наиболее очевидная, резонная и видимая невооружённым глазом зависимость - суточная периодичность волатильности.
Поэтому мне логичным следующим шагом исследования представляется попытка исключить из данных эту очевидную и очень сильную зависимость и посмотреть, покажет ли наш(ваш) метод наличие других зависимостей.
В качестве метода исключения я предлагаю просто отнормировать приращения на суточный профиль волатильности.