Обсуждение статьи "Эконометрический подход к анализу графиков" - страница 2

 
Rosh:
Добавляйте. Мы переопубликуем.
Я предлагаю ещё пообсуждать материал. Есть несколько ценных замечаний. Потом сделать некоторый update статьи :-)
 
-Alexey-:
Неверно, а вики есть ошибки. Возьмите равномерное распределение. У него эксцесс можно посчитать, а хвостов вообще нет. Т.ч. вам правильно сказали, что в общем случае связи между тяжестью, длиной, самим наличием хвостов и коэффициентом эксцесса нет. Возьмите треугольное распределение - то же самое.

Что именно неверно?

-Alexey-, честно, в той области исследования временных рядов, в частности ряда доходностей, которую описывал в статье, я вообще никогда не встречал таких распределений, о которых вы говорите (треугольное и равномерное). Очень вероятно, что они служат для совершенно других целей. Так что не нужно ссылаться на какие-то маргинальные примеры, не подберу другого слова, пардон. А если Вы что-то утверждаете, то будьте любезны, приводите конкретный аналитический пример.

Распределения которые чаще всего, если не всегда, используются в указанном анализе, - это нормальное распределение, распределение Стьюдента и распределение Коши.

 
-Alexey-:

...чтобы правомочно использовать данный коэффициент, надо во-первых определить эмпирическую функцию распределения, что не является тривиальной задачей с точки зрения математики, а во вторых в рамках некоторых вероятностных критериев проверить и принять гипотезу о том, что распределение имеет единственную моду, что для финансовых рядов выполняется далеко не всегда и также является нетривиальной задачей. Без проведения этих шагов дальнейший расчет невозможен, если для него необходим "Эксцесса коэффициент".


Ценное замечание. Если бы занимался в статье Distribution Fitting (подгонка распределения), то материала бы хватило на вторую. Возможно, в будущем или я, или кто-то ещё напишет на эту тему статью. Цель была - просто указать признаки временного ряда, которые требуют использования нелинейных моделей.

 

-Alexey-:


Ничего не написано о том, что делать, если по тесту ряд неприменим для предполагаемой модели.

Ничего не сказано о том, почему и на основании чего используется ряд так называемых "доходностей" а не какой-то другой.

Какие, чем привлекательные и для чего? Почему привлекательные, а не целесообразные? Каков обоснованный математический критерий для выбора вида преобразования?

Да, ничего не написано :-)

Потому что логика проста. Если тест, здесь Q-тест, не выявил автокорреляции, то и использовать нелинейную модель нет смысла. Пользуйтесь линейными.

Ряд доходностей используется на основании того, что обеспечивается стационарность временного ряда. Это важно например для последующего моделирования.

Цена актива нестационарна. Доходности обычно стационарны.

Кроме того, можно сравнивать различные ряды между собой, т.е., образно говоря, скрещивать ужей с ежами.

Обычно, частота ряда относительно велика (ежедневно, ежечасно и т.п.), поэтому ряд доходностей можно получать как непрерывным методом компаундирования (что мы и делали), так и простым. Разница будет небольшой.

Полагаю, вопрос о разнице терминов "привлекательные" и"целесообразные" сочтём дискуссионным.

 
-Alexey-:
А как вы считаете, критикам на защитах диссертаций стоит присутствовать, или сразу без защиты ее принимать, и начинать практические исследования. Думаю, вам интересно будет узнать, что корреляции посчитаны не совсем правильно. Критика призвана сделать материал лучше, никто и не спорит, что статья хорошая. Чтобы прибыль по вашим системам была не маленькая, а больше.

Критика крайне необходима. Ибо в споре мы находим истину, как правило.

-Alexey-, а в чём неправильность расчёта, не уточните?

Автокорреляция в рядах доходностей обычно слаба или отсутствует.

 
denkir:

Что именно неверно?

-Alexey-, честно, в той области исследования временных рядов, в частности ряда доходностей, которую описывал в статье, я вообще никогда не встречал таких распределений, о которых вы говорите (треугольное и равномерное). Очень вероятно, что они служат для совершенно других целей. Так что не нужно ссылаться на какие-то маргинальные примеры, не подберу другого слова, пардон. А если Вы что-то утверждаете, то будьте любезны, приводите конкретный аналитический пример.

Распределения которые чаще всего, если не всегда, используются в указанном анализе, - это нормальное распределение, распределение Стьюдента и распределение Коши.

Может они и используются чаще всего, но реальное распределение - не нормальное, не Коши и не Стьюдента, а как правило ближе всего к лапласовскому. Выше правильно было сказано, что задача идентификации распределения нетривиальна, но это не значит, что она невозможна. В любом случае, меня лично тесты на соответствие двойному экспоненциальному с результатом R^2 = 0,999 убеждают довольно неплохо.

Теперь насчет этого графичка:


Здесь, между прочим, нарисованы только лапласовские распределения, а значит у всех у них коэффициент эксцесса равен ровно 3. Таким образом, он вновь не имеет никакой связи с "толстотой хвостов" - она одинакова у всех представленных здесь графиков.

PS Я бы еще по поводу эконометристов прошелся, перепечатывающих друг друга из одного учебника в другой, а потом в педивикию, ну да ладно, оставлю до следующего раза.

 

Кстати, можете удивляться, но нормальное распределение на рынке я не встречал ни разу.
 

вопрос к автору статьи.

Вы интерпретируете тест Льюинга-Бокса так (цитата):

наша функция проводит Q-тест Льюнга-Бокса-Пирса и возвращает массив логических значений для заданных лагов. Если элемент массива равен false, то нулевая гипотеза о том, что на заданном лаге не имеет место автокорреляция, не отвергается.

Правильная же интерпретация согласно определению критерия должна быть такая:

наша функция проводит Q-тест Льюнга-Бокса-Пирса и возвращает массив логических значений для заданных лагов. Если элемент массива равен false, то нулевая гипотеза о том, что на лагах от 1 до заданного включительно не имеет место автокорреляция, не отвергается
Собственно вопрос. Указанное - это из категории "неправильно выразился" или все же просчет в интерпретации результатов теста?
 
alsu:

Может они и используются чаще всего, но реальное распределение - не нормальное, не Коши и не Стьюдента, а как правило ближе всего к лапласовскому. Выше правильно было сказано, что задача идентификации распределения нетривиальна, но это не значит, что она невозможна. В любом случае, меня лично тесты на соответствие двойному экспоненциальному с результатом R^2 = 0,999 убеждают довольно неплохо.

Теперь насчет этого графичка...

Здесь, между прочим, нарисованы только лапласовские распределения, а значит у всех у них коэффициент эксцесса равен ровно 3. Таким образом, он вновь не имеет никакой связи с "толстотой хвостов" - она одинакова у всех представленных здесь графиков.

alsu, я согласен, что у распределения Лапласа  коэффициент эксцесса всегда равен 3. Я тут поспешил с его оценкой, т.к давно его как в глаза не видел...  Но ещё раз повторюсь, что эконометристы именно в той области исследования, о которой писал, пользуются указанными распределениями. Если нобелевские лауреаты для Вас не есть авторитеты (e.g. Robert Engel), то я тогда пас.

Если Вы не приведёте конкретного аналитического примера, то спор считаю умозрительным.

 

denkir:

Что именно неверно?


1) Каждый коэффициент определяется по разному количеству данных, т.е. они неравнозначны статистически. Поэтому на значимость каждый коэффициен должен проверяться отдельно от других. А в тесте Льюнга-Бокса этого не происходит.

2) Уровень значимости для теста выбирается на основании чего - просто так?

-Alexey-, честно, в той области исследования временных рядов, в частности ряда доходностей, которую описывал в статье, я вообще никогда не встречал таких распределений, о которых вы говорите (треугольное и равномерное). Очень вероятно, что они служат для совершенно других целей. Так что не нужно ссылаться на какие-то маргинальные примеры, не подберу другого слова, пардон.

Так вы же не ответили - откуда взялся этот ряд доходностей, чем обоснован выбор преобразования? Без сомнения, с помощью преобразований из графика цены можно и прямую получить, только толк какой? А прочитал, вы пишете:

Ряд доходностей используется на основании того, что обеспечивается стационарность временного ряда.

Такой подход - это просто страшное загрубление с большой потерей информации. Чего прогнозировать-то тогда? На языке математики называется - подгонка данных под медод прогнозирования. Однако так нельзя поступать. Методом можно пользоваться, только если исходные данные для него приемлимы, а не резать их так, чтобы они такими стали. Это известная проблема современной статистики.


А если Вы что-то утверждаете, то будьте любезны, приводите конкретный аналитический пример.

Вот вам конкретный не аналитический, а практический пример по текущей ситуации Евро на 4х часах. Распределение по ряду остатков, которые я получаю другими преобразованиями, и знаю зачем. Видно, что распределение близко к треугольному.

И форма его может меняться самым причудливым образом, потому как этот ряд нестационарен. Откуда вы взяли, что ценовые ряды распределены по

нормальное распределение, распределение Стьюдента и распределение Коши.

- это просто нонсенс, оно таким практически очень редко бывает. Возможно, вы о другом говорите, и я вас просто не понял.
Причина обращения: