Странности в книге Булашева "Статистика для трейдеров"

hrenfx 2010.09.06 10:24

Занимаясь вопросами мультивалютного анализа смотрел-читал кое-что... И, в частности, попалась в CodeBase Библиотека статистических функций. Глянул код, и сразу бросилось в глаза, что дисперсия и ковариация считаются неправильно. Автор библиотеки утверждает, что взял формулы из книги Булашева "Статистика для трейдеров" и приложил ее. Посмотрел книгу. И вот что там:

Цитата из книги Булашева

Красным подчеркнул то, что видится неправильным. И так по всей книге...

Посмотрев книгу дальше не понял, зачем Булашев в задаче по оптимизации портфеля вводит ограничения на веса активов в портфеле:

Цитата из книги Булашева

Видимо, автор вводит их, чтобы показать решение задачи численным методом Монте Карло. Потому что задача без подобных ограничений - портфель Марковица и имеет аналитическое простое решение.

Честно скажу, не знаю теории вероятностей, немного только ознакомился. А тут Булашев со своей книгой...

Evgeniy Logunov 2010.09.06 10:30 #1

https://ru.wikipedia.org/wiki/%D0%9D%D0%B5%D1%81%D0%BC%D0%B5%D1%89%D1%91%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BE%D1%86%D0%B5%D0%BD%D0%BA%D0%B0

hrenfx 2010.09.06 10:58 #2

lea:
https://ru.wikipedia.org/wiki/%D0%9D%D0%B5%D1%81%D0%BC%D0%B5%D1%89%D1%91%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BE%D1%86%D0%B5%D0%BD%D0%BA%D0%B0

На кой меня в википедию тыкать?! Сами-то читали, что там написано?

То, что Булашев называет "выборочная дисперсия", в вики называется "Несмещённая (исправленная) дисперсия" и не совпадает с определение вики "выборочной дисперсии".

Но дело не в терминах. Какой смысл вкладывается в "несмещенную дисперсию"? Почему ее мат. ожидание равно сигме в квадрате? И как тогда считалась эта сигма для выборки?

И что с ковариацией по-Булашеву?

Блин, взял Mathcad и посмотрел, как он считает матричные дисперсии и ковариации. Ну нет там никаких "несмещенных" понятий. Зачем они?!

P.S. Дисперсия по-Булашеву вот такой выборки {1, 3} равна двум.

Теорема Бернулли, Муавра-Лапласа; Критерий Рассчитать вероятность разворота Bayesian regression - Делал

Hide 2010.09.06 11:16 #3

Используй как у Булашева, т.е. несмещённую оценку.

hrenfx 2010.09.06 11:31 #4

HideYourRichess:
Используй как у Булашева, т.е. несмещённую оценку.

Хотелось бы понять смысл такой оценки. Посмотрите P.S. в моем посте выше.

hrenfx 2010.09.06 12:31 #5

Сплошь и рядом попадаются примеры, где теорвер применяется ну совсем не по назначению. Например, народ оценивает среднеквадратичное отклонение и совсем не задумывается над его смыслом.

Знаете, почему говорят про среднеквадратичное отклонение, а не среднекубическое или среднелинейное? Да потому что расчеты со среднеквадратичным делать было проще и лаконичней, когда строили теорвер.

А народ, вместо того, чтобы нормально оценить разброс выборки через среднелинейное отклонение (не квадрат, а модуль (и корня никакого)), автоматом делает то, чему их научили в школе-универе: среднеквадратичное. Блин, топором гвозди забивать.

Статистикам торговая стратегия на базе Оценка погрешности прогноза

hrenfx 2010.09.06 13:00 #6

Раз каснулся темы оптимизации(минимизации), то рекомендую ознакомиться с численными методами оптимизации и наглядными примерами безусловной минимизации методами Фибоначчи и градиента.

Hide 2010.09.06 13:08 #7

hrenfx:

Хотелось бы понять смысл такой оценки. Посмотрите P.S. в моем посте выше.

Если совсем по-простому, то обычные формулы тер.вер. расчитаны на то, что N стремится к бесконечности. Но на практике, выборочные значения, N гораздо меньше бесконечности. При небольших N возникает небольшая систематическая ошибка, она то и исправляется в несмещённой оценке. Считается, что при N>30 можно использовать обе величины, так как они становятся очень близки друг другу. Примерно так. Подробности - в книжках.

и снова случайное блуждание... Удаление лишних стрелок индикатора Небольшое замечание разработчикам

hrenfx 2010.09.06 13:13 #8

HideYourRichess:
Если совсем по-простому, то обычные формулы тер.вер. расчитаны на то, что N стремится к бесконечности. Но на практике, выборочные значения, N гораздо меньше бесконечности. При небольших N возникает небольшая систематическая ошибка, она то и исправляется в несмещённой оценке. Считается, что при N>30 можно использовать обе величины, так как они становятся очень близки друг другу.

Все тот же пример: выборка {1, 3} N = 2. Несмещенная дисперсия равна двум. Выборочная (нормальная) равна единице. Где ошибка?

Hide 2010.09.06 13:22 #9

hrenfx:
Все тот же пример: выборка {1, 3} N = 2. Несмещенная дисперсия равна двум. Выборочная (нормальная) равна единице. Где ошибка?

Ошибка в том, что нужно было изучать в своё время предмет мат.статистику. Там не всё так просто, по этому, если нет желания грызть гранит науки - делайте как говорят. Или не делайте, как хотите. Кроме того, мат.статистика обычно не оперирует выборками в N=2.

Краудсорсовый GUI. Открытое бета-тестирование. Матстат Эконометрика Матан SOS, SOS, SOS

hrenfx 2010.09.06 13:33 #10

HideYourRichess:
Ошибка в том, что нужно было изучать в своё время предмет мат.статистику.

Мое время - сейчас.

Без изучения мат. статистики вижу, что выборка {1, 3, 1, 3, 1, 3, 1, 3, .....} имеет нормальную дисперсию единица. А несмещенная дисперсия имеет отклонения, которые таят с ростом N.

По аналогии с несмещенной дисперсией считают и несмещенную ковариацию. В чем несмещенность - непонятно. Но при решении задач, оперируемых понятиями дисперсии и ковариации (например, выбор портфеля Марковица), подобные вольности с несмещенностью приводят к грубостям.

Понимаю, что для малых N никто аппарат не применяет, но раз на больших N ошибка не большая - это не значит, что надо это ошибку не признавать.

Прошу мне, необразованному, показать место, где описано обоснование применимости "несмещенных" оценок.

Bayesian regression - Делал Проверка на коинтеграцию нескольких Динамическое моделирование

1 2 3 4

Новый комментарий