Теорема Бернулли, Муавра-Лапласа; Критерий Колмогорова; Схема Бернулли; Формула Байеса; Неравенства Чебышева; Закон распределения Пуассона; Фишер, Пирсон, Стьюдент, Смирнов и др. теоремы, модели, простым языком, без формул. - страница 6

 
sergeyas:

Давайте сначала послушаем материал в изложении Алексея раз он взялся первым.

Юсуф и все остальные,пожалуйста не воспринимайте это как умаление Ваших знаний по теме.

А так вместо последовательности начинается нагромождение дополнительной терминологией и забеганием вперед.



Это болезнь трейдунов. Бояццо не успеть кнопочку нажать. Я сам такой.
 

Понятие нормального распределения из гл № 9 книжки "Боллинджер о лентах Боллинджера"

 
 

Ветка обещает стать хорошей копилкой знаний.

Еще давно я решил на практике получить нормальное распределение, для чего провел численный эксперемент. Берется 500 аккумулятивных серий из 10 000 независимых испытаний. Получаем 500 случайных не связанных между собой графиков. Берем для них единую точку отсчета и смотрим, как они будут расходится между собой со временем, а точнее с увеличением количества испытаний. Так вот, их расходимость будет подчиняться нормальному закону распределения и в своей совокупности они будут образовывать колокол нормального распределения:

Что интересно, среднее разбегание будет равно квадратному корню от количества испытаний. Так, через 1000 бросков мы вправе ожидать, что в среднем, любая из серий, будет находится от своего первоначального нулевого положения на растоянии 32 пунктов, а через 10 000 бросков лишь на растоянии 100 пунктов. Это видно по форме колокола. Сначала он достаточно резко расходится в стороны, а зетем "скорость" расхождения начинает угасать.

Интересным фактом является то, что сумма всех 500 серий не зависимо от количества испытаний в них будет равна приблизительно нулю. Это прекрасно видно на картинке: 50% серий через 10 000 испытаний были выше нуля, тогда как 50% были выше нуля. Таким образом, среднее состояние или математическое ожидание всех систем будет стремиться к нулю.

С связи с этим у меня возникает вопрос к знатокам: каким образом рассчитать отклонение фактического математического ожидания от теоретического, нулевого МО? Ведь, естественно, что нечего ожидать что сумма всех испытаний будет четко равна 0. Она может быть равна +3 или -20 или около того. И второй подвопрос: будет ли эта величина ошибки с увеличение испытаний коллапсировать в ноль или будет "замораживаться" на уровне пропорциональному квадратному корню из количества испытаний?

 
C-4:

каким образом рассчитать отклонение фактического математического ожидания от теоретического, нулевого МО? Ведь, естественно, что нечего ожидать что сумма всех испытаний будет четко равна 0. Она может быть равна +3 или -20 или около того. И второй подвопрос: будет ли эта величина ошибки с увеличение испытаний коллапсировать в ноль или будет "замораживаться" на уровне пропорциональному квадратному корню из количества испытаний?


сб это сумма независимых случайных величин. Пусть приращения распределены нормально с мо=0, ско=X. Тогда сумма N приращений тоже НР с мо=0, ско=SQRT(N)*X, что у тебя и показано на рисунке (N там равно 10000).

Если взять сумму M таких независимых сб, то она так же буден распределена нормально с мо=0, ско=SQRT(M*N)*X

Поэтому с увеличением числа испытаний сумма не будет замораживаться или стремиться к нулю, а наоборот будет увеличиваться пропорционально корню из числа испытаний. Но среднеарифметическое (ещё и деленное на число испытаний), будет сходиться к нулю при увеличении числа испытаний в силу рассматриваемой уже теоремы Бернулли

 
Что такое "хвосты" в распределении? Это выбросы, явно выбивающие из общей картины распределения?
 

Если взять сумму M таких независимых сб, то она так же буден распределена нормально с мо=0, ско=SQRT(M*N)*X

Так, попробую решить задачу: дано 10 аккумулятивных серий из 10 000 испытаний в каждой. Итоговый результат серий следующий:

1
145
2
-32
3
-80
4
25
5
-172
6
102
7
78
9
-121
10
95
Итого
40

Сумма M независимых сб равна +40. Подставляем результат в формулу: SQRT(40*10 000) * 100 = 63 245. Что-то не адекватный результат получается. Видимо я неправильно понял что означает "сумма М".

Или здесь имеется в вииду, что все эксперименты нужно выстроить в цепочку один за другим и анализировать отклонение итогового результатата от М.О.?

 
C-4: Еще давно я решил на практике получить нормальное распределение, для чего провел численный эксперемент. Берется 500 аккумулятивных серий из 10 000 независимых испытаний. Получаем 500 случайных не связанных между собой графиков. Берем для них единую точку отсчета и смотрим, как они будут расходится между собой со временем, а точнее с увеличением количества испытаний. Так вот, их расходимость будет подчиняться нормальному закону распределения и в своей совокупности они будут образовывать колокол нормального распределения:

Не очень удачная идея для иллюстрации нормального распределения. Я не уверен в том, что остановка процесса, скажем, на 10000 даст в сечении именно нормальное распределение. Кроме того, у этого распределения параметры постоянно меняются.

Если я ошибаюсь - дайте ссылку, где утверждается, что распределение "сечения" (т.е. отклонений от нуля) хотя бы асимптотически нормально.

SProgrammer: Понимание ( прочувствование до печенок ) этого есть ключ к пониманию 90% в теорвере.

Без формул не прочувствуешь до печенок. Ты же сам знаешь. Но тут формулы - низзя.

yosuf: Это свидетельствует о том, что решения уравнений материального баланса и закономерности тервера совпадают и они взаимно дополняют друг друга при интерпретации результатов анализа явлений.

Вы не слышали, что гамма-функция встречается в самых разных областях науки и техники?

Не вижу ничего сверхъестественного в ее появлении при решении дифуры. И о гамма-распределении Вы заговорили только потому, что увидели, как эта функция называется в Экселе. Ну какая в Ваших дифурах связь с тервером, Юсуф?!

SProgrammer правильно говорит, что в тервере/матстате реально используемых распределений очень немного - хотя придумать их можно сколько угодно. Вот и Вам, если уж так до сих пор цепляет (18), рекомендую попытаться поразмыслить об Эрланге и откуда он у Вас взялся. Только постарайтесь выкладывать размышления не в виде многозначительных заключений типа цитаты выше, а в более законченном виде.

Посмотрел Феллера, т. 2. Есть кое-что о гамма-распределении, но там жуткие формулы, и об Эрланге только пара слов. Так что - не тут.

Но о показательном распределении есть кое-что интересное (Феллер, т. 2, стр. 69):


Это особенно интересно потому, что распределение возвратов цены неплохо аппроксимируется распределением Лапласа.
 
C-4:

Так, попробую решить задачу: дано 10 аккумулятивных серий из 10 000 испытаний в каждой. Итоговый результат серий следующий:

1
145
2
-32
3
-80
4
25
5
-172
6
102
7
78
9
-121
10
95
Итого
40

Сумма M независимых сб равна +40. Подставляем результат в формулу: SQRT(40*10 000) * 100 = 63 245. Что-то не адекватный результат получается. Видимо я неправильно понял что означает "сумма М".

Или здесь имеется в вииду, что все эксперименты нужно выстроить в цепочку один за другим и анализировать отклонение итогового результатата от М.О.?


Василий, начнём с начала. Вы моделировали случайное блуждание как куммулятивную сумму приращений типа монетки? Два исхода +1 и -1 с равными вероятностями 0.5/0.5. Эта случайная величина само-собой не распределена нормально - это дискретное распределение с 2м значениями. Его МО=0, а СКО=SQRT(0.5*0.5)=0.5

Далее уже рассматриваем случайное блуждание как сумму этих приращений. Допустим возьмем 10000 приращений как у Вас. Чему оно будет равно? Ясно что это случайная величина (уже вторая). Если приращения независимы, то это распределение будет сходиться к нормальному с ростом числа испытаний с МО=0, СКО=SQRT(10000)*0.5=50. Из этого и правила 3х сигм например можно получить, что более 99% реализаций этой СВ попадут в интервал -150...+150. Т.е. вне этого интервала менее 10000*0.01=100 реализаций СВ.

Далее Вы уже рассматриваете сумму этих СВ. У Вас в столбике как раз сумма из 10 реализаций этой СВ. Это будет новая (уже третьтя) СВ, которая так же распределена нормально с МО=0, СКО=50*SQRT(10)=158. То что у Вас в сумме получилось +40 - это только одна реализация этой третьей СВ. Но изменяется она весьма в широких пределах. Опять же, 99% данных будут лежать в диапазоне -474...+474

 
Киты теорвера забыли про мой маленький вопрос(
Причина обращения: