Теорема Бернулли, Муавра-Лапласа; Критерий Колмогорова; Схема Бернулли; Формула Байеса; Неравенства Чебышева; Закон распределения Пуассона; Фишер, Пирсон, Стьюдент, Смирнов и др. теоремы, модели, простым языком, без формул. - страница 8

 
Mathemat:
Делайте как хотите. Я не могу советовать, т.к. не знаю характеристик тикового процесса.

Речь не о том, что бы сымитировать реальный тиковый процесс. Наоборот, все что мне нужно пока, это классические нормальные распределения в форме OHLC. Грубо говоря задача сводится к тому, что бы определить High и Low, если Open = Close-1, а Close = sqrt(N), где N - количество тиков.
 
C-4:

Речь не о том, что бы сымитировать реальный тиковый процесс. Наоборот, все что мне нужно пока, это классические нормальные распределения в форме OHLC. Грубо говоря задача сводится к тому, что бы определить High и Low, если Open = Close-1, а Close = sqrt(N), где N - количество тиков.

насколько я помню, для случайных рядов длина тела свечи |Close-Open| равна в среднем сумме длин верхней и нижней тени. Поэтому смоделировав Close как sqrt(N), потом моделируем длину верхней тени как |sqrt(N/4)| и аналогично нижнюю тень. Конечно, это вариант симметричного сб (мо=0). Для несимметричного немного иначе
 
Avals:

насколько я помню, для случайных рядов длина тела свечи |Close-Open| равна в среднем сумме длин верхней и нижней тени. Поэтому смоделировав Close как sqrt(N), потом моделируем длину верхней тени как |sqrt(N/4)| и аналогично нижнюю тень. Конечно, это вариант симметричного сб (мо=0). Для несимметричного немного иначе

хотя нет, так будет неправильно. Потому что длина тела свечи и длины теней зависимы. Поэтому лучше нагенерить из тиков достаточно много свечей, а затем новые ряды получать как взятие произвольной свечи из этого набора, чем искать аналитическое распределение теней
 

Я вот подумал, а почему бы не сделать проще: берем четыре сгенерированные величины: первая - будет разницой между Open и Low, сумма второй и третей - разницой между Low и High, четвертая - разницей между High и Close:

При больших колчиствах данных Close будет сходится с Open, а Размах High-Low будет иметь двойную дисперсию от величины отрезков (четырех чисел с заданной дисперсией).

 
C-4:

Речь не о том, что бы сымитировать реальный тиковый процесс. Наоборот, все что мне нужно пока, это классические нормальные распределения в форме OHLC. Грубо говоря задача сводится к тому, что бы определить High и Low, если Open = Close-1, а Close = sqrt(N), где N - количество тиков.

Когда-то, давным-давно, я возился с генерацией рандомных искусственных котировок. Делал следующим образом - для каждой минутки находил 3 независимых случайных величины H, L и dlt - смещение за бар. Находил их по Гауссу (в пунктах) с матожиданием ноль и заданной дисперсией. При этом полученное значение брал по модулю. Еще, случайно, 50/50 выбиралось направление смещения - sgn. Tаким oбразом Close = Open+sgn*dlt, для нахождения Hg брал большее из (Open, Close) и прибавлял к нему H, для нахождения Lw соответственно меньшее из (Open, Close) и отнимал от него L.

Само собой полученные котиры сравнивал с настоящими (правда на уровне субъективного восприятия). Очень поразило тогда то, что единственной величиной которая определяет "похожесть" искусственных котир на настоящие является дисперсия смещения - dlt. Чтобы было похоже на естественные котиры, дисперсия смещения должна быть очень маленькой, т.е. большая часть минутных смещений равняться нулю. В противном случае получался сверх-волатильный рынок. Дисперсии Hg и Lw влияли на степень ''мохнатости" котира. Для того чтобы имитировать тренд, чуть-чуть менял вероятность выбора направления - 49/51 - получался мощный тренд если смотреть его на сутках.

Вобщем в итоге получилась очень простая модель генерации разных режимов - требовался высоко-волатильный тренд - увеличивал дисперсию смещения и менял вероятность направления. Нужно было низковолатильный флэт - дисперсию смещения делал совсем мизерной, а направление 50/50.

 
C-4:

Я вот подумал, а почему бы не сделать проще: берем четыре сгенерированные величины: первая - будет разницой между Open и Low, сумма второй и третей - разницой между Low и High, четвертая - разницей между High и Close:

При больших колчиствах данных Close будет сходится с Open, а Размах High-Low будет иметь двойную дисперсию от величины отрезков (четырех чисел с заданной дисперсией).

Идеи bootsraр не подходят?
 
C-4:
...но это очень медленный и бессмысленный метод.

Не такой уж и медленный, прикурить не успеешь.

 
faa1947:
Идеи bootsraр не подходят?


Что такое bootsrap?

Integer:

Не такой уж и медленный, прикурить не успеешь.

Попробую на чистом C# реализовать.
 

У меня вопрос по теме

Пытаюсь понять область применения следующих распределений:

Обобщённое Распределение Парето (GPD) и Распределение Экстремальных Значений (GEV)

Какова связь этих распределений между собой, с нормальным распределением и соответственно с равномерным распределением? Другими словами как в реальной жизни могут возникать события которые ими описываются?

 
C-4:


Что такое bootsrap?


Есть в ВИКИ.

Идея в том, чтобы поменять случайно имеющуюся выборку так, чтобы получить сходимость частот к вероятности имеющиеся на выборке параметры.

Причина обращения: