Распределение ценовых приращений - страница 14

 

Про фрактальность распределения рисков на всех тф - верно подметили. Об этом собсно сам создатель фракталов и писал, и еще много кто. 

https://ru.wikipedia.org/wiki/Фрактальный_анализ_рынка

Насчет этого вообще прикол - изначально эту страничку я писал, и была ссылка на мой сайт, которого уже нет :)) Но Алмазов залез и переписал все под себя, смешно :)) 

Изначально я делал ее потому что она в поисковиках отлично позиционировалась, и были прямые переходы на сайт. Чето ржу :)

Кстати, @Alexander_K, может быть ответ отчасти и кроется в ф-ии В-М, может быть для нее тоже статистику сделать? :)
 
Alexander_K:
 

Нелегкая была задача. Потребовалось найти некий инвариантный статистический параметр, который бы не менялся при увеличении/уменьшении объема выборки тиковых данных. Этим параметром оказался непараметрический коэффициент асимметрии (nonparametric skew). Возможно есть еще какие-либо. но и этого достаточно для доказательства.

При расчетах использовался динамический буфер тиковых данных типа FIFO. Анализировалась пара EURJPY на генеральной совокупности 1.500.000 котировок т.е. по сути анализировались 1.500.000 последовательных выборок с разницей в 1 котировку. Получены следующие результаты для среднего значения skew взятого по модулю для разного объема выборок. 

s(10.000) = 
0.185807626294058
s(11.000) = 

0.186043748375457

s(12.000) = 

0.18560474492056

s(13.000) = 

0.184953481402386

s(14.000) = 

0.184985234902438 и т.д.

Проще говоря - при любом объеме выборки тиковых данных непараметрический коэффициент асимметрии остается постоянным.

Вывод: действительно, на маленьких ТФ наблюдаются такие же процессы, что и на больших и торговая система, работающая на одном ТФ будет работать и на другом и наоборот.

Но, вот что интересно - получается прямо мистическая вещь - оказывается на Форексе "гуляет" некое 1 распределение со странным средним (подчеркиваю - средним) непараметрическим коэффициентом скошенности = 0.185 (по модулю). Такого распределения лично я не знаю... Может кто поможет определить?

Т.е. по-простому - в разные моменты времени это распределение как бы "рождается", "формируется" и "умирает", и процесс начинается сначала. В разные моменты времени это распределение имеет разные skew, но в среднем это распределение скошено с коэффициентом = 0.185 и он инвариантен.

Пока не пойму что это за распределение в его среднем виде - дальше исследовать смысла нет...

С уважением,

Александр.

Есть 4 вопроса и один ответ. Вопросы:

1. "динамический буфер тиковых данных типа FIFO" - встречаю второй раз в Ваших сообщениях, думаю, пора уточнить. Правильно ли я понял, Вы используете изначально бухгалтерский термин "первый пришел - первый ушел" способа обработки пачек документов, который с появлением ЭВМ и стековой организации дынных стал применяться для области памяти "стек", где работающие с этой памятью функции каждая по отдельности не имеет информации о том, что лежит в стеке выше и ниже доступной этой функции области памяти?

Если да, то зачем? Здесь все знакомы с понятием скользящей средней, и последовательность обработки курсов в ней для всех однозначна. И в то же время все знают, что это не стек, а ряд, в котором все курсы известны - массив, допускающий обработку  не только крайних элементов. Может быть, для понятности лучше убрать бухгалтерскую терминологию? Честно признаюсь, после того, как Вы делали выборки из временных рядов "с экспоненциально распределенным временем", у меня возникают сомнения, верно ли я понимаю, что данные обрабатывались с помощью скользящей выборки по 10, 11..14 тыс. элементов подряд по времени.

2. О "генеральной совокупности 1.500.000" - ведь Вы уже писали, что это выборка ориентировочно за месяц, зачем вводить людей в заблуждение? Вики:

Генеральная совокупность (от лат. generis — общий, родовой) (в англ. терминологии — population) — совокупность всех объектов (единиц), относительно которых предполагается делать выводы при изучении конкретной задачи.

Выводы то Вы делаете сразу для Форекс...

3. "Nonparametric skew" - верно я понял, что говорите об этом параметре, что он =0.185 по модулю? Перевод от гугл: "непараметрический перекос". Ваше название "непараметрический коэффициент скошенности". В гугл оба русских варианта не нашел, и, поскольку в соответствии не уверен, взял формулу из https://en.wikipedia.org/wiki/Nonparametric_skew. Это отношение (медиана - среднее)/(стандартное отклонение) - я правильно угадал, о чем Вы говорили?

4. Никак не могу понять, как показатель, имеющий положительные и отрицательные значения, к тому же "распределения, которое в разные моменты времени как бы "рождается", "формируется" и "умирает", и процесс начинается сначала", имеет среднее значение по модулю, к тому же "инвариантное". Что это означает? Может, дадите график или другие иллюстративные материалы?


В качестве извинения за мои назойливые вопросы предлагаю ответ на Ваш вопрос о распределении, которое гуляет на Форексе "на Форексе "гуляет" некое 1 распределение со странным средним (подчеркиваю - средним) непараметрическим коэффициентом скошенности = 0.185 (по модулю)."

Первое, что приходит в голову - полученное значение 0.185 является одной из уставок (параметров) алгоритмов фильтрации в форекс-компании, откуда Вы получили исходные данные, в том месяце, к которому они относятся. Крайне коротко, как я представляю одну из (сравнительно честных и коротких) возможных схем, по которым генерируются котировки в этой компании:

- банки продают снапшоты последних совершенных в них реальных (не игровых, без обязанности "закрыть открытую сделку обратной") без указания объема сделок агентствам вроде Рейтерс, Блумберг;

- Ваша компания покупает эти снапшоты у агентств;

- компания усредняет цены последних сделок по пространству (по значению курсов) и по времени, раздвигает полученную оценку спреда до своих потребностей (или даже сдвигает, если перенесла спред в комиссию) и высылает Вам в терминал. Каждая компания имеет свои ноу-хау настройки алгоритмов фильтрации, кроме того, индивидуальные полномочия настройки этих алгоритмов имеет каждый из дилеров компании в соответствии с перечнем валютных пар, за которые он отвечает.


P.S. Да, обычно еще для каждого типа реальных счетов компания устанавливает разный уровень спреда, о чем сообщает на своем сайте. Естественно, по каким-то алгоритмам, у которых также задаются параметры. Так что, анализируя тики, мы анализируем совсем не Форекс, а свойства алгоритмов генерации котировок данным ДЦ по данной паре на данном типе счета в выбранный период времени. И здесь можно обнаружить много чудес. Например, подачу лохматых (грубо говоря, нефильтрованных) или даже специально взлохмаченных (например, путем "перерегулирования") котировок на демосчета как способ завлечения клиентов на реальные счета. Или такие признаки "молодости" компании, когда она допускает много арбитражных ситуаций (которые Вы, вероятно, заметили, когда говорили о выбросах за 7 сигм) уже на реальных счетах.
 
Vladimir:

Есть 4 вопроса и один ответ. Вопросы:

1. "динамический буфер тиковых данных типа FIFO" - встречаю второй раз в Ваших сообщениях, думаю, пора уточнить. Правильно ли я понял, Вы используете изначально бухгалтерский термин "первый пришел - первый ушел" способа обработки пачек документов, который с появлением ЭВМ и стековой организации дынных стал применяться для области памяти "стек", где работающие с этой памятью функции каждая по отдельности не имеет информации о том, что лежит в стеке выше и ниже доступной этой функции области памяти?

Если да, то зачем? Здесь все знакомы с понятием скользящей средней, и последовательность обработки курсов в ней для всех однозначна. И в то же время все знают, что это не стек, а ряд, в котором все курсы известны - массив, допускающий обработку  не только крайних элементов. Может быть, для понятности лучше убрать бухгалтерскую терминологию? Честно признаюсь, после того, как Вы делали выборки из временных рядов "с экспоненциально распределенным временем", у меня возникают сомнения, верно ли я понимаю, что данные обрабатывались с помощью скользящей выборки по 10, 11..14 тыс. элементов подряд по времени.

2. О "генеральной совокупности 1.500.000" - ведь Вы уже писали, что это выборка ориентировочно за месяц, зачем вводить людей в заблуждение? Вики:

Генеральная совокупность (от лат. generis — общий, родовой) (в англ. терминологии — population) — совокупность всех объектов (единиц), относительно которых предполагается делать выводы при изучении конкретной задачи.

Выводы то Вы делаете сразу для Форекс...

3. "Nonparametric skew" - верно я понял, что говорите об этом параметре, что он =0.185 по модулю? Перевод от гугл: "непараметрический перекос". Ваше название "непараметрический коэффициент скошенности". В гугл оба русских варианта не нашел, и, поскольку в соответствии не уверен, взял формулу из https://en.wikipedia.org/wiki/Nonparametric_skew. Это отношение (медиана - среднее)/(стандартное отклонение) - я правильно угадал, о чем Вы говорили?

4. Никак не могу понять, как показатель, имеющий положительные и отрицательные значения, к тому же "распределения, которое в разные моменты времени как бы "рождается", "формируется" и "умирает", и процесс начинается сначала", имеет среднее значение по модулю, к тому же "инвариантное". Что это означает? Может, дадите график или другие иллюстративные материалы?



Доброго всем утра!

Ответы:

1. В системе Vissim есть блок буферизации buffer. Работает он по принципу FIFO - именно "первый вошел - первый вышел". Т.е. при последовательном приеме тиковых данных, я набираю массив определенного размера - допустим 10.000. Далее приходит новый тик и занимает место самого первого из 10.000 и т.д. Получается. я проанализировал более 1.000.000 разных последовательных массивов с разницей в 1 тик. Гигантская статистика и ей можно верить, иначе "статистика это не наука", а я с таким утверждением не согласен.

2. Конечно, для Форекса, генеральная совокупность - бесконечность. Но, в данном случае я применил этот термин, т.к. не нашел лучше. Ведь объемы выборки у меня - 10.000, 11.000 и т.д. а 1.500.000 взял и назвал ГС :))))))

3. Да, именно он и есть.

4. Графиков нет - массивы формируются динамически и они гигантские по размеру - я сохранял только результаты. В принципе, интересующиеся могут повторить мои эксперименты в VisSim или MathLab (в этой системе - не уверен, т.к. не работал с ней). 

 

Я вот о чем подумал.

Если верно утверждение о том, что nonparametric skew для форекс-распределения инвариантен и равен +-0.185, то это может означать (без мистики:)))) только одно.

Обратите внимание, что для нормального распределения,  его половина (т.н. Half-normal distribution) имеет nonparametric skew=0.36279.

В данном случае мы имеем в среднем некое Half-unknow distribution которое имеет nonparametric skew=0.185, а если посмотреть с двух сторон - то увидим симметричное нормально-подобное распределение.

Боюсь предположить, что в среднем мы как раз имеем дело с моим "любимым" нестандартизированным t2-распределением Стьюдента. Образуясь на уровне приращений returns, оно никуда не исчезает, оно как бы трансформируется в динамике, но при усреднении проявляется более-менее явно.

Собственно, это подтверждает мою гипотезу о том, что вероятностное распределение цены на рынке Форекс - это суперпозиция ("смесь") нестандартизированных t2-распределений.

Теперь осталось научиться в динамике "видеть" это распределение и задача решена.

Как его увидеть? Остаюсь при своем мнении - посредством усреднения некоторых параметров с учетом квантилей данного распределения.

Half-normal distribution - Wikipedia
Half-normal distribution - Wikipedia
  • en.wikipedia.org
Half-normal distribution Parameters Support PDF CDF Quantile Mean Median Mode Variance Entropy Let follow an ordinary normal distribution, , then follows a half-normal distribution. Thus, the half-normal distribution is a fold at the mean of an ordinary normal distribution with mean zero. where E [ Y ] = μ = σ 2 π...
 
Maxim Dmitrievsky:

Про фрактальность распределения рисков на всех тф - верно подметили. Об этом собсно сам создатель фракталов и писал, и еще много кто. 

https://ru.wikipedia.org/wiki/Фрактальный_анализ_рынка

Насчет этого вообще прикол - изначально эту страничку я писал, и была ссылка на мой сайт, которого уже нет :)) Но Алмазов залез и переписал все под себя, смешно :)) 

Изначально я делал ее потому что она в поисковиках отлично позиционировалась, и были прямые переходы на сайт. Чето ржу :)

Кстати, @Alexander_K, может быть ответ отчасти и кроется в ф-ии В-М, может быть для нее тоже статистику сделать? :)

Максим, добрый день! Вам - особое почтение, ибо без Ваших первых комментариев, которые заставили меня всерьез заняться исследованиями, этой темы вообще не состоялось бы.

 
Первый опцион был продан примерно в 1690 году. Тервер и статистика уходят еще дальше в глубину веков. Вы и правда всерьёз думаете, что всё это не пустая трата времени? Что вы интеллектуальнее и умнее хотя бы того же Кардано?
 
nahdi:
Первый опцион был продан примерно в 1690 году. Тервер и статистика уходят еще дальше в глубину веков. Вы и правда всерьёз думаете, что всё это не пустая трата времени? Что вы интеллектуальнее и умнее хотя бы того же Кардано?

Нет. Я, хоть и имею не самое плохое образование и большой опыт работы, далек от мысли, что все уже ясно и понятно. Я даже удивлен результатам и хотел бы. чтобы кто-то независимо проверил их на основе именно своего опыта и знаний.

 
Alexander_K:

Нет. Я, хоть и имею не самое плохое образование и большой опыт работы, далек от мысли, что все уже ясно и понятно. Я даже удивлен результатам и хотел бы. чтобы кто-то независимо проверил их на основе именно своего опыта и знаний.

Имелось ввиду, что слишком много людей годами бились и бьются до сих пор над этими вопросами - всё уже просчитано до нас!!! Никоим образом не умаляю ваших заслуг. Другое дело - чтобы это понять лично самому нужно безусловно через себя пропустить сей сыр бор. Главное, чтобы для пропускания через себя не потребовалось много больше, чем вам отпущено. Успехов в этом благородном деле!
 

Более того - думаю, что эту тему надо бы опубликовать на физико-математических форумах. Однако - зачем это, если я каждый день общаюсь с такими людьми и им эта тема просто не интересна. Считается, что это не серьезная тематика, исключительно для молодежи и нечего тратить на это время. Я же просто занялся из любопытства.

 
Alexander_K:

Более того - думаю, что эту тему надо бы опубликовать на физико-математических форумах. Однако - зачем это, если я каждый день общаюсь с такими людьми и им эта тема просто не интересна. Считается, что это не серьезная тематика, исключительно для молодежи и нечего тратить на это время. Я же просто занялся из любопытства.

Вообще-то как раз об этом я и хотел спросить - для чего интересоваться данной темой опытному физику, статисту(ну и кем там вы еще являетесь)? Не лучше ли финансами заняться финансистам? Каждый должен заниматься своим делом. А если таковое отсутствует это заставляет задуматься.

Или физик - это призвание, как говаривал господин Медведев... хочешь денег - иди в бизнес. Хочешь потерять деньги - иди на финансовые рынки...

Причина обращения: