От теории к практике - страница 406

Uladzimir Izerski
6736
Uladzimir Izerski  
Alexander_K2:

Спасибо за ссылку, Владимир. Весьма интересно.

Пока я еще на связи, позволю себе еще один пост.

Многие, читая эту ветку, задаются вопросом - зачем этому дяде все это? Зачем нужны экспоненциальные, логарифмические шкалы времени? Бери просто тики как есть и работай с ними как с ВР, где время между тиками - это т.н. "время Форекса".

Ребята! Вы совсем не шарите! Вот просто отчаянно дубеете и все тут.

Напоминаю, что мы рассматриваем движение цены как подобие винеровского процесса со сносом. Как подобие броуновского движения. На самом деле, это - lapace motion, но сути дела это не меняет и, в первом приближении, эта модель вполне подходит.

Так вот, для такой модели, астрономическое время - наиважнейший параметр. И закон "корня из Т" для дисперсии выведен Эйнштейном именно для этого времени, а не для какого-то там "времени Форекса".

Перрен в своих опытах использовал дискретность времени =30сек. для наблюдения за процессом.

В РХТУ им.Менделеева (бывший МХТИ), где учится моя дочь, опыты проводят при дискретности времени =10сек.

Короче - мы ОБЯЗАНЫ учитывать время в расчетах, иначе нам удачи не видать.

Если времени не существует не будет и изменения цены. Вопрос в правильном выборе времени для анализа задачи. С чем по моему мнению у многих полный вакуум.

Alexander_K2
2223
Alexander_K2  
Uladzimir Izerski:

Если времени не существует не будет и изменения цены. Вопрос в правильном выборе времени для анализа задачи. С чем по моему мнению у многих полный вакуум.

Именно так. И мы таки докопаемся до сути.

Завершил я обработку тиковых данных по паре AUDCHF за сутки.

ОЧЕНЬ ВАЖНО! Тиковые данные принимались по протоколу DDE из МТ4 в VisSim. Меткой времени является TimeSec, которая округляется до целочисленных значений. К сожалению, я не знаю - то ли это просто берется целая часть от десятичного значения, то ли производится округление до ближайшего целого. Если кто-либо знает как производится эта операция при передаче данных по DDE и подскажет - буду крайне признателен.

Распределение интервалов времени между тиками выглядит так:

Описательная статистика:


Всего, как видим, за сутки (86400 сек.) пришло 34978 тиков.

igrok333
1498
igrok333  
Alexander_K2:

Но, вот проблема - модель Винера хороша для описания хаотических столкновений частицы при Т между столкновениями -->0.

На Форексе такого нет и в помине. В ночное время суток, интервалы времени увеличиваются, в дневное - уменьшаются. Во временном окне = 4 часа, процесс прихода котировок не является пуассоновским.

И, наоборот - при рассмотрении тиков "как есть" возникает проблема соотношения объема рассматриваемой выборки к астрономическому времени. Т.е. 5000 тиков могут придти как за 4 часа, так и за 10 часов. И этот процесс также непуассоновский. При этом, напрочь теряет силу закон "корня из Т".

Вот это противоречие между моделью Винера и реальным движением цены, нам нужно максимально минимизировать.

Это как раз-таки делается введением различных шкал времени считывания котировок, среднее значение ГСЧ которых соотносится с некой дискретой астрономического времени.

Тиковый же объем выборки (волновой пакет) при этом заменяется неким усредненным модельным пакетом с максимально похожими статистиками.

Все, слова закончились. Нужны графики, цифры, а уже нет времени - надо праздник праздновать.

До встречи!

у вас система на тиках.
я бы еще так попробовал: использовать секундные котировки, и для каждого часа суток дисперсию отдельно рассчитывать (потому что интенсивность торгов в каждый час разная).
почему использование тиков - плохо? это нас ограничивает. какое максимальное отклонение может быть за 10 тиков, если тик - это, в основном, один пункт?
максимальное отклонение за 10 тиков может быть 10 пунктов. если все 10 тиков пройдут в одном направлении.
а если мы будем использовать секунды? да за 10 секунд цена может прыгнуть на "какое угодно" расстояние!
используя тики, мы еще пренебрегаем временем, то есть скоростью цены. а в таких системах замечено, что чем выше скорость цены, на которой пришел сигнал - тем выше вероятность его срабатывания.
Uladzimir Izerski
6736
Uladzimir Izerski  
Alexander_K2:

Именно так. И мы таки докопаемся до сути.

Завершил я обработку тиковых данных по паре AUDCHF за сутки.

ОЧЕНЬ ВАЖНО! Тиковые данные принимались по протоколу DDE из МТ4 в VisSim. Меткой времени является TimeSec, которая округляется до целочисленных значений. К сожалению, я не знаю - то ли это просто берется целая часть от десятичного значения, то ли производится округление до ближайшего целого. Если кто-либо знает как производится эта операция при передаче данных по DDE и подскажет - буду крайне признателен.

Распределение интервалов времени между тиками выглядит так:

Описательная статистика:


Всего, как видим, за сутки (86400 сек.) пришло 34978 тиков.

Анализ тиков на минимальных интервалах времени не дадут картины происходящих событий. Как это не понять?

Alexander_K2
2223
Alexander_K2  

За неделю распределение тиковых приращений Bid для AUDCHF выглядит так:


Alexander_K2
2223
Alexander_K2  

Так вот, задача, которую я хочу решить.

Необходимо работать в любое время суток в такой шкале времени (равномерная, экспоненциальная, либо логарифмическая), чтобы максимально сохранялись свойства вот этого распределения реальных приращений.

Еще раз говорю - работать просто с выборкой тиков (к примеру - 5000) нельзя! Теряется связь с астрономическим временем. Мы не знаем, за какой период времени соберется этот пакет из 5000 тиков! Мы не можем, в этом случае применять теорию винеровских процессов от слова "совсем"!

Alexander_K2
2223
Alexander_K2  

И второй важный вывод.

Если посмотрите - максимальный промежуток времени между тиками у меня составил 88 сек.

Вывод: построение и работа с секундными таймфреймами S1, о котором многие мечтают как о Граале, - полная ерунда.

Igor Makanu
7957
Igor Makanu  
Alexander_K2:

Мы не заем, за какой период времени соберется этот пакет из 5000 тиков!

разработайте функцию плотность тиков, я делал когда то, принцип:

анализируйте не время прихода тика, а разницу во времени между тиками (дельта)

имея среднее арифметическое этих приращений Вы можете получить плотность тиков за единицу времени, секунда маловато будет, а в минуту весьма конкретное значение

подобрав экспериментально устраивающую Вас плотность тиков, Вы можете оперировать сколько тиков Вам нужно для Вашей статистики, т.е. определите условия накопления тиков примерно так:

1. если плотность тиков < 20 в минуту, то нужно не менее х минут

2. если плотность тиков >40 в минуту, то нужно y минут

3. если плотность тиков >20 && < 40 в минуту, то z минут

как то так

ЗЫ: можно с этой плотностью тиков и рекуррентную формулу разработать, т.е. рассчитали на текущем тике текущую плотность тиков, и отняли/прибавили к предидущей плотности тиков - получите динамически изменяющееся значение

Alexander_K2
2223
Alexander_K2  

Так вот.

Почему я считаю исследование временных интервалов между тиками крайне важным.

Еще раз:


Мы видим, что это не поток Эрланга (я проводил сравнения с потоками различных порядков, это и близко не Эрланг).

Это простейший поток с каким-то искажением, не соответствующим классическим распределениям Эрланга или Паскаля.

Правомерно ли в этом случае применять считывание котировок через интервалы времени:

1. равномерные (через 2.5 сек)

2. экспоненциальные (mean=2.5 сек.)

3. логарифмические (mean=2.5 сек.)???

Ответом на этот вопрос будет являться статистическое соответствие получаемых распределений приращений для этих случаев, реальному распределению тиковых приращений Bid и Ask.

igrok333
1498
igrok333  
Alexander_K2:

Если посмотрите - максимальный промежуток времени между тиками у меня составил 88 сек.

Вывод: построение и работа с секундными таймфреймами S1, о котором многие мечтают как о Граале, - полная ерунда.

ну и чё ? будет у тебя несколько котировок подряд повторяться.