Забудьте про случайные котировки - страница 63

 
C-4:

Откуда там 903.50? Тот ли файл смотрите? Первая цифра это 325.25:

1 2 3 4 5 6 7

1992.11.01,00:00,355.75,364.00,352.75,359.25,1901

А так, да, часы и минуты это разные колонки, все колонки разделены запятыми (стандартный экспорт из MТ4).

Во втором файле 16 колонка должна соответствовать чистым позиция операторов: Net Operators.

Одни данные на вторник, а другие на воскресенье... 2012.07.15 соответствует 2012.07.17 или ей соответствует 2012.07.22?

 
faa1947:

Одни данные на вторник, а другие на воскресенье... 2012.07.15 соответствует 2012.07.17 или ей соответствует 2012.07.22?


Данные фиксируются на вторник, но публикуются (становятся доступные нам) только вечером в пятницу. Соответственно, что бы не попасть в ловушку самообмана, надо делать смещение на одну неделю. Т.е. лучше даже использовать цену открытия следующей недели:

1992.11.01,00:00,355.75,364.00,352.75,359.25,1901

Почему 1992.11.01 - воскресенье, понятия не имею, должно быть 1992.11.02. Это единственные котировки которые у меня есть. Но не суть. Если цена открытия была в воскресенье или как положено в понедельник, то для нее используем данные COT на предыдущий вторник, т.е. для 1992.11.01 надо использовать данные COT за 1992.10.27

 

Да, еще пару замечаний.

Принято цену, а соответственно и индикаторы рассматривать относительно времени. Но кто сказал что это единственно верная методика?

Известно, что позиции операторов зависят от цены (чем цена выше - тем выше их нетто хедж). Но при чем здесь время? Поэтому было бы не плохо построить точечную диаграмму зависимости между ценой и позициями операторов. Сдается мне что она будет более менее похожа на линейную, и на ней вполне можно применять тест гренджера.

 
C-4:



Результаты следующие.

Синхронизировал даты. В Zw пришлось вставить 6 пустых налюдених, чтобы выровнять. Затем полученные NA значения линейно интерполировал.

Получил следующие данные.

Net

2000.01.04 -4479 2000.01.09 265.5

2000.01.11 -15963 2000.01.16 264.25

2000.01.18 -22316 2000.01.23 259.75

2000.01.25 -26656 2000.01.30 257

2000.02.01 -19041 2000.02.06 269.5

2000.02.08 -19564 2000.02.13 265

/

/

/ конец

648 2012.05.29 11227 2012.06.03 629.25

649 2012.06.05 34075 2012.06.10 612.25

650 2012.06.12 36996 2012.06.17 673

651 2012.06.19 34250 2012.06.24 741.75

652 2012.06.26 -4088 2012.07.01 790.25

653 2012.07.03 -13515 2012.07.08 834

654 2012.07.10 -23508 2012.07.15 944.75

655 2012.07.17 -38701 2012.07.22 903

Совместный график

Причинный тест на всей выборке в 655 наблюдений со сдвигом на 2 лага и на 10 лагов(результат одинаков)

Pairwise Granger Causality Tests

Date: 08/03/12 Time: 15:21

Sample: 1 655

Lags: 10

Null Hypothesis: .............................................................................Obs F-Statistic Prob.

NET_OPERATORS не причина по Грэнджеру для SER06_INTERPOLATE 645 2.66043 0.0035

SER06_INTERPOLATE не причина по Грэнджеру для NET_OPERATORS 20.9059 1.E-33

Читается так: не может отвергнуть гипотезу, что NET_OPERATORS не является причиной для SER06_INTERPOLATE, т.е. эти две величины независимы.

.

идея проверять причинность на всей выборке не верна.

Возьмем первые 30 наблюдений:

Pairwise Granger Causality Tests

Date: 08/03/12 Time: 15:44

Sample: 1 30

Lags: 2

Null Hypothesis: Obs F-Statistic Prob.

SER06_INTERPOLATE does not Granger Cause NET_OPERATORS 28 10.8494 0.0005

NET_OPERATORS does not Granger Cause SER06_INTERPOLATE 0.39443 0.6785

Картина другая. вторая строка звучит так:

Мы отвергаем с вероятностью 67% гипотезу, что NET_OPERATORS не является причиной по Грэнджеру для SER06_INTERPOLATE.

А вот в обратную сторону мы не можем отвергнуть гипотезу, что не является причиной!

 
C-4:

Да, еще пару замечаний.

Принято цену, а соответственно и индикаторы рассматривать относительно времени. Но кто сказал что это единственно верная методика?

Известно, что позиции операторов зависят от цены (чем цена выше - тем выше их нетто хедж). Но при чем здесь время? Поэтому было бы не плохо построить точечную диаграмму зависимости между ценой и позициями операторов. Сдается мне что она будет более менее похожа на линейную, и на ней вполне можно применять тест гренджера.

Наблюдения привязаны ко времени. что происходит между наблюдениями мы не знаем. Нужно интерполировать, что может быть как очень простой задачей (сделано выше) так и очень сложной - как Вы предлагаете.

Думаю надо искать размер окна, на котором определять причинность и работать с этим, найденным размером окна. Я напрочь отрицаю утверждение, чем больше выборка, тем лучше. Это утверждают люди, далее теорвера не пошедшие. Нас интересует тенденция на несколько шагов вперед. Нас интересуют колебания рынка, на которых можно выиграть или слить. А среднее отсутствие причинности между переменными за 12 лет не говорит ни о чем. 30 недель - полгода. И вопрос надо ставить так: этих 30 недель достаточно чтобы спрогнозировать на пару недель вперед?

 
faa1947:

Результаты следующие.

Мы отвергаем с вероятностью 67% гипотезу, что NET_OPERATORS не является причиной по Грэнджеру для SER06_INTERPOLATE.

А вот в обратную сторону мы не можем отвергнуть гипотезу, что не является причиной!

Так да - это да, или да - нет?

! (Net_Operators != Ser06_Interpolar) = true;

Т.е. скорее всего Net Operators является причиной Ser06_Interpolate?

 

А понял, для первых 30 лагов - да, операторы являются причиной. Для всей выборки в целом - нет, операторы не являются причиной. Вообще не важнецкий результат. Все-таки, нужно подтверждение в целом для всей истории, иначе по логике причиной это либо является либо нет. А иногда является иногда нет - это те же 50 на 50.

А сравниваются приращения или моменты?

 
Надо провести тест на заведомо зависимых данных. Очень хорошо подойдут ТА индикаторы без запаздывания, например RSI. Заведомо известно, что не цена зависит от индикатора построенного в нашем терминале, а индикатор от цены. Тест гранджера обязан показать именно такую взаимосвязь: с очень большой долей вероятности, rsi зависит от цены.
 
C-4:

Так да - это да, или да - нет?

! (Net_Operators != Ser06_Interpolar) = true;

Т.е. скорее всего Net Operators является причиной Ser06_Interpolate?

В том-то и дело, что не только оттенков серого много, так мир ко всему еще и цветной!

Просто открываются глаза. А что делать - это уже другой вопрос.

 
C-4:

А понял, для первых 30 лагов - да, операторы являются причиной. Для всей выборки в целом - нет, операторы не являются причиной. Вообще не важнецкий результат. Все-таки, нужно подтверждение в целом для всей истории, иначе по логике причиной это либо является либо нет. А иногда является иногда нет - это те же 50 на 50.

А сравниваются приращения или моменты?

Очень интересная картина получается, если прогнать окно вдоль выборки. Хорошо если вычисленная величина причинности не меняется, а скорее всего меняется!

Я это впервые увидел на коэффициентах взвешенной скользящей средней - просто в ужас пришел. Ни с чем, что есть в ТА, работать нельзя. Всему, что получил из тестера - верить нельзя и т.д.

Причина обращения: