Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 656

 
Yuriy Asaulenko:


Ну, а нестационарность. Любой процесс, если его разбить на куски станет нестационарным, а если это не так, то он не будет случайным.

Не понял. В GARCH процесс разлагается на составляющие, а не разбивается на куски. Там в самой формуле заложено: предыдущее значение + шум.

Кстати, по виду распределений на разных продолжительных отрезках (несколько за 3 мес.) я не заметил какой-либо существенной разницы между ними.

А это очень интересный вопрос. в публикациях по GARCH для вычисления параметров распределений доказывается необходимость количества наблюдений свыше 5000. Менее 1000 делает модель неустойчивой. 

На счет экономического смысла - ну, не знаю. Я исхожу из того, что рынок случаен для наблюдателя. Какой он на самом деле - случайный или нет, на самом деле не имеет значения. Здесь ключевое слово - для наблюдателя.

На форексе полностью согласен, так как считаю, что валютный курс - это политика.

А вот другие типы активов. Хотя сегодня цены на активы от балды: цена на нефть в разы, а потребление примерно одинаковое.

 
Maxim Dmitrievsky:


но вы не избавились от выбросов


Конечно нет и этого нельзя делать. Более того один из смыслов моделей GARCH - это насколько удачно она ОПЯТЬ соответствует процессу после выброса. 

 
СанСаныч Фоменко:

Конечно нет и этого нельзя делать. Более того один из смыслов моделей GARCH - это насколько удачно она ОПЯТЬ соответствует процессу после выброса. 

я имею в виду, что если вы возьмете просто приращения и логарифмы приращений, то графики будут эквивалентными, но только в другой ценовой шкале

 
Dr. Trader:

Я тоже много об этом думаю. 

Если регрессионная модель предсказывает прирост цены за бар, а оценка R2 выше ноля на фронттестах и бэктестах, то это уже хорошее начало. Проблема в том что результат хоть и стабилен, но мал, спред не побороть.

Аналитически, проблема в том что R2 штрафует модель сильнее за большие ошибки и игнорирует маленькие ошибки и неверные направления сделки. Если посмотреть на распределение приростов, то большинство движений цены - всего пара пипсов. А модель вместо того чтобы предсказать правильное направление таких малейших движений, учится предсказывать длинные хвосты распределния, за которые получит более высокий R2. В итоге модель кое-как предсказывает большие движения, но на маленьких постоянно ошибается с направлением и сливает по спреду.

Вывод - стандартные регрессионные оценки для форекса плохи. Нужно изобретать какую-то свою фитнесс функцию, чтоб и направления сделок учитывались, и спред, и точность, да ещё и функция должна быть гладкой. Тогда даже с точностью чуть выше 50% уже будет шанс на профит.
Точность, Sharp ratio, recovery factor, и другие функции которые анализируют график торговли - слишком дискретны, нейронка со стандартным бэкпропом не вылезет из локального минимума, и толком не обучится.

Альтернативный вывод - полностью игнорировать слабые сигналы нейронки. Торговать только на сильных. Тут своя проблема в том что можно всегда подобрать порог который покажет отличные результаты на бэктесте, но с ним-же будут плохие на фронттесте. Тут тоже надо что-то думать.

R2 ИМХО как и логлос довольно неудобная метрика из за нелинейности. Мне намного удобней простая корреляция ретурнов с предиктами, это как корень из R2 что намного "наглядней", умножишь на 100 получаешь четко процент ченжей который можешь захватить с рынка, у меня выходит 3-5%, но вся беда, как Вы верно сказали, что эти сигналы слишком частые, а фильтрация или усреднение почти полностью убивает альфу. Думаю на этом  нужно сосредоточить усилия, так как больше 5% всё равно с обычных данных не получить.

 
СанСаныч Фоменко:

На счет экономического смысла - ну, не знаю. Я исхожу из того, что рынок случаен для наблюдателя. Какой он на самом деле - случайный или нет, на самом деле не имеет значения. Здесь ключевое слово - для наблюдателя.

На форексе полностью согласен, так как считаю, что валютный курс - это политика.

А вот другие типы активов. Хотя сегодня цены на активы от балды: цена на нефть в разы, а потребление примерно одинаковое.

Да везде. Я в основном на бирже-фьючерсах играю. Для наблюдателя все случайно. Что уж там на самом деле - а черт его знает. Эт инсайдером надо быть.))

Вот что "неслучайно" - это откаты при движении и колебания вокруг среднего значения (не путать с Александром_К2-м). При этом подходе, скорее попадание в движение можно назвать случайным, но не редким и даже закономерным явлением, при том. что мы никогда не знаем, когда и в какую сторону оно будет.

 
Yuriy Asaulenko:

Да везде. Я в основном на бирже-фьючерсах играю. Для наблюдателя все случайно. Что уж там на самом деле - а черт его знает. Эт инсайдером надо быть.))

Вот что "неслучайно" - это откаты при движении и колебания вокруг среднего значения (не путать с Александром_К2-м). При этом подходе, скорее попадание в движение можно назвать случайным, но не редким и даже закономерным явлением, при том. что мы никогда не знаем, когда и в какую сторону оно будет.

Это гипотеза об эффективном рынке - чепуха полная.

 
Maxim Dmitrievsky:

я имею в виду, что если вы возьмете просто приращения и логарифмы приращений, то графики будут эквивалентными, но только в другой ценовой шкале

Страныые у вас графики, логарифм должен был их еще и сжать. По какой формуле считали? Десятичный к примеру изменение исходных данных в 10 раз приводит к изменению в 2 раза. Натуральный тоже, но послабее. У вас на графиках сжатия по вертикали не видно.
 
СанСаныч Фоменко:

Ведь не зря для приращений используются модели GARCH. и они являются самыми распространенными на данный момент. Базовая идея победы над НЕ стационарностью путем разложения НЕ стационарного ряда на составляющие, имеющие вполне содержательный экономический и статистический смысл, является очень привлекательной.

Сейчас для меня garch слишком сложен. Книги по нему написаны в основном для специалистов в области статистики и эконометрии, и постоянно оперируют вещами которые мне непонятны; чтобы понять и усвоить какие-то базы мне нужно сначала понять кучу всего другого что в книгах не объясняется. 

С пакетами в R поигрался, но с дефолтными настройками я прибыли не получил даже на тесте; нужны опять-таки знания как и что там подкрутить в настройках, а наобум не получается.

Верю что garch может многое, но количество времени которое мне нужно вложить чтоб разобраться - слишком велико, и его так много нет.

 
elibrarius:
Страныые у вас графики, логарифм должен был их еще и сжать. По какой формуле считали? Десятичный к примеру изменение исходных данных в 10 раз приводит к изменению в 2 раза. Натуральный тоже, но послабее. У вас на графиках сжатия по вертикали не видно.

log(close[i]/close[i-15])

куда что сжать, зачем?

 
Maxim Dmitrievsky:

я имею в виду, что если вы возьмете просто приращения и логарифмы приращений, то графики будут эквивалентными, но только в другой ценовой шкале

Я так понял там не log(open[0] - open[1]),
а log(open[0]/open[1])

Причина обращения: