Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 139

 

Все это звучит академически.

Как мне помнится при количестве наблюдений свыше 100 000 даже исходный котир почти стационарен. 

Ну и что?

Ведь скорее всего мы работаем на в терминале в окне 100-150 наблюдений. Вообще, каков должен быть размер окна? И для чего?

Если для удаления шумовых предикторов, то большое количество, может быть до 10 000. А нужно 100 000 для удаления шумовых предикторов?

Вообще-то размер выборки должен быть каким-то образом связан с некоторыми стационарными характеристиками рынка. В обсуждаемом случае, шумовые предикторы должны быть таковыми для достаточно больших временных промежутков. 

Это этап удаления шума.

 

Следующий этап - обучение модели с целью того, чтобы убедиться, то модель не переобучена.

 

Если нам удалось найти набор предикторов,на которых модель не переобучается,  то тогда имеет смысл все остальное. В противном любые разговоры абсолютно пустые. Не будем забывать, что построить заведому переобученную ТС на индикаторах гораздо проще, чем используя все эти прибамбасы искусственного интеллекта, в результате которое мы все равно получаем переобученную ТС.

 

Итак, мы имеем некий набор предикторов, которые не приводит к переобучению. Величина прибыльности не важна, главное чтоб такая прибыльность была и не очень колебалась на разных выборка.

А теперь следующий этап.

Берем небольшое окно = 100-500 наблюдений и на нем учим модель, делая отбор предикторов например по rfe. Это еще больше уменьшит набор предикторов. По опыту раза в два. 

Используя этот уменьшенный набор предикторов делаем предсказание ровно на один шаг вперед. По-хорошему это предсказание должно иметь доверительный интервал - это и есть риск.

Торгуем  внутри предсказания. Т.е. предсказываем следующий день, а торгуем на М5. На половине предсказанного движения ставим ТР.

По выходу из всех позиций сдвигаем окно, делаем отбор предикторов по rfe и снова предсказываем. 

Ошибка предсказания - это ошибка на каждом шаге, а не все чохом. 

 

Но практическую ценность имеет не эта величина, а величина профит-фактор/просадки или еще чего-либо хотя бы в тестере. 

 
СанСаныч Фоменко:

Все это звучит академически.

///

 

 

Я заменю все ваши выкладки одной фразой: нешумовые предикторы будут работать на бесконечно большой выборке. Значит, отсев шума надо производить на выборке максимально большого размера. 

Если ваши "нешумовые предикторы" работают на ограниченном отрезке котира, значит они представляют собой локальный шум. 

 
Alexey Burnakov:

Ок, будет интересно почитать.

CNN это не рекурентная сеть сама по себе. 

 

Кстати о сверточных сетях. Не предназначен этот вид нейросети для решения задач регрессии. Поэтому и результаты публичного эксперимента плачевные.

Задачи решаемые CNN - классификация, локализация, обнаружение, сегментация.

Это так "заметки на полях"

Удачи

 
Vladimir Perervenko:

Кстати о сверточных сетях. Не предназначен этот вид нейросети для решения задач регрессии. Поэтому и результаты публичного эксперимента плачевные.

Задачи решаемые CNN - классификация, локализация, обнаружение, сегментация.

Это так "заметки на полях"

Удачи

А вы уверены, что классификацию нельзя представить как регрессию, и наоборот? Ведь этот блок решается на полносвязных слоях, а там какая разница? Есть пруф?

И кстати результаты не плачевные. Почему так решили? Просто заложенная функция весьма сложна и сеть перестает отличать ее от шума (я имею в виду полносвязную сеть). Вы ее сами-то порешали, или просто демагогию разводим? 

 

Ребята, есть у кого то внутри дневные котировки желательно М5 индексов , нужно три инструмента, хотя бы 50 000 свечей

1) Euro Stoxx 50 или Euro Stoxx 600

2) Dow Jones   или S&P 500 или NASDAQ

3) пара EUR/USD 

 

 у кого есть, скиньте для экспериментов, буду благодарен 

 

Alexey Burnakov:

 Если ваши "нешумовые предикторы" работают на ограниченном отрезке котира, значит они представляют собой локальный шум. 


Что Вы хотите доказать на максимально длинных выборках? Гипотезу эффективных рынков? Там там куча нобилей, включая банкротов, которые проповедовали эту гипотезу.

 

Я же говорю о совершенно конкретном применении инструментов. И эта конкретика для  меня кратко выражается словосочетанием: "аванс-получка". В этих рамках оптимальным является горизонт предсказания = 1 неделя, чтоб сердце успокоилось -  2 месяца.

Все остальное надо подгонять именно под снятие прибыли. Здесь и сейчас. А что происходило до 87 года не интересно. Не интересно что было до 97 года, а если идти далее, то следующий рубеж это 2007 год. Выбирая временной период для выявления шумовых предикторов надо иметь некие содержательные соображения, что предшествующий период будет похож на будущий. Работает ли все так же после брексита, как и до него? а что будет после выборов в США? Существуют политические шоки и биржевые крахи, не связанные с политикой,  и они делят исторические данные на куски.

 

 видос - https://www.youtube.com/watch?v=-INzzOXxkhU

На мой взгляд вот один из правильных путей развития, при чем он комплексно решает как проблему отбора шумов так и переобучение.(это все конечно же в теории)

1) Мы в истории ищем ситуации которые повторяются  -  аля отбор признаков

2) считаем статистику реакции цены на паттерн , ну скажем 10 падений и 1 рост , и получаться что мы проделали этим действием

           1.  выявили сильные паттерны с хор. статистикой (отбор качественных признаков) 

           2. Мы поняли что паттерн не случен , так как он часто повторялся(отбор качественных признаков) 

           3. По сути провели кросвалидацыю признака, так как посчитали по нему всю статистику

           4. Избавились от переобучения так как все лишнее выкинуто, оставлено только то что хорошо работало на истории 

и все это как бы в одном флаконе :) 

 

p.s. при просмотре видео наблюдайте за индикатором, я не увидел ни одного раза что бы он ошибся с прогнозом, и это сильно ...

Скальпинг на форекс. Индикатор будущего. Future Price (FP). Ведущий Лихо Сергей.
Скальпинг на форекс. Индикатор будущего. Future Price (FP). Ведущий Лихо Сергей.
  • 2014.04.21
  • www.youtube.com
http://likho.ru http://likho.ru/skalping-na-foreks-indikator-budushhego-future-price-fp/ - подробнее (pdf) индикатор прогнозирует тиковую цену по финансовому...
 
СанСаныч Фоменко:

Что Вы хотите доказать на максимально длинных выборках? Гипотезу эффективных рынков? Там там куча нобилей, включая банкротов, которые проповедовали эту гипотезу.

 

Вообще-то, я показываю, что на максимально доступной выборке зависимости на выбранных фичах воспроизводятся, что есть прямая противоположность вашему высказыванию. Рынок неэффективен на всей истории.

 

Остальные ваши пункты я комментировать не буду: это ваши предпочтения.

 
mytarmailS:

 видос - https://www.youtube.com/watch?v=-INzzOXxkhU

На мой взгляд вот один из правильных путей развития, при чем он комплексно решает как проблему отбора шумов так и переобучение.(это все конечно же в теории)

1) Мы в истории ищем ситуации которые повторяются  -  аля отбор признаков

2) считаем статистику реакции цены на паттерн , ну скажем 10 падений и 1 рост , и получаться что мы проделали этим действием

           1.  выявили сильные паттерны с хор. статистикой (отбор качественных признаков) 

           2. Мы поняли что паттерн не случен , так как он часто повторялся(отбор качественных признаков) 

           3. По сути провели кросвалидацыю признака, так как посчитали по нему всю статистику

           4. Избавились от переобучения так как все лишнее выкинуто, оставлено только то что хорошо работало на истории 

и все это как бы в одном флаконе :) 

 

p.s. при просмотре видео наблюдайте за индикатором, я не увидел ни одного раза что бы он ошибся с прогнозом, и это сильно ...

все верно. 

Видео не смотрел, так как убежден, что можно подогнать для красивости что угодно под сколь угодно большую историю. Правда некрасива. Доказать, что модель не переобучена очень сложно. 

 
Dr.Trader:

Для меня всё дело в риске - я стараюсь хоть немного, но таки рисковать. Можно сделать советник успешно торгующий на десятке пар в течении многих лет, но зачем? Прибыль будет наверное пара процентов в год.....

Ну вы же даже не пробовали... :)

 

 Маленький отчет  по моим экспериментам с стат. арбитражом.

спред считал регресией как на том сайте что приводил выше , комиссия учтена , с параметрами еще сильно не заморачивался взял лучшие по быстрому тесту, также ни с мани менеджментом тоже не заморачивался, если попробовать по управлять позицией(добавки , усреднения)  то думаю можно будет добиться намного лучших результатов

Так же так сказать на новых данных "удар держит" арбитраж намного лучше чем те системы которые я делал с помощью маш. обуч. раз так в 10 лучше держит...

Странно так.. я за пол дня с экспериментами по арбитражу добился большего чем за пол года с маш. обуч.   , не то что странно, а даже обидно как то...

Из минусов их по сути два:

           первый таки есть нехилая просадка в +/-30%

          а второй я пока не могу придумать как туда маш. обуч. можно прикрутить :) 

м 

м2 

Причина обращения: