Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 55

 
Vadim Shishkin:

Добавлю интригу -- не надо подавать изменение курса торгуемого элемента.

Это всё равно что тащить себя за волосы из болота.

Ищите и другие источники данных.

Да пребудет с вами Профит! 

:) 

Если вы про это? Ну, Америку открыли. Я бы рад включить еще информацию, но кроме истории цен, сложно получить что-то еще в таком объеме.

А про тащить за волосы это не верно. в данных есть сигнал. И его хватает для того, чтобы перекрыть издержки и выйти в плюс. Подтверждено практически, хотя и на истории. А кто не может его извлечь танцуют с бубном. Есть наработки по стакану, но пока я не уверен, можно ли с ними что-то сделать. 

 

***Устало***

Стейт будет? 

 
Alexey Burnakov:

Предлагаю почитать неплохие заметки о построении торговых систем с позиции кванта (старшего кванта в большом инвест.фонде). Мне идеи показались разумными.

...

 С чем согласны, несогласны? Что хотелось бы получше изучить?

Ну хотя бы со строгим разделением на обучающую и тестовую выборку по датам вместо предварительного рандомного перемешивания примеров с равномерным распределением в генеральной выборке с последующим разделением её на части. Ведь может получиться так, что в одну часть выборки попадут по большей части вертикальные тренды, а во вторую боковые. Если сделать рандомное перемешивание, то вероятность скучивания схожих паттернов по разным частям выборки умаляется.

Кстати, таким недостатком страдает и встроенный в MetaTrader тестер стратегий, т.е. он делит обучающую выборку и форвардный тест строго по датам. Из-за чего смена рыночных тенденций близкая к разделительной линии может дать заведомое переобучение.

 
Vadim Shishkin:
Мальчик, иди отсюда.
 
Комбинатор:
Мальчик, иди отсюда.
Всё? Кроме хамства, нечем ответить?
 
Alexey Burnakov:

В частности, вот это понравилось:

 So, you strictly separate in-sample and out-of-sample; - строгое разделение обучающего набора и валидационного

you blind yourself to date ranges; - разделение данных именно по датам (до дня икс - обучение, после - валидация)

you use Monte Carlo to avoid starting-point biases; - сгенерить несколько исходов работы торговой стратегии, чтобы не получиалсь подгонка под точки входа-выхода сделок в рынок.

and you try various robustness tricks. - применять робастные методы.

What else do you do to ensure that you’re not fooling yourself?

Всё звучит правильно (но не всё сам пробовал), кроме первого. Мне кажется что если использовать строго один тренировочный набор данных, и подбирать под него предикторы, то получится сверхподгонка этих самых предикторов, которые возможно не будут достоверны в других временных отрезках. Я при подборе предикторов теперь создаю новую тренировочную и валидационную выборку каждый раз перед тренировкой модели. Лучше 3 раза пересоздать выборки и обучить модель и взять среднюю точность, чем использовать всегда одни и теже тренировочную и валидационные выборки.

Понравилось про белковые нейронные сети :) . Иногда ввиду неудачной топологии они действительно производят очень неадекватные результаты.

 
Vadim Shishkin:

***Устало***

Стейт будет? 

Нет. Надо быть умнее, чтобы это давно понять. Здесь разработка.
 
Alexey Burnakov:
Нет. Надо быть умнее, чтобы это давно понять. Здесь разработка.
Ага. Не подскажете, который год идёт разработка, и где можно посмотреть ея результаты? :)
 
Dr.Trader:

Всё звучит правильно (но не всё сам пробовал), кроме первого. Мне кажется что если использовать строго один тренировочный набор данных, и подбирать под него предикторы, то получится сверхподгонка этих самых предикторов, которые возможно не будут достоверны в других временных отрезках. Я при подборе предикторов теперь создаю новую тренировочную и валидационную выборку каждый раз перед тренировкой модели. Лучше 3 раза пересоздать выборки и обучить модель и взять среднюю точность, чем использовать всегда одни и теже тренировочную и валидационные выборки.

Понравилось про белковые нейронные сети :) . Иногда ввиду неудачной топологии они действительно производят очень неадекватные результаты.

Ага. очень хочется посмотреть на их результаты. Мне есть что показать.

А вам?

Впрочем, вопрос, видимо, риторический. 

 
Vadim Shishkin:
Ага. Не подскажете, который год идёт разработка, и где можно посмотреть ея результаты? :)
Лет несколько. Здесь в теме ее результат.
Причина обращения: