Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1281

 
elibrarius:
Регрессию (в исполнении леса) буду тестировать, но потом.

Это как с трендом? Когда поймешь что это тренд, то он уже подходит к концу и уже пора выходить, а не входить.

ну они так писали, не знаю.. метафорически правда, думали что так сложно понять

 
Alexander_K2:

Остаюсь при своем мнении: здесь обитают два безусловных родственника почтенного КсанКсаныча (Фа). 1) Алешенька-сынок, настигнутый разъяренными инвесторами, и 2) внук Кеша, сулящий миллиарды всем, прочитавшим творения своего дедушки.

Прошу их не путать!

Не сравнивайте пожалуйста СанСаныча с Алёшей, Визардом и тд, СанСаныч - профи, а Алёша с Визардом - Форекс-демотиваторы, которые слили пару сотен$ и обиделись на весь мир. Я никакой не внук СанСаныча, просто его уважаю и считаю его статью очень полезной, чего не скажешь о статьях и поучениях Ученика Конюха, который коллекционирует ссылки и термины чтобы выглядеть наукообразно, но на деле ноль без палочки.

 
elibrarius:

На обучающей, т.к. деревья недообученные. В переобученых деревьях надо было бы на тестовой, т.к. дерево запомнило бы и шум.
В недообученных думаю это не важно.
Зато важен размер выборки. Чем она больше, тем она более репрезентативна. А обучающий участок у меня в 3 раза больше.

---------

Судя по учебнику https://www.mql5.com/ru/blogs/post/723619 большая репрезентативная выборка делает необязательной балансировку по классам, уменьшая временные случайности. Перенес это на недообученные деревья.
Но может и ошибаюсь и надо на тестовом участке проверять значимость предикторов.

Как определяете дообученное или нет дерево (лес из деревьев)?

Думаю, в любом случае методика должна состоять из проверки стабильности дерева на разных выборках (как изменяется эта стабильность на разных участках выборки/выборок), обучения и тестовых. А иначе Вы измеряете любой шум, просто хорошо лежащий на истории, т.е. не находите закономерности с помощью дерева, а только описываете историю движения цены и тут любые предикторы подойдут - главное, что б они стабильно и часто попадались.

Я вот ищу такие закономерности (листья или модели мини ансамблей кэтбуста), которые приносят доход желательно каждый год (2014-2018) и отвечают ряду дополнительных критериев.

 
Кеша Рутов:

Кеша внучек, дай еще раз взглянуть на "тренды", а то всех шутов забанили, один ты остался

как там твои леса, предсказывают тренды? рассказывай
 
Aleksey Vyazmikin:

Как определяете дообученное или нет дерево (лес из деревьев)?

Думаю, в любом случае методика должна состоять из проверки стабильности дерева на разных выборках (как изменяется эта стабильность на разных участках выборки/выборок), обучения и тестовых. А иначе Вы измеряете любой шум, просто хорошо лежащий на истории, т.е. не находите закономерности с помощью дерева, а только описываете историю движения цены и тут любые предикторы подойдут - главное, что б они стабильно и часто попадались.

Я вот ищу такие закономерности (листья или модели мини ансамблей кэтбуста), которые приносят доход желательно каждый год (2014-2018) и отвечают ряду дополнительных критериев.

Стабильные и часто попадающиеся предикторы связанные с целевыми и есть закономерности.

А стабильные и часто попадающиеся наукообразные термины в постах не связанные с результатами, это скорее всего переобучение:)

 
Ivan Negreshniy:

Стабильные и часто попадающиеся предикторы связанные с целевыми и есть закономерности.

Представьте предиктор - день/ночь, и днем у Вас будет, к примеру больше 1 в целевых, это хороший предиктор? Или дело не в том, что день, а в том, что днем выходят чаще важные новости (влияющие на рынок), чем ночью.

Ivan Negreshniy:

А стабильные и часто попадающиеся наукообразные термины в постах не связанные с результатами, это скорее всего переобучение:)

Не думаю, что уместно так судить о человеке, который очень многое делает тут для популяризации МО...

 
Maxim Dmitrievsky:

Кеша внучек, дай еще раз взглянуть на "тренды", а то всех шутов забанили, один ты остался

как там твои леса, предсказывают тренды? рассказывай

У меня всё Ок, стабильные 10-15% ошибки, на тестатах. На реале пока всё сумбурно, неопределённо, но Я ТОРГУЮ, РИСКУЮ, в отличии от вас и подобных учеников конюхов, сидящих на шее у престарелых родителей.

 
Aleksey Vyazmikin:

Как определяете дообученное или нет дерево (лес из деревьев)?

Ограничил дерево 1 строчкой:

samples++; if(samples < 20){  то больше не делить узел, а оставить листом}

т.е. в листе останется не менее 20 примеров, для репрезентативности.

Вот и весь релиз, который вы просили)))

Степень недообученности, т.е. число примеров в листе можно любое 10, 100, 1000 или оптимизировать. В xgboost называется min_child_weight

 
Aleksey Vyazmikin:

Представьте предиктор - день/ночь, и днем у Вас будет, к примеру больше 1 в целевых, это хороший предиктор? Или дело не в том, что день, а в том, что днем выходят чаще важные новости (влияющие на рынок), чем ночью.

Не думаю, что уместно так судить о человеке, который очень многое делает тут для популяризации МО...

Конечно - день/ночь или по иному формализованное время является важным предиктором, что подтверждают ТС построенные с учетом торговых сессий.

И конечно, я не о том, кто многое делает и пишет, а о том кто только бла-бла-бла:)

 
Кеша Рутов:

У меня всё Ок, стабильные 10-15% ошибки, на тестатах. На реале пока всё сумбурно, неопределённо, но Я ТОРГУЮ, РИСКУЮ, в отличии от вас и подобных учеников конюхов, сидящих на шее у престарелых родителей.

к сожалению (или к счастью) нам о твоей торговле\рисках ничего не известно, как и обо всем остальном

поэтому пока ты просто никто, выражающее свое никому не нужное мнение

такова реальность

если ты просто захотел хайпануть в теме, которую мы с пацанами поднимаем, то пиши хотя бы не птичий лепет а интересные вещи

Причина обращения: