Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1545

 
Maxim Dmitrievsky:

тестер для питона, либа - их полно всяких разных

относительно всего остального - сейчас гоняю с разными параметрами и энтузиазм пропадает, такой же оверфит как и у леса

несложно понять где трейн а где тест. Т.е., по сути, ничего не изменилось, катбуст не дал преимуществ.

Позже попробую lstm


Если считаете, что переобучение, то прекращайте генерацию деревьев раньше, но судя по числу сделок там скорей недообучение...

Какой получается на разных выборках Precision и Recall?

У Вас выборка в файле есть - мне было бы интересно покрутить, сравнить динамику обучения с моими данными, если будет хорошая модель, то скину.


Кстати, я решил попробовать вытащить листья деревьев из CatBoost - вот не знаю, найдутся ли среди них хорошие экземпляры, или сама идеология бустинга этого не предполагает, как думаете?

 
mytarmailS:

я вам так скажу, экстремум который будет самым значимым на протяжении следующего часа например , предсказать легче чем значение след свечи, или цвета свечи, или направление зиг зага или...

По крайней мере у меня так, и этому есть разумное объяснение.

Что значит "самый значимый экстремум" - как проверяете потом, значим он или нет?

Какое всему этому разумное объяснение - весьма интересно.

 
Aleksey Vyazmikin:

Если считаете, что переобучение, то прекращайте генерацию деревьев раньше, но судя по числу сделок там скорей недообучение...

Какой получается на разных выборках Precision и Recall?

У Вас выборка в файле есть - мне было бы интересно покрутить, сравнить динамику обучения с моими данными, если будет хорошая модель, то скину.


Кстати, я решил попробовать вытащить листья деревьев из CatBoost - вот не знаю, найдутся ли среди них хорошие экземпляры, или сама идеология бустинга этого не предполагает, как думаете?

переобучение в смысле слабой генерализации. Выше уже написал как можно обойти проблему, но существуют более изящные подходы, уверен

с самим кач-вом обучения на трейн + валид проблем вообще нет

 

Смотрю все пытаются тренировать сеть с помощью учителя.

Кто нибудь пробовал тренировать по целевой функции, например фактор-восстановления?

 
Aleksey Vyazmikin:
вытащить листья деревьев из CatBoost - вот не знаю, найдутся ли среди них хорошие экземпляры, или сама идеология бустинга этого не предполагает, как думаете?

Не предполагает.

В XGBoost  первое дерево - грубая модель. Остальные корректируют первое, причем с микроскопическим коэффициентом. Ничего там работающего отдельно не вытащите, они только всей толпой дают хороший результат.
В катбусте видимо тот же базовый принцип, со своими особенностями.
 
Maxim Dmitrievsky:

относительно всего остального - сейчас гоняю с разными параметрами и энтузиазм пропадает, такой же оверфит как и у леса

несложно понять где трейн а где тест. Т.е., по сути, ничего не изменилось, катбуст не дал преимуществ.

Видимо и нет смысла усложнять систему комплексом программ MQL + Питон + Катбуст. А искать закономерности алглибовским лесом.

Если закономерность есть, то пусть лес ей обучится на 90%, а не на 99% как катбуст. Главное найти, а уже потом гнаться за процентами. Сейчас же и там и там получается около 50%.

 

Похоже с этими лесами все в дебри ушли,

и выбраться оттуда без посторонней помощи уже невозможно )))

 
elibrarius:

Видимо и нет смысла усложнять систему комплексом программ MQL + Питон + Катбуст. А искать закономерности алглибовским лесом.

Если закономерность есть, то пусть лес ей обучится на 90%, а не на 99% как катбуст. Главное найти, а уже потом гнаться за процентами. Сейчас же и там и там получается около 50%.

интересно все пощупать, и то и другое.. если не с чем сравнить то и понять ничего невозможно

 
Maxim Dmitrievsky:

переобучение в смысле слабой генерализации. Выше уже написал как можно обойти проблему, но существуют более изящные подходы, уверен

с самим кач-вом обучения на трейн + валид проблем вообще нет

Так может дело всё ж в данных, уже не первый раз слышу от разных лекторов, что однородные данные, такие как приращение, лучше отдать на корм НС, а деревья разных типов лучше работают с неоднородными данными - паттерны, новости, коэффициенты риска, время, события, плотность стакана, открытый интерес, объемы.

Кстати, насчет приращений, пробовали не в пунктах измерять, а по ATR, или в процентах от цены закрытия?

 
Sergey Chalyshev:

Смотрю все пытаются тренировать сеть с помощью учителя.

Кто нибудь пробовал тренировать по целевой функции, например фактор-восстановления?

Я отбираю листья и строю из них модель по своим параметрам.

Причина обращения: