Попробуйте вытащить листья деревьев из CatBoost - Общее обсуждение

Aleksey Vyazmikin 2019.09.28 19:29 #15441

Maxim Dmitrievsky:

тестер для питона, либа - их полно всяких разных

относительно всего остального - сейчас гоняю с разными параметрами и энтузиазм пропадает, такой же оверфит как и у леса

несложно понять где трейн а где тест. Т.е., по сути, ничего не изменилось, катбуст не дал преимуществ.

Позже попробую lstm

Если считаете, что переобучение, то прекращайте генерацию деревьев раньше, но судя по числу сделок там скорей недообучение...

Какой получается на разных выборках Precision и Recall?

У Вас выборка в файле есть - мне было бы интересно покрутить, сравнить динамику обучения с моими данными, если будет хорошая модель, то скину.

Кстати, я решил попробовать вытащить листья деревьев из CatBoost - вот не знаю, найдутся ли среди них хорошие экземпляры, или сама идеология бустинга этого не предполагает, как думаете?

Группировка листьев - требуются пересечение EMA 5 x Собираю команду для развития

Aleksey Vyazmikin 2019.09.28 19:30 #15442

mytarmailS:

я вам так скажу, экстремум который будет самым значимым на протяжении следующего часа например , предсказать легче чем значение след свечи, или цвета свечи, или направление зиг зага или...

По крайней мере у меня так, и этому есть разумное объяснение.

Что значит "самый значимый экстремум" - как проверяете потом, значим он или нет?

Какое всему этому разумное объяснение - весьма интересно.

Maxim Dmitrievsky 2019.09.28 20:13 #15443

Aleksey Vyazmikin:

Если считаете, что переобучение, то прекращайте генерацию деревьев раньше, но судя по числу сделок там скорей недообучение...

Какой получается на разных выборках Precision и Recall?

У Вас выборка в файле есть - мне было бы интересно покрутить, сравнить динамику обучения с моими данными, если будет хорошая модель, то скину.

Кстати, я решил попробовать вытащить листья деревьев из CatBoost - вот не знаю, найдутся ли среди них хорошие экземпляры, или сама идеология бустинга этого не предполагает, как думаете?

переобучение в смысле слабой генерализации. Выше уже написал как можно обойти проблему, но существуют более изящные подходы, уверен

с самим кач-вом обучения на трейн + валид проблем вообще нет

Sergey Chalyshev 2019.09.28 20:42 #15444

Смотрю все пытаются тренировать сеть с помощью учителя.

Кто нибудь пробовал тренировать по целевой функции, например фактор-восстановления?

Forester 2019.09.28 20:43 #15445

Aleksey Vyazmikin:
вытащить листья деревьев из CatBoost - вот не знаю, найдутся ли среди них хорошие экземпляры, или сама идеология бустинга этого не предполагает, как думаете?

Не предполагает.

В XGBoost первое дерево - грубая модель. Остальные корректируют первое, причем с микроскопическим коэффициентом. Ничего там работающего отдельно не вытащите, они только всей толпой дают хороший результат.
В катбусте видимо тот же базовый принцип, со своими особенностями.

Советники: Tsunami Интересное и Юмор торговая стратегия на базе

Forester 2019.09.28 20:53 #15446

Maxim Dmitrievsky:

относительно всего остального - сейчас гоняю с разными параметрами и энтузиазм пропадает, такой же оверфит как и у леса

несложно понять где трейн а где тест. Т.е., по сути, ничего не изменилось, катбуст не дал преимуществ.

Видимо и нет смысла усложнять систему комплексом программ MQL + Питон + Катбуст. А искать закономерности алглибовским лесом.

Если закономерность есть, то пусть лес ей обучится на 90%, а не на 99% как катбуст. Главное найти, а уже потом гнаться за процентами. Сейчас же и там и там получается около 50%.

Обсуждение статьи "Рынок и Собираю команду для развития FAQ по сервису Сигналы

Sergey Chalyshev 2019.09.28 20:57 #15447

Похоже с этими лесами все в дебри ушли,

и выбраться оттуда без посторонней помощи уже невозможно )))

Maxim Dmitrievsky 2019.09.28 20:59 #15448

elibrarius:

Видимо и нет смысла усложнять систему комплексом программ MQL + Питон + Катбуст. А искать закономерности алглибовским лесом.

Если закономерность есть, то пусть лес ей обучится на 90%, а не на 99% как катбуст. Главное найти, а уже потом гнаться за процентами. Сейчас же и там и там получается около 50%.

интересно все пощупать, и то и другое.. если не с чем сравнить то и понять ничего невозможно

Aleksey Vyazmikin 2019.09.28 21:34 #15449

Maxim Dmitrievsky:

переобучение в смысле слабой генерализации. Выше уже написал как можно обойти проблему, но существуют более изящные подходы, уверен

с самим кач-вом обучения на трейн + валид проблем вообще нет

Так может дело всё ж в данных, уже не первый раз слышу от разных лекторов, что однородные данные, такие как приращение, лучше отдать на корм НС, а деревья разных типов лучше работают с неоднородными данными - паттерны, новости, коэффициенты риска, время, события, плотность стакана, открытый интерес, объемы.

Кстати, насчет приращений, пробовали не в пунктах измерять, а по ATR, или в процентах от цены закрытия?

От теории к практике Индикаторы: OrderPercent2 Основа MQL 5

Aleksey Vyazmikin 2019.09.28 21:34 #15450

Sergey Chalyshev:

Смотрю все пытаются тренировать сеть с помощью учителя.

Кто нибудь пробовал тренировать по целевой функции, например фактор-восстановления?

Я отбираю листья и строю из них модель по своим параметрам.

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1545