Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1323

 

Мастер класс по CatBoost - там по ссылкам можно скачать код по видео для работы в питоне


 
Yuriy Asaulenko:

Чисто технический вопрос. Допустим, имеем 3 предиктора - х1, х2, х3. Мы знаем также, что х1-х2, х1-х3, х2-х3 тоже являются предикторами. Насколько я знаком с деревьями, эти дополнительные предикторы тоже надо подавать в модель. 

Но дело обстоит несколько хуже, предикторами являются некие а11*х1-b2*x2, a12*x1-a3*x2, и т.д. Коэффициенты я, разумеется не знаю. Возможны и более сложные комбинации предикторов, эти приведенны только для примера.

НС с такими вещами (линейными комбинациями предикторов) справляется и мне изощряться не надо, и подаем на входы только х1, х2 и х3, не заморачиваясь.

С деревьями в таких случаях что делать? Что-то внятное по этому поводу не нашел. Или деревья сами справятся?

Теоретически дерево может описать функцию, но это получиться участок с коэффициентами (x), при изменении которых, но сохранении самой функции, дерево уже не будет так эффективно, ведь оно запоминает поле события константами. Это мои мысли, может я ошибаюсь. Для таких задач лучше использовать НС и давать дереву какой то уже готовый ответ функции, который не будет менять логику интерпретации в зависимости от изменения аргументов функции. Поэтому дереву предпочтительней давать ограниченный набор аргументов.

Как раз изменение в этих x и будет приводить к потребности переобучать модель.

В общем, если аргументы функции в известном диапазоне, который представлен выборкой для обучения, то дерево должно справится с задачей. Но это задача регрессии, а не классификации.
 
Aleksey Vyazmikin:

Теоретически дерево может описать функцию, но это получиться участок с коэффициентами (x), при изменении которых, но сохранении самой функции, дерево уже не будет так эффективно, ведь оно запоминает поле события константами. Это мои мысли, может я ошибаюсь. Для таких задач лучше использовать НС и давать дереву какой то уже готовый ответ функции, который не будет менять логику интерпретации в зависимости от изменения аргументов функции. Поэтому дереву предпочтительней давать ограниченный набор аргументов.

Как раз изменение в этих x и будет приводить к потребности переобучать модель.

С НС я работаю, с ними понятно. В деревьях привлекает то, что они генерируют логику, типа if...then.... , что, в общем, и надо - на выходе д.б решение -да/нет. Но, похоже, что даже с подобной логикой деревья уже не справятся, даже если мы подадим им все это на вход.

Сs11=PredTraid==[] and Stoch[0][i] > Stoch[1][i]+0.3 and Stoch[0][i-1] <= Stoch[1][i-1]
 
Yuriy Asaulenko:

С НС я работаю, с ними понятно. В деревьях привлекает то, что они генерируют логику, типа if...then.... , что, в общем, и надо - на выходе д.б решение -да/нет. Но, похоже, что уже с подобной логикой деревья уже не справятся, даже если мы подадим им все это на вход.

Надо подать и посмотреть - сделайте выборки, и проверим.

 
Aleksey Vyazmikin:

Надо подать и посмотреть - сделайте выборки, и проверим.

Не, неудачный пример. С таким справятся.)

 
Yuriy Asaulenko:

Не, неудачный пример. С таким справятся.)

Справится конечно, просто у НС за счет нейронов получаются именно формулы, а у деревьев получается только интерпретация результатов вычисления. Думаю, если нарисовать примитив, который сложно описать функцией, ну к примеру домик из детского рисунка, то НС будет очень долго копошится, в то время как дерево быстро определит координаты этого объекта и просто их превратит в вектора. Но если изменить масштаб, то дерево уже не сможет определить этот домик, а вот НС по идеи должна определить.

 
Aleksey Vyazmikin:

Мастер класс по CatBoost - там по ссылкам можно скачать код по видео для работы в питоне


хороший, хорошо разжевано

 
Maxim Dmitrievsky:

хороший, хорошо разжевано

Да, там базовые настройки хорошо даны, особенно если на питоне сразу запускать. Но мне вот этого уже маловато.

 
Aleksey Vyazmikin:

Да, там базовые настройки хорошо даны, особенно если на питоне сразу запускать. Но мне вот этого уже маловато.

щоу шипилявых правда, Анна Вероника лучше рассказывает, заодно пританцовывает еще

 
Maxim Dmitrievsky:

щоу шипилявых правда, Анна Вероника лучше рассказывает, заодно пританцовывает еще

Не знаю, я на это внимание не обращаю, смотрю в ускоренном режиме обычно.

В любом случае, есть вопросы, которые требуют ответа от создателей, а как их задавать я не знаю, в плане где их задавать.

Причина обращения: