Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2976

 
Aleksey Vyazmikin #:
С другой стороны, никто не мешает более точно сразу разбить предиктор на квантовые отрезки с учетом целевой.

Это задача дерева - найти лучшую точку разделения, так чтобы чистота классов целевой правого и левого участка была максимальной.

Хотите оценивать чистоту при квантовании? По сути вы хотите делать то же, что будет делать потом дерево. Отключите квантизацию и получите то, что вы хотите. Дерево подберет наилучшую точку сплита с учетом целевой.

 
Forester #:

Это задача дерева - найти лучшую точку разделения, так чтобы чистота классов целевой правого и левого участка была максимальной.

Хотите оценивать чистоту при квантовании? По сути вы хотите делать то же, что будет делать потом дерево. Отключите квантизацию и получите то, что вы хотите. Дерево подберет наилучшую точку сплита с учетом целевой.

Устал уже объяснять, что "наилучшая" часто не лучший выбор.

Вместо вопросов - утверждения - будто религией занимаемся...

 
Aleksey Vyazmikin #:

Устал уже объяснять, что "наилучшая" часто не лучший выбор.

Вместо вопросов - утверждения - будто религией занимаемся...

У вас специфический подход со специфической терминологией, люди не готовы жертвовать пространством на своем жестком диске для такой инфы, без понимания результата. Я вижу выход - это либо сделать подробную статью чтобы найти энтузиастов, которые (скорее всего) сразу начнут это толкать в маркете 😀, либо кому-то немного приплачивать как подмастерью. Либо студента за палку колбасы.

Вот на примере своей последней статьи про мета модели даже. Сколько человек написало с предложениями и улучшениями, идеями? Ноль :) а там готовая ТС навороченная. Сколько взяли и юзают? Как минимум несколько, без фидбэков.

Это вообще очень сложный вопрос, когда что-то делаешь и потом боишься это в открытый доступ, чтобы не оказаться лопушком. Но в то же время хочешь, чтобы тебе помогли. Здесь же на 1 мать Терезу по 1000 коршунов, просто съедят со всеми потрохами. Это такая сфера деятельности специфическая. Тогда все сам :)
 
Maxim Dmitrievsky #:
У вас специфический подход со специфической терминологией, люди не готовы жертвовать пространством на своем жестком диске для такой инфы, без понимания результата. Я вижу выход - это либо сделать подробную статью чтобы найти энтузиастов, которые (скорее всего) сразу начнут это толкать в маркете 😀, либо кому-то немного приплачивать как подмастерью. Либо студента за палку колбасы.

В конкретной теме вроде как использую термин "квантовый отрезок" из нестандартного, что означает просто диапазон значений предиктора. Почему такой термин получился - изначально от квантовой таблицы, которая разделяет предиктор через какую либо формулу квантования.

Со статьей тут сложно - не ясно, что написать полезного, что не описано в другом месте. И чем наполнять - сравнительными тестами или логическими выкладками. Логику надо подтверждать формулами, а это я не смогу сделать.

Взять умного студента - да хорошо бы,  если он будет понимать суть, а не только формулы. Есть опыт, как такого найти?

Maxim Dmitrievsky #:
Вот на примере своей последней статьи про мета модели даже. Сколько человек написало с предложениями и улучшениями, идеями? Ноль :) а там готовая ТС навороченная. Сколько взяли и юзают? Как минимум несколько, без фидбэков.

По статьям на питоне очень мало целевой аудитории. В этом смысле заинтересованных больше у Дмитрия с его циклом статей - нажал в тестере и получил результат. По самой идеи - попробуйте делать отсев не по 0,5, а по 0,35 - т.е. TN где классифицируется с большой уверенностью, и желательно на контрольной для остановки обучения выборки.

Maxim Dmitrievsky #:
Это вообще очень сложный вопрос, когда что-то делаешь и потом боишься это в открытый доступ, чтобы не оказаться лопушком. Но в то же время хочешь, чтобы тебе помогли. Здесь же на 1 мать Терезу по 1000 коршунов, просто съедят со всеми потрохами. Это такая сфера деятельности специфическая. Тогда все сам :)

Если я даже выложу код на 3000 строк, без учета вспомогательных классов, то разве кто будет вникать? Поэтому, казалось, я спросил конкретно про метрики, характеризующие выборку, с уточнением - в приделах квантового отрезка одного предиктора, а скатились опять про обсуждение квантовых таблиц и какой от них толк.

 
Aleksey Vyazmikin #:

Взять умного студента - да хорошо бы,  если он будет понимать суть, а не только формулы. Есть опыт, как такого найти?

По статьям на питоне очень мало целевой аудитории. В этом смысле заинтересованных больше у Дмитрия с его циклом статей - нажал в тестере и получил результат. По самой идеи - попробуйте делать отсев не по 0,5, а по 0,35 - т.е. TN где классифицируется с большой уверенностью, и желательно на контрольной для остановки обучения выборки.

Студент должен вас сам найти :)
По статье - да, в общем случае чем меньше фракция плохих сделок, тем более редкие и точные сделки. Еще зависит от признаков и других ухищрений. Самое главное это принцип, что искусственный трейдер может сам искать неэффективности. По аналогии с тем, как это может делать человек. И чем больше областей знаний используется при подготовке ТС, Тем больше нейросетей может быть в алгоритме, каждая делает что-то свое. Не обязательно должно выглядеть как в статье.

Дмитрий заморочился знатно, но не сможет потом все поддерживать ввиду обьема. Теперь еще и смысла нет, поскольку есть onnx. Юзабилити там какое? Написать тонны кода чтобы понять что-то неизвестно что. Например то, что РЛ - метод оптимизации, такой же как остальные. А трейдить когда :)

Ты, допустим, трейдер, но не математик и не программист ни разу. И начинаешь делать страшные вещи: изучать программирование и формулы.. идут годы.. Потом ты в конце узнаешь, что даже математики не справились с поставленными тобой задачами, а ты всего лишь только какой-нибудь джуниор. Незавидная судьба трейдера-одиночки.
 
Что за Дмитрий? 
 

Открыта предварительная версия просмотра ONNX моделей прямо в редакторе:


 
mytarmailS #:
Что за Дмитрий? 
Статьи по RL
 
Renat Fatkhullin #:

Открыта предварительная версия просмотра ONNX моделей прямо в редакторе:


Вроде обычно их визуализируют графами.

Что в принципе может дать визуализация?

 
Maxim Dmitrievsky #:
Студент должен вас сам найти :)

Хм, как бы ему узнать ещё это :)

Maxim Dmitrievsky #:
По статье - да, в общем случае чем меньше фракция плохих сделок, тем более редкие и точные сделки.

Я то как раз написал про меньший объём правильно классифицированных плохих примеров за счет их точности классификации.

Maxim Dmitrievsky #:
Дмитрий заморочился знатно, но не сможет потом все поддерживать ввиду обьема. Теперь еще и смысла нет, поскольку есть onnx. Юзабилити там какое? Написать тонны кода чтобы понять что-то неизвестно что. Например то, что РЛ - метод оптимизации, такой же как остальные. А трейдить когда :)

Там у него очень тяжело читаемый код, но разобраться в целом можно. Думаю, для его личного понимания МО это очень хороший стимул. Ну и воспроизводимый код - очень важен для понимания процесса. Особенно, если кто хочет делать нечто своё.

Maxim Dmitrievsky #:
Ты, допустим, трейдер, но не математик и не программист ни разу. И начинаешь делать страшные вещи: изучать программирование и формулы.. идут годы.. Потом ты в конце узнаешь, что даже математики не справились с поставленными тобой задачами, а ты всего лишь только какой-нибудь джуниор. Незавидная судьба трейдера-одиночки.

Да, так и бывает - зря прожитые годы.

Причина обращения: