Обсуждается автоматический отбор моделей с использованием метрик и машинного обучения

[Удален] 2019.02.08 04:33 #12991

Aleksey Vyazmikin:

Опять я потерял ход мысли. Если мы по прежнему про отбор моделей, то у всех моделей почти одинаковые предикторы (метрики, распределение вероятности, баланс ошибки, и т.д.), с целевыми сложней, это я к тому, что тема глобальная и всеобъемлющая, актуальная не только для МО в трейдинге, поэтому как бы есть что обсуждать, на мой взгляд.

что это за предикторы такие?

не понятно чем вы вообще занимаетесь, в принципе

Aleksey Vyazmikin 2019.02.08 04:40 #12992

Maxim Dmitrievsky:

что это за предикторы такие?

Это разная информация о поведении модели на выборке и даже о структуре модели (к примеру число сплитов и/или деревьев), там прилично получается, во всяком случае у меня.

Приложил информацию о модели, что собираю я, правда там ещё специализированная информация чисто для трейдинга.

Из подобных данных формируется выборка и можно обучать модель для отбора нужных моделей.

Maxim Dmitrievsky:

не понятно чем вы вообще занимаетесь, в принципе

Я делаю то, что считаю нужным :)

Файлы:

CB_Analiz_Tree_Exam_All.zip 436 kb

Группировка листьев - требуются Ищем закономерности Есть ли закономерность в

[Удален] 2019.02.08 04:50 #12993

Aleksey Vyazmikin:

Это разная информация о поведении модели на выборке и даже о структуре модели (к примеру число сплитов и/или деревьев), там прилично получается, во всяком случае у меня.

Приложил информацию о модели, что собираю я, правда там ещё специализированная информация чисто для трейдинга.

В смысле это не предикторы а показатели каждой модели тогда может? потому что предикторы это то что на вход модели подается

ну вот есть у вас куча показателей разных, что с этой кучей делать?

надо из всех полезных показателей сделать одну взвешенную метрику и по ней выбирать лучшую модель на автомате, по аргмаксу

Обсуждение статьи "Применение метода Есть ли закономерность в Обсуждение статьи "Машинное обучение

Aleksei Kuznetsov 2019.02.08 06:49 #12994

Вы чего не спите по ночам? Или вы где-то в Америке живете?

Aleksey Vyazmikin 2019.02.08 09:59 #12995

Maxim Dmitrievsky:

В смысле это не предикторы а показатели каждой модели тогда может? потому что предикторы это то что на вход модели подается

ну вот есть у вас куча показателей разных, что с этой кучей делать?

надо из всех полезных показателей сделать одну взвешенную метрику и по ней выбирать лучшую модель на автомате, по аргмаксу

А предикторы это что не показатели влияющие на целевую? Какая то игра слов :)

В том то и дело, что формулы этой "взвешенной метрики" нет, и поиск её - удел МО.

[Удален] 2019.02.08 10:01 #12996

Aleksey Vyazmikin:

А предикторы это что не показатели влияющие на целевую? Какая то игра слов :)

В том то и дело, что формулы этой "взвешенной метрики" нет, и поиск её - удел МО.

у вас в таблице ЧТО? я вижу там оценки моделей, акурас и прочее. Причем тут предикторы?

вот именно что какая-то игра слов, читаю и не пойму что читаю, о чем речь ))

Aleksey Vyazmikin 2019.02.08 10:03 #12997

elibrarius:
Вы чего не спите по ночам? Или вы где-то в Америке живете?

Бессонница от стрессов...

Aleksey Vyazmikin 2019.02.08 10:04 #12998

Maxim Dmitrievsky:

у вас в таблице ЧТО? я вижу там оценки моделей, акурас и прочее. Причем тут предикторы?

вот именно что какая-то игра слов, читаю и не пойму что читаю, о чем речь ))

Оценка модели не влияет на её результативность при применении на незнакомой выборке?

[Удален] 2019.02.08 10:07 #12999

Aleksey Vyazmikin:

Оценка модели не влияет на её результативность при применении на незнакомой выборке?

ну вы что делаете то? строите кучу разных моделей и проверяете какая лучше работает?

причем тут "листья" тогда, отбор лучших листьев и т.п.?

я просто пытаюсь въехать, что бы понимать что вы пишете периодически

или там каждая строка одному листу соответствует

Обсуждение статьи "Машинное обучение Обсуждение статьи "Оценка и Сразу 2 проблемы в

Aleksey Vyazmikin 2019.02.08 10:18 #13000

Maxim Dmitrievsky:

ну вы что делаете то? строите кучу разных моделей и проверяете какая лучше работает?

причем тут "листья" тогда, отбор лучших листьев и т.п.?

я просто пытаюсь въехать, что бы понимать что вы пишете периодически

Кажется разговор шёл об автоматическом отборе модели, я пояснил, что интересные модели можно отбирать двумя способами, через известный критерий и формулу (как я это делаю сейчас - 3 последних колонки заполняются для каждой выборки и для каждой выборки формируется такая таблица, если 3 колонки-фильтра совпали то модель отбирается), а можно с помощью машинного обучения, когда понимаешь что хочешь от модели в работе на независемой выборке, но не знаешь, как этого добиться. Так вот для второго способа разные метрические показатели модели становятся предикторами и по ним происходит обучение модели, которая уже посредством МО отбирает из аналогичных данных подходящие модели. Подобный опыт с обучением я проводил в том году, он показал положительные результаты, в плане точность оценки хорошая, а полнота не очень, тогда я решил, что не хватает разнообразия в выборке и отложил работы до лучших времен. Сейчас выборок много генерируется разных и можно вернуться к этой работе. Главная идея не отбор лучшего из имеющегося пула, а отбор лучших по абсолютным критериям, будь то МО или фиксированный показатель.

Листья - это уже работа с отобранными моделями.

Каждая строка - отдельная модель.

Есть ли закономерность в Группировка листьев - требуются Будет ли хорошая стратегия

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1300