Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1300

 
Aleksey Vyazmikin:

Опять я потерял ход мысли. Если мы по прежнему про отбор моделей, то у всех моделей почти одинаковые предикторы (метрики, распределение вероятности, баланс ошибки, и т.д.), с целевыми сложней, это я к тому, что тема глобальная и всеобъемлющая, актуальная не только для МО в трейдинге, поэтому как бы есть что обсуждать, на мой взгляд. 

что это за предикторы такие?

не понятно чем вы вообще занимаетесь, в принципе

 
Maxim Dmitrievsky:

что это за предикторы такие?

Это разная информация о поведении модели на выборке и даже о структуре модели (к примеру число сплитов и/или деревьев), там прилично получается, во всяком случае у меня.

Приложил информацию о модели, что собираю я, правда там ещё специализированная информация чисто для трейдинга.

Из подобных данных формируется выборка и можно обучать модель для отбора нужных моделей.

Maxim Dmitrievsky:

не понятно чем вы вообще занимаетесь, в принципе

Я делаю то, что считаю нужным :)

Файлы:
 
Aleksey Vyazmikin:

Это разная информация о поведении модели на выборке и даже о структуре модели (к примеру число сплитов и/или деревьев), там прилично получается, во всяком случае у меня.

Приложил информацию о модели, что собираю я, правда там ещё специализированная информация чисто для трейдинга.

В смысле это не предикторы а показатели каждой модели тогда может? потому что предикторы это то что на вход модели подается

ну вот есть у вас куча показателей разных, что с этой кучей делать?

надо из всех полезных показателей сделать одну взвешенную метрику и по ней выбирать лучшую модель на автомате, по аргмаксу

 
Вы чего не спите по ночам? Или вы где-то в Америке живете?
 
Maxim Dmitrievsky:

В смысле это не предикторы а показатели каждой модели тогда может? потому что предикторы это то что на вход модели подается

ну вот есть у вас куча показателей разных, что с этой кучей делать?

надо из всех полезных показателей сделать одну взвешенную метрику и по ней выбирать лучшую модель на автомате, по аргмаксу

А предикторы это что не показатели влияющие на целевую? Какая то игра слов :)

В том то и дело, что формулы этой "взвешенной метрики" нет, и поиск её - удел МО.

 
Aleksey Vyazmikin:

А предикторы это что не показатели влияющие на целевую? Какая то игра слов :)

В том то и дело, что формулы этой "взвешенной метрики" нет, и поиск её - удел МО.

у вас в таблице ЧТО? я вижу там оценки моделей, акурас и прочее. Причем тут предикторы?

вот именно что какая-то игра слов, читаю и не пойму что читаю, о чем речь ))

 
elibrarius:
Вы чего не спите по ночам? Или вы где-то в Америке живете?

Бессонница от стрессов...

 
Maxim Dmitrievsky:

у вас в таблице ЧТО? я вижу там оценки моделей, акурас и прочее. Причем тут предикторы?

вот именно что какая-то игра слов, читаю и не пойму что читаю, о чем речь ))

Оценка модели не влияет на её результативность при применении на незнакомой выборке?

 
Aleksey Vyazmikin:

Оценка модели не влияет на её результативность при применении на незнакомой выборке?

ну вы что делаете то? строите кучу разных моделей и проверяете какая лучше работает?

причем тут "листья" тогда, отбор лучших листьев и т.п.?

я просто пытаюсь въехать, что бы понимать что вы пишете периодически

или там каждая строка одному листу соответствует 
 
Maxim Dmitrievsky:

ну вы что делаете то? строите кучу разных моделей и проверяете какая лучше работает?

причем тут "листья" тогда, отбор лучших листьев и т.п.?

я просто пытаюсь въехать, что бы понимать что вы пишете периодически

Кажется разговор шёл об автоматическом отборе модели, я пояснил, что интересные модели можно отбирать двумя способами, через известный критерий и формулу (как я это делаю сейчас - 3 последних колонки заполняются для каждой выборки и для каждой выборки формируется такая таблица, если 3 колонки-фильтра совпали то модель отбирается), а можно с помощью машинного обучения, когда понимаешь что хочешь от модели в работе на независемой выборке, но не знаешь, как этого добиться. Так вот для второго способа разные метрические показатели модели становятся предикторами и по ним происходит обучение модели, которая уже посредством МО отбирает из аналогичных данных подходящие модели. Подобный опыт с обучением я проводил в том году, он показал положительные результаты, в плане точность оценки хорошая, а полнота не очень, тогда я решил, что не хватает разнообразия в выборке и отложил работы до лучших времен. Сейчас выборок много генерируется разных и можно вернуться к этой работе. Главная идея не отбор лучшего из имеющегося пула, а отбор лучших по абсолютным критериям, будь то МО или фиксированный показатель.

Листья - это уже работа с отобранными моделями.

Каждая строка - отдельная модель.
Причина обращения: