Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2611
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
делать стратегию, основываясь на инфу от СМЕ не стоит
т.к.
как только они заметят, они умеют делать вброс лажовой инфы
плавали как бы ужо ;)
Получается типа бустинга, как Алексей заметил
улучшение на каждой итерации, с учетом экзаменационной выборки
Но зад плохо подтягивает (слева), но иногда лучше
настроек много, объяснять подробно не буду. Идею описал как смог.
если подождать 100 итераций
Получается типа бустинга, как Алексей заметил
улучшение на каждой итерации, с учетом экзаменационной выборки
Но зад плохо подтягивает (слева), но иногда лучше
настроек много, объяснять подробно не буду. Идею описал как смог.
Тут по сути достаточно посмотреть 2 графика (эквити) - все на чистом OOS: 1 - первая модель, обученная, без всяких изысков, 2 - после вот этих всех описанных процедур. Ну и метрики можно - PF, RF, winrate. А так не понятно, какой эффект, красивая кривая обучения это, как я понимаю, на IS?
Тут по сути достаточно посмотреть 2 графика (эквити) - все на чистом OOS: 1 - первая модель, обученная, без всяких изысков, 2 - после вот этих всех описанных процедур. Ну и метрики можно - PF, RF, winrate. А так не понятно, какой эффект, красивая кривая обучения это, как я понимаю, на IS?
первая треть графика - новые данные, не участвует в обучении
по картинкам с 25 и 100 итерациями видно, что улучшилась при 100, хотя максимум был в районе 70Есть такая постановка вопроса:
Используются 2 модели. Одна прогнозирует купить или продать, другая торговать или нет.
Сначала обучается первая, затем смотрим где она плохо предсказывает, размечаем эти примеры как "не торговать", остальные хорошие как "торговать", обучаем этому вторую модель.
Первая модель проверяется не только на обучающем участке, но и дополнительном, а вторая обучается на обоих участках.
Повторяем это несколько раз, переобучая обе модели на том же датасете. Результаты постепенно улучшаются на выборках. Но на контрольной выборке не всегда.
Параллельно этому ведется журнал плохих сделок кумулятивный по всем проходам, все "плохие" сделки для "не торговать" собираются в нем для обучения второй модели и фильтруются по некоторому принципу, типа чем больше копий плохих сделок за все проходы, тем больше шанс разметить их как "не торговать"
Например, по каждой дате за все итерации обучений накоплено некоторое количество плохих сделок, где это количество превышает порог (mean, среднее), те сделки размечтаются как "не торговать". Остальные пропускаются, иначе так можно было бы исключить все сделки, если итераций обучения много.
коэффициент позволяет отрегулировать количество сделок на выходе, чем он ниже тем больше сделок фильтруется
... к этому моменту я уже устал писать ...
Как можно улучшить такую комбинацию моделей, чтобы она улучшала результаты свои на новом независимом участке?
Есть ли какая-то философия почему это может работать? Кроме той, что модели естественным образом улучшают друг друга (падают ошибки) на каждом круге переобучения, но как избавиться от подгонки?
Иллюстрация. График разбит на 3 части. На последнем обучается первая модель, на предпоследней и последней вторая, первая треть это экзаменационная выборка. Естественным образом последний участок будет самым лучшим, а первая треть самой плохой.
Здесь было 15 итераций переобучения обеих моделей, с использованием журнала плохих сделок.
похоже на банальный Multi-Label Classificaton - надо не комбинацию моделей варьировать, а комбинацию предикторов -- прежде всего разделение предикторов на features of smart & retail actions... ведь понятное дело, будут сигналы в противоход друг другу, а вот точки (временные) входа OTF (для пробоя уровней) - уже Edge для выбора модельки (dtf или otf action'a в рынке)... имхо
==========
или без разметки, но просто с LSTM с возможностями forget gate, чтобы потом не фильтровать отдельно из 2х моделей... но это всё дело вкуса...
у меня вот регрессия получилась по IBM (тестовые данные с конца 2021 - там правый хвост на графике цены представлен на графике train и test)... по-простому по Close...
- банальная MA получилась - и как всегда в таком случае в тренде будет работать (хоть как), во флете нет -- тоже доп фильтрацию на smart & retail behavior надо бы добавить (и модельку переделать на классификацию на входы и выходы)...
похоже на банальный Multi-Label Classificaton - надо не комбинацию моделей варьировать, а комбинацию предикторов -- прежде всего разделение предикторов на features of smart & retail actions... ведь понятное дело, будут сигналы в противоход друг другу, а вот точки (временные) входа OTF (для пробоя уровней) - уже Edge для выбора модельки (dtf или otf action'a в рынке)... имхо
==========
или без разметки, но просто с LSTMи слоями forget, чтобы потом не фильтровать отдельно из 2х моделей... но это всё дело вкуса...
у меня вот регрессия получилась по IBM (тестовые данные с конца 2021 - там правый хвост на графике цены представлен на графике train и test)... по-простому по Close... - банальная MA получилась - и как всегда в таком случае в тренде будет работать (хоть как), во флете нет -- тоже доп фильтрацию на smart & retail behavior надо бы добавить (и модельку переделать на классификацию на входы и выходы)...
это не мультилэйбл, другой смысл. Исключаются плохие сигналы итеративно, оставляются те, которые хорошо предсказываются основной моделью в общей куче, а вторая модель учится отделять плохие от хороших, запрещать или разрешать торговлю первой
с lstm всегда получается MA, проверялось давно
первая треть графика - новые данные, не участвует в обучении
по картинкам с 25 и 100 итерациями видно, что улучшилась при 100, хотя максимум был в районе 70Ну вот я бы сделал табличку, 3 варианта - 1 модель, 2 с 25 итераций, 2 с 100 итераций. И несколько трейдерских метрик (PF, winrate). Все на OSS. А-то "где-то там кусок это OSS" и метрика качества, видимо, для IS+OOS это одно. А чисто OOS померянный по-человечески это совсем другое.
Ну вот я бы сделал табличку, 3 варианта - 1 модель, 2 с 25 итераций, 2 с 100 итераций. И несколько трейдерских метрик (PF, winrate). Все на OSS. А-то "где-то там кусок это OSS" и метрика качества, видимо, для IS+OOS это одно. А чисто OOS померянный по-человечески это совсем другое.
табличек куча, скинул чисто обзорно принцип работы
идея до конца не оформлена, эксперименты вечером под кофе :з