Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3554
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
В какой статье? Что выше ссылка, так там нет анализа по сути, а лишь перебор квантовых таблиц. Вообще в CatBoost встроены разные методы квантования (которых нет в библиотеке KBinsDiscretizer) - поэкспериментируйте с настройками. Есть возможность сохранять квантовые таблицы и по ним потом преобразовывать выборку для иных методов обучения.
Можно выбрать количество бинов и отдельные бины, которые аутперформят остальные. Аналог кластеризации. Поэтому писал до этого, почему не использовать просто кластеризацию.
В любом случае, безотносительно перебора или грамотного сэмлинга целевых - это пальцем в небо. Потому что искусственное ограничение вариантов.
Основной упор в классификации тайм серий (финансовых), когда есть выбор когда торговать, а когда нет (то есть уже дискретное представление ВР), стоит делать именно на разметку, а не на признаки.
Уже писал, то мой подход позволяет подобрать такие бины(кластеры) и метки, что можно ограничиться даже всего 2-5 признаками. И это делается за минуты.
Можно выбрать количество бинов и отдельные бины, которые аутперформят остальные. Аналог кластеризации. Поэтому писал до этого, почему не использовать просто кластеризацию.
И по какому критерию выбор? Чего то не вижу такой возможности в библиотеке... но опять же - это бинаризация, только под капотом.
И по какому критерию выбор? Чего то не вижу такой возможности в библиотеке... но опять же - это бинаризация, только под капотом.
По критерию на новых данных, после обучения.
По критерию на новых данных, после обучения.
Так где выбор нескольких бинов из набора, или я неправильно понял Вас?
Так где выбор нескольких бинов из набора, или я неправильно понял Вас?
Сделать выбор )) просто выбрать бин и торговать только на нем, в чем проблема?
Задача поиска ТС/закономерности сводится к простой двухмерной задаче оптимизации. Это продиктовано самой природой ВР (двухмерность).
Когда минимизируются 2 ошибки:
Как конкретно вы это решаете, вопрос чисто технический.
И здесь абсолютно критичную роль играет, опять же, не способ дискретизации (хотя он тоже может быть важен), а способ разметки сделок внутри бинов.
Сделать выбор )) просто выбрать бин и торговать только на нем, в чем проблема?
Сделать всегда можно, просто подумал, что есть готовый функционал - интересны были критерии отбора.
А так - по сути - если нужна именно кластеризация, то можно использовать любую, по которой можно потом применять новые данные, просто вытащить пороги по кластерам и записать в квантовую таблицу, которую уже можно подать в CatBoost. Это ускорит процесс, так как не нужно будет повторно считать кластера при эксперименте.
Сделать всегда можно, просто подумал, что есть готовый функционал - интересны были критерии отбора.
А так - по сути - если нужна именно кластеризация, то можно использовать любую, по которой можно потом применять новые данные, просто вытащить пороги по кластерам и записать в квантовую таблицу, которую уже можно подать в CatBoost. Это ускорит процесс, так как не нужно будет повторно считать кластера при эксперименте.
Основная проблема в разметке сделок. Если разметка мусорная, то дискретизация что-то даст, но мало.
Под каждый бин может понадобиться своя разметка.Основная проблема в разметке сделок. Если разметка мусорная, то дискретизация что-то даст, но мало.
Под каждый бин может понадобиться своя разметка.Если выборка формируется на каждом баре, то можно и в этом направлении думать. Типа разные состояния - разные ТС...
Но, главное, работать с устойчивыми (эффективными) квантовыми отрезками (бинами), иначе всё посыпеться на новых данных, как карточный домик.
Если выборка формируется на каждом баре, то можно и в этом направлении думать. Типа разные состояния - разные ТС...
Но, главное, работать с устойчивыми (эффективными) квантовыми отрезками (бинами), иначе всё посыпеться на новых данных, как карточный домик.