Обсуждение статьи "Разработка робота на Python и MQL5 (Часть 2): Выбор модели, создание и обучение, кастомный тестер Python"

[Удален] 2024.06.02 11:53 #11

Все-таки row цены оказываются лучшими фичами.

Раньше был скептически настроен из-за их нестационарности. Но после некоторых манипуляций тоже начал добывать достойные модели на этих признаках.

Так из незнания рождается знание, а из знания - незнание :)

Модель рынка Ищу учителя по MQL4 Индекс качества волатильности

Yevgeniy Koshtenko 2024.06.02 21:49 #12

Ivan Butko #:
Хорошая мотивация, когда есть результаты!

Причём, как я понял, не на неделю вперёд, и не на месяц, а нормально так, год работает

Спасибо большое! Да, меня такое очень мотивирует! Буду продолжать исследования) Вновь ночь, со мной чашка кофе и идеи по коду)))

Yevgeniy Koshtenko 2024.06.02 21:49 #13

Maxim Dmitrievsky #:

Все-таки row цены оказываются лучшими фичами.

Раньше был скептически настроен из-за их нестационарности. Но после некоторых манипуляций тоже начал добывать достойные модели на этих признаках.

Так из незнания рождается знание, а из знания - незнание :)

Вот типа такого пытался, у меня теща трейдер с опытом 15+ лет, она все говорит надо на объемах делать фичи)) https://www.mql5.com/ru/code/50133

Индикатор Price / Volume

www.mql5.com

Одна из простых фич для машинного обучения

[Удален] 2024.06.02 23:05 #14

Yevgeniy Koshtenko #:

Вот типа такого пытался, у меня теща трейдер с опытом 15+ лет, она все говорит надо на объемах делать фичи)) https://www.mql5.com/ru/code/50133

Да, чаще правда волатильность добавляют (например индикатор std), но не сильно много дает. Или приращения, деленные на волатильность.

Milksad 2024.09.09 10:20 #15

Евгений, с Ваших статей начал изучать ML применительно к торговле, за это большое спасибо.

Не могли бы Вы объяснить следующие моменты.

После обработки данных функцией label_data их объем значительно уменьшается(мы получаем случайный набор баров, которые удовлетворяет условиям функции). Затем данные проходят через несколько функций, и мы делим их на train и test выборки. Модель обучается на train выборке. После этого из тестовой выборки удаляются столбцы ['labels'] , и мы пытаемся предсказать их значения, чтобы оценить модель. Нет ли в тестовых данных подмены понятий? Ведь для тестов мы используем данные, которые прошли функцию label_data(т.е. набор не последовательных баров, выбранных заранее функцией, которая учитывает будущие данные). А далее в тестере есть параметр 10,который, как я понимаю, должен отвечать за то, через сколько баров закрыть сделку, но т.к. у нас не последовательный набор баров, то не понятно, что мы получаем.

Получается следующие вопросы: Где я не прав? Почему для тестов используется не все бары >= FORWARD? И если не использовать все бары >= FORWARD, то как не зная будущего выбирать нужные для предсказания бары?

Спасибо.

Разговор с искусственным интеллектом Машинное обучение в трейдинге: [ВНИМАНИЕ, ТЕМА ЗАКРЫТА!] Любой

Eric Ruvalcaba 2024.10.09 17:41 #16

Отличная работа, очень интересная, практичная и доступная. Трудно встретить такую хорошую статью с реальными примерами, а не просто теорию без результатов. Большое спасибо за вашу работу и за то, что делитесь с нами, я буду следить за этой серией и с нетерпением ждать ее появления.

Обсуждение статьи "Треугольный арбитраж" Обсуждение статьи "Введение в EA НА ОСНОВЕ B

Yevgeniy Koshtenko 2024.10.12 20:05 #17

Eric Ruvalcaba #:
Отличная работа, очень интересная, практичная и доступная. Трудно встретить такую хорошую статью с реальными примерами, а не просто теорию без результатов. Большое спасибо за вашу работу и за то, что делитесь с нами, я буду следить за этой серией и ждать ее с нетерпением.

Спасибо большое! Да, впереди еще много реализаций идей, в том числе и расширение этой с переводом на ONNX)

Damjan Cvetanovski 2024.11.17 10:28 #18

Есть ли какая-то особая причина использовать RandomForestClassifier для выбора признаков и XGBclassifier для классификации модели?

Andy An 2025.02.19 08:51 #19

Критические недостатки:

Проблемы с предотвращением утечки данных:
- Функция augment_data() создает серьезные проблемы с утечкой данных между тренировочным и тестовым наборами
- При аугментации смешиваются данные из разных временных периодов
Ошибки в методологии оценки эффективности:
- Тестирование модели не учитывает реальные рыночные условия
- Модель обучается на будущих данных и тестируется на исторических, что недопустимо
Технические проблемы в коде:
- Функция generate_new_features() создает признаки, но не возвращает их (возвращает исходные данные)
- В test_model() используется X_test.iloc[i]['close'] , но 'close' может отсутствовать после преобразования признаков
Непоследовательная обработка данных:
- Данные маркируются дважды разными способами ( markup_data() и label_data() )
- Результаты кластеризации ( cluster ) не используются в дальнейшем обучении
Методологические проблемы в торговой стратегии:
- Статический выход через 10 баров вместо адаптивной стратегии
- Отсутствие управления рисками (кроме простого stop-loss)
- Нет учета транзакционных издержек (кроме простого спреда)
Неэффективная валидация:
- Отсутствует валидация модели на исторических данных с учетом временной структуры (walk-forward analysis)
- Перекрестная валидация применяется к временным рядам без учета их специфики

Обсуждение статьи "Разработка робота на Python и MQL5 (Часть 2): Выбор модели, создание и обучение, кастомный тестер Python" - страница 2

Критические недостатки:

Рекомендации по улучшению: