Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 3658

 
Forester #:
Так сколько в среднем на сделку пунктов получается?
Не смотрел, afk
Средняя сделка в районе 30 пунктов на евро, на флэтовых парах чуть меньше 
 
Если не затруднит, проверьте свои рабочие модели форвардом на участке 2021 года EURUSD, все обучения проводить ДО 2021 года

Там просто почти ни одна простая НС не выдерживает, долгосрочный разворот ровно на Новый Год
 
Ivan Butko #:
Если не затруднит, проверьте свои рабочие модели форвардом на участке 2021 года EURUSD, все обучения проводить ДО 2021 года

Там просто почти ни одна простая НС не выдерживает, долгосрочный разворот ровно на Новый Год

На 10 МАшках, период обучения

'backward': datetime(2010, 1, 1),
forward': datetime(2021, 1, 1),

Без тюнинга, просто запустил, 5 сек


 

Видишь у меня на обучении даже график не переобученный.. стремись к такому, чтобы ИС и ООС были похожи, это значит что нет дрейфа закономерностей на новых данных.

Зацени сколько разметчиков данных. Под каждый инстурмент нужно подбирать свой :) Под евробакс лучше фитятся трендовые стратегии.

Если ничего не помогает, подключаю улучшайзеры разметки.


 
Maxim Dmitrievsky #:

На 10 МАшках, период обучения

Без тюнинга, просто запустил, 5 сек

Maxim Dmitrievsky #:

Видишь у меня на обучении даже график не переобученный.. стремись к такому, чтобы ИС и ООС были похожи, это значит что нет дрейфа закономерностей на новых данных.

Зацени сколько разметчиков данных. Под каждый инстурмент нужно подбирать свой :) Под евробакс лучше фитятся трендовые стратегии.

Если ничего не помогает, подключаю улучшайзеры разметки.


Блин, шагнули вперёд

 
Ivan Butko #:

Блин, шагнули вперёд

3 года периодического зад....ва

и это на питоне, на MQL дольше писать, потому что мало готового

Если даже крутого МОшника попросишь - он не решит задачу, потому что сильно специфическая. Оптимизаторшики тем более.

То есть они вообще не в курсе как к этому подойти. Начнут обучать всякие глубокие нейросети, с известным исходом. Всякие обучения с подкреплением, оптимиздация всего что движется, миллион признаков, вот это вот чушь вся.
 
Maxim Dmitrievsky #:

3 года периодического зад....ва

и это на питоне, на MQL дольше писать, потому что мало готового

Если даже крутого МОшника попросишь - он не решит задачу, потому что сильно специфическая. Оптимизаторшики тем более.

То есть они вообще не в курсе как к этому подойти. Начнут обучать всякие глубокие нейросети, с известным исходом. Всякие обучения с подкреплением, оптимиздация всего что движется, миллион признаков, вот это вот чушь вся.
Точно, пробовал разбирать RL. Всё сводится к одному: суть q-таблицы - это запоминание истории, и навешивание формул сверху выглядит как попытка «быстрее» запомнить. Отлично работает стационарно, когда надо научить болванку ходить прямо и по лестнице. 


Если ты ещё не завернул в коммерческую тайну: как объясняется роботоспособность твоей модели? Если даже сотни нейронов в 7 слоёв не справляются
 
Ivan Butko #:
Точно, пробовал разбирать RL. Всё сводится к одному: суть q-таблицы - это запоминание истории, и навешивание формул сверху выглядит как попытка «быстрее» запомнить. Отлично работает стационарно, когда надо научить болванку ходить прямо и по лестнице. 


Если ты ещё не завернул в коммерческую тайну: как объясняется роботоспособность твоей модели? Если даже сотни нейронов в 7 слоёв не справляются
К поиску паттернов сводится. Любое кол-во признаков, в n-мерном пространстве, будет содержать n кол-во паттернов. Потом проверка их на новых данных и запрет торговать там, где паттерны плохие.

Столько-то паттернов классифицируются меткой 0, столько-то 1. Они должны отличаться "серьезно", чтобы модель их классифицировала с низкой ошибкой. И иметь мало противоречий внутри класса, то есть мало ошибочно размеченных.
 
Кластеризация допустим чё делает. Она размечает группы наблюдений, которые максимально компактно расположены в одном кластере от других кластеров, которые максимально далеко расположены друг от друга и тоже имеют компактные представления других наюлюдений. Для модели это хорошо, потому что есть расстояние между группами, они слабо пересекаются или вообще не пересекаются, значит модель не переобучается. Эти группы можно рассматривать как отдельные паттерны. Потом нужно проверять как каждая группа предсказывает следующие наблюдения. Выбирать лучшие, остальные фильтровать или не разрешать торговлю

Допустим взять среднее прогнозов по каждому кластеру на n баров вперёд и стандартное отклонение. Если среднее смещено в сторону покупок или продаж - это хороший кластер. Но там все равно будет какая-то фракция плохих примеров. Если 50/50, то плохой кластер. Надо хотя бы 70/30.

Потом берешь второй кластер, который максимально далеко от этого и смотришь в нем. Там должен быть перевес в другую сторону.

Вот тебе типа ТС с сигналами на покупку и продажу.

На практике нужно делать дополнительные усилия, потому что в общем случае границы между кластерами обычно размыты и предсказания близки к 50/50.
 
Очень инновационные идеи。 Можете ли вы продолжать писать статьи об этом методе кластерной корекции тегов, например, кластеры второго уровня, которые еще не очень понятны?