Обсуждение статьи "Применение метода Монте-Карло в обучении с подкреплением" - Статьи и техническая библиотека по автоматическому трейдингу

FxTrader562 2018.12.14 09:42 #1

Я хотел бы внести свой вклад в наблюдения:

Преимущества этой версии:

*************************************

1. В отличие от предыдущих версий, эта версия не торгует постоянно. Торгует выборочно, когда сигнал хороший. Это огромное преимущество для удовлетворения ваших потребностей. Иначе это хорошо.))) ..

2. Он может быть оптимизирован быстро и легко.

3. Размер модели тренера невелик, поэтому мы можем тренировать большие данные

Недостатки этой версии:

*******************************************

1. Много раз это занимает много времени для будущих проходов и, следовательно, мы должны вручную остановить процесс оптимизации.

2. По некоторым причинам запуск тестов не так прост. Я должен перезапустить свой терминал MT5, и все же иногда он не работает.

Мои предложения по улучшению:

*************************************

1. Попробуйте использовать как минимум от 4 до 5 входных функций для обучения, таких как открытое, закрытое, высокое, низкое.

2.Try использовать «MathMoments ()» функции должным образом при получении оптимизирован в получении торговых сигналов:

https://www.mql5.com/en/docs/standardlibrary/mathematics/stat/mathsubfunctions/statmathmoments

3. Попробуйте внедрить итеративный учебный курс на ежедневной или еженедельной основе.

Это случайный результат.

4. Попробуйте несколько временных периодов.

Мне нужно сделать это. как мы можем сделать это лучше :))))

Documentation on MQL5: Standard Library / Mathematics / Statistics / Subfunctions / MathMoments

www.mql5.com

Standard Library / Mathematics / Statistics / Subfunctions / MathMoments - Reference on algorithmic/automated trading language for MetaTrader 5

Scalp_net Система 20 пунктов Бэктестинг/оптимизация

Aleksandr Masterskikh 2018.12.14 11:15 #2

Метод Монте- Карло, безусловно, эффективный метод для изучения случайных процессов. Однако, применение этого метода (как и любого другого), должно учитывать природу процесса (для нас - это финансовые рынки).

Проблема современной аналитики в том, что до сих пор – ни традиционный ТА, ни другие методы, не смогли выявить элементарную структуру движения рыночных цен (как, например, атом в физике). А имеющиеся структуры (паттерны ТА, волны Эллиотта и прочие) не являются элементарными, так как не являются непрерывными для анализа (проявляются неоднозначно либо редко). Поэтому, использование современных методов – это почти слепой поиск так называемой «лучшей модели» методом перебора (в данном случае методом Монте- Карло).

Но это проблема индустрии аналитики в целом. А автор, в рамках метода, показал оригинальные решения – спасибо за работу!

Обсуждение статьи "Брутфорс подход Обсуждение статьи "Сколько длится Обсуждение статьи "Глубокие нейросети

Ivan Negreshniy 2018.12.15 11:45 #3

Респект автору, за очередную, интересную статью, за открытый и конструктивный подход к МО, не смотря на тайную, мышиную возню других участников темы и цугундер администрации:)

Конкретно по сабжу - не совсем понятен смысл стрельбы Монте Карло для поиска целевых, ведь они и так, практически однозначно детерминированы и м.б. на порядок быстрее найдены, в соответствии с вершинами зигзага или значениями тех же ретурнов.

ИМХО, рациональнее было бы применить этот метод к гораздо более неопределенной и многомерной задаче, такой как выбор и ранжирование предикторов. По идее, при решении этой задачи предикторы нужно оценивать в комплексе, а описанный в статье перебор и поочередное обучение на каждом в отдельности выглядит как составление систем уравнений с одним неизвестным.

Машинное обучение в трейдинге: Пиши и зарабатывай на Automated Trading Championship 2010

Maxim Dmitrievsky 2018.12.16 08:27 #4

Ivan Negreshniy:

Респект автору, за очередную, интересную статью, за открытый и конструктивный подход к МО, не смотря на тайную, мышиную возню других участников темы и цугундер администрации:)

Конкретно по сабжу - не совсем понятен смысл стрельбы Монте Карло для поиска целевых, ведь они и так, практически однозначно детерминированы и м.б. на порядок быстрее найдены, в соответствии с вершинами зигзага или значениями тех же ретурнов.

ИМХО, рациональнее было бы применить этот метод к гораздо более неопределенной и многомерной задаче, такой как выбор и ранжирование предикторов. По идее, при решении этой задачи предикторы нужно оценивать в комплексе, а описанный в статье перебор и поочередное обучение на каждом в отдельности выглядит как составление систем уравнений с одним неизвестным.

Привет, через Монте Карло идёт перебор целевых случайным образом, по всем канонам РЛ. То есть существует множество стратегий (шагов), агент ищет оптимальную, через минимальную ошибку на оос. Конструирование новых фичей также реализовано в одной из библиотек через МГУА (см кодобазу). В этой статье реализован просто перебор существующих фичей, без конструирования новых. См. метод Recursive elimination. То есть перебираются как фичи так и целевые. Позже смогу предложить другие варианты, их на самом деле можно придумать много. Но сравнительные тесты занимают много времени.

Metatrader 5 - занимает Есть смысл ? Как упорядочить код?

Aleksandr Masterskikh 2018.12.16 10:21 #5

Ivan Negreshniy:

Респект автору, за очередную, интересную статью, за открытый и конструктивный подход к МО, не смотря на тайную, мышиную возню других участников темы и цугундер администрации:)

Конкретно по сабжу - не совсем понятен смысл стрельбы Монте Карло для поиска целевых, ведь они и так, практически однозначно детерминированы и м.б. на порядок быстрее найдены, в соответствии с вершинами зигзага или значениями тех же ретурнов.

ИМХО, рациональнее было бы применить этот метод к гораздо более неопределенной и многомерной задаче, такой как выбор и ранжирование предикторов. По идее, при решении этой задачи предикторы нужно оценивать в комплексе, а описанный в статье перебор и поочередное обучение на каждом в отдельности выглядит как составление систем уравнений с одним неизвестным.

Насчёт того, что "однозначно детерминированы" - это неверно, так как фигуры ТА и "ретурны" - это очень неоднозначные и ненадёжные для анализа вещи.

Поэтому, автор их и не использует, а экспериментирует с методом Монте-Карло.

Машинное обучение в трейдинге: FOREX - Тенденции, прогнозы Технический анализ - РАЗВОД

FxTrader562 2018.12.16 12:16 #6

Привет максим

Один вопрос.

«shift_probab» и «регуляризация» Используемые значения предназначены только для оптимизации и НЕ В ТЕЧЕНИЕ живой торговли . Я прав?

Или необходимо установить оптимизированные значения shift_probab и регуляризации на графике после завершения каждой оптимизации для реальной торговли?

Благодарю.

Почему MT5 лучше, чем Советники: Замок Диапазон оптимизации

Ivan Negreshniy 2018.12.16 12:55 #7

Maxim Dmitrievsky:
Привет, через Монте Карло идёт перебор целевых случайным образом, по всем канонам РЛ. То есть существует множество стратегий (шагов), агент ищет оптимальную, через минимальную ошибку на оос. Конструирование новых фичей также реализовано в одной из библиотек через МГУА (см кодобазу). В этой статье реализован просто перебор существующих фичей, без конструирования новых. См. метод Recursive elimination. То есть перебираются как фичи так и целевые. Позже смогу предложить другие варианты, их на самом деле можно придумать много. Но сравнительные тесты занимают много времени.

Привет, конечно, случайный выбор действий это каноны РЛ, более того, он м.б. необходим т.к. от разных действий агента может меняется окружение, что порождает устремленное к бесконичности к-во вариантов и конечно Монте-Карло вполне м.б. применен для оптимизации последовательности таких действий.

Но в нашем случае окружение - рыночные котировки от действий агента практически не зависят, тем более в рассматриваемой реализации, где используются исторические, заранее изветные данные, а поэтому и выбор последовательности действий(трейдов) агента м.б. сделан без стохастических методов.

P.S. например, по котировкам можно находить целевую последовательность трейдов с максимально возможной прибылью https://www.mql5.com/ru/code/9234

ReverseSystem

www.mql5.com

Простая и короткая система, работающая неплохо в тестере на любых парах и таймфрэймах. Можно видеть закономерность: чем меньше таймфрэйм - тем выше прибыль. ReverseSystem можно запускать, как по ценам открытия, так и по всем тикам. ReverseSystemBEST (работает только на модели: Все тики) показывает максимальную прибыль, которую можно было...

Поясните на пальцах, как нешуточный вопрос, - статегия В догонку

Maxim Dmitrievsky 2018.12.16 14:08 #8

FxTrader562 :

Привет максим

Один вопрос.

«shift_probab» и «регуляризация» Используемые значения предназначены только для оптимизации и НЕ В ТЕЧЕНИЕ живой торговли . Я прав?

Или необходимо установить оптимизированные значения shift_probab и регуляризации на графике после завершения каждой оптимизации для реальной торговли?

Благодарю.

Привет, да, только для оптимизации, и тогда у вас есть отдельная модель, которая загружается из файла в тесте на тестирование или в реальном режиме

Maxim Dmitrievsky 2018.12.16 14:11 #9

Ivan Negreshniy:

Привет, конечно, случайный выбор действий это каноны РЛ, более того, он м.б. необходим т.к. от разных действий агента может меняется окружение, что порождает устремленное к бесконичности к-во вариантов и конечно Монте-Карло вполне м.б. применен для оптимизации последовательности таких действий.

Но в нашем случае окружение - рыночные котировки от действий агента практически не зависят, тем более в рассматриваемой реализации, где используются исторические, заранее изветные данные, а поэтому и выбор последовательности действий(трейдов) агента м.б. сделан без стохастических методов.

P.S. например, по котировкам можно находить целевую последовательность трейдов с максимально возможной прибылью https://www.mql5.com/ru/code/9234

Да, рынок от действий агента конечно же не меняется, а вот ошибка на oob очень даже, на графике оптимизации видно разброс. А мы же ищем модель, оптимальную по внешнему критерию, которым служит тестовый сабсет. Скачки ошибки достигают 0.3 и больше, это очень большая разница между разными моделями. Можно значительно ускорить каждый отдельный проход, это уже реализовано, но надо докручивать. И тогда сотни проходов будут занимать минуты. По крайней мере, пока не придумал других способов как ещё фитить агентов. Насчёт примера от фхсабера - не очень понял с телефона. Понял что подстраивается под историю, этот по сути делает то же самое - открывает рандомные сделки, а потом корректирует все убыточные, через TD - temporal difference. То есть на трейне можно получить почти идеальную торговлю, на каждом баре. Достаточно поставить 1 < shift_prob >=0.5. С тиками я не рискую строить леса пока, модели будут очень тяжелыми.

Советники: DVD Level Машинное обучение в трейдинге: Обсуждение статьи "Random Decision

Maxim Dmitrievsky 2018.12.16 14:15 #10

Aleksandr Masterskikh:

Насчёт того, что "однозначно детерминированы" - это неверно, так как фигуры ТА и "ретурны" - это очень неоднозначные и ненадёжные для анализа вещи.

Поэтому, автор их и не использует, а экспериментирует с методом Монте-Карло.

Вообще, в этой версии на вход подаются ретурны как раз :) но это сделано как базовый пример, можно менять по настроению