Обсуждение статьи "Нейросети — это просто (Часть 32): Распределенное Q-обучение"

 

Опубликована статья Нейросети — это просто (Часть 32): Распределенное Q-обучение:

В одной из статей данной серии мы с вами уже познакомились с методом Q-обучения. Данный метод усредняет вознаграждения за каждое действие. В 2017 году были представлены сразу 2 работы, в которых большего успеха добиваются при изучении функции распределения вознаграждения. Давайте рассмотрим возможность использования подобной технологии для решения наших задач.

По результатам работы тестового советника в тестере стратегий MetaTrader 5 за 2 анализируемых недели по сигналам модели была получена прибыль в размере около 20 долларов. Напомню, что все торговые операции выполнялись фиксированным минимальным лотом. На представленном ниже графике легко заметить явную тенденцию к росту баланса.

Тестирование модели в тестере стратегий

Тестирование модели распределенного Q-обучения

Статистика торговых операций демонстрирует практически 56% прибыльных операций. Однако следует учесть, что советник был создан исключительно для тестирования модели в тестере стратегий и непригоден для реальной торговли на финансовых рынках.

Автор: Dmitriy Gizlyk

 
  • 3-х сверточных слоёв предварительной обработки данных,

Каковы параметры Activation, Optimization, Window, Step и Window Out у них?

  • 3-х полносвязных скрытых слоёв из 1000 нейронов в каждом,

Каковы параметры Activation, Optimization у них?

  • 1-го полносвязного слоя принятия решения из 45 нейронов (по 15 нейронов на 3 вероятностных распределения действий),

Каковы параметры Activation, Optimization у них? 

  • 1-го слоя SoftMax для нормализации вероятностных распределений.

В NetCreator указан SiftMax. У него в итоге выйдет outputs 45? 

 

В NetCreator указан SiftMax. У него в итоге выйдет outputs 45? 

Воспользуйтесь NetCreator из данной статьи. В нем добавлен параметр Heads для SoftMax. В нем необходимо указать количество возможных действий. Тогда параметр размера слоя SoftMax изменится.

 
Ivan Butko #:

Каковы параметры Activation, Optimization у них? 

Для оптимизации всех нейронных слоёв я использовал Adam. Перед SoftMax функция активация не используется. Она может сделать большое количество нейронов с одинаковым результатом на уровне границ области результатов. И SoftMax даст для них одинаковые вероятности. Что исказит результат. Здесь SoftMax является функцией активации.

 
Сколько эр вы тренируете?
 
Попробуйте скомпилировать все ваши советники с 28 по 35 главу и все равно получите ту же ошибку... Вы можете помочь мне, сэр...?
Файлы:
 
Я использую файл VAE из главы 22. Ошибки при компиляции нет, но когда я прикрепляю поезд EA, ничего не происходит. Я что-то упустил?
Файлы:
 

Разве это не всегда ноль:


Полагаю, должно быть (Vmax-Vmin)/N?

 
Carl Schreiber # :

Разве это не всегда ноль:


Полагаю, должно быть (Vmax-Vmin)/N?

Здравствуйте, вы правы.

 

А как насчет #include "...\Unsupervised\AE\VAE.mqh" ?
Есть простое руководство по использованию этого материала, если VAE.mqh появится?

*edit* Вот VAE.mqh https://www.mql5.com/ru/articles/11245 он находится в части 22.

Neural networks made easy (Part 22): Unsupervised learning of recurrent models
Neural networks made easy (Part 22): Unsupervised learning of recurrent models
  • www.mql5.com
We continue to study unsupervised learning algorithms. This time I suggest that we discuss the features of autoencoders when applied to recurrent model training.
 
IcHiAT #:

E quanto a #include ".\Unsupervised\AE\VAE.mqh" ?
Существует ли простое руководство по использованию этих файлов, если появится VAE.mqh?

*editar* Aqui está o VAE.mqh https://www.mql5.com/ru/articles/11245 está na Parte 22

Да, но я все равно получаю ошибку, как показано ниже. Вы нашли эту проблему?


'MathRandomNormal' - необъявленный идентификатор VAE.mqh 92 8

',' - неожиданная лексема VAE.mqh 92 26

'0' - ожидается некоторый оператор VAE.mqh 92 25

'(' - несбалансированная левая скобка VAE.mqh 92 6

',' - неожиданная лексема VAE.mqh 92 29

выражение не имеет эффекта VAE.mqh 92 28

',' - неожиданная лексема VAE.mqh 92 48

')' - неожиданная лексема VAE.mqh 92 56

выражение не имеет эффекта VAE.mqh 92 50

')' - неожиданная лексема VAE.mqh 92 57