Оптимизация Королевской Битвой — Battle Royale Optimizer (BRO)

MetaTrader 5 — Тестер | 11 апреля 2025, 11:19

596

Andrey Dik

Содержание

Введение

В метаэвристической оптимизации, где алгоритмы часто черпают вдохновение из природных процессов, физических явлений и эволюционных механизмов, появился принципиально новый источник вдохновения — компьютерные игры. Battle Royale Optimizer (BRO), разработанный Таймазом Раххаром Фарши, представляет собой инновационный алгоритм оптимизации, основанный на механике популярных игр жанра "Battle Royale", таких, как PlayerUnknown's Battlegrounds (PUBG).

Алгоритм BRO открывает новую категорию оптимизационных методов — "game-based" (основанных на играх), дополняя устоявшийся тройственный ландшафт алгоритмов оптимизации, включающий эволюционные алгоритмы, алгоритмы роевого интеллекта и алгоритмы, основанные на физических явлениях, относящихся к обширной группе популяционных алгоритмов оптимизации. В отличие от алгоритмов роевого интеллекта, где агенты сотрудничают для достижения общей цели, в BRO особи конкурируют между собой, стремясь выжить и занять наилучшее положение в пространстве поиска.

Ключевой особенностью BRO является уникальный механизм соревнования и "повреждения" решений. Каждое решение сравнивается с ближайшим соседом, и проигравший получает "урон", в то время как победитель начинает с чистого листа. Решения, накопившие слишком много повреждений, устраняются из популяции и заменяются новыми случайными решениями — точно так же, как игроки в PUBG выбывают из матча после получения критического урона. Этим обеспечивается механизм исследования пространства поиска.

Реализация алгоритма

Алгоритм Battle Royale Optimizer (BRO) образно представляет собой виртуальный мир, где множество игроков высаживаются на поле боя, и только один должен остаться в живых, и это является сутью игры-прототипа. Теперь перенесем эту концепцию на решение оптимизационных задач.

В начале работы алгоритма мы создаем популяцию решений, случайно распределенных по пространству поиска. Каждое решение — это своеобразный "игрок", который имеет определенную позицию и качество (фитнес) этой позиции. Затем начинается основной цикл соревнований, где каждое решение сравнивается со своим ближайшим соседом — примерно как игроки в битве сталкиваются друг с другом.

Когда два решения "встречаются", они сравниваются по своему качеству. Лучшее решение объявляется победителем и получает нулевой урон, а худшее становится проигравшим и получает одно повреждение. Этот счетчик повреждений — ключевая особенность алгоритма. Проигравшее решение не просто получает урон, оно также пытается улучшить свою позицию, двигаясь в направлении лучшего известного решения в популяции. Это движение имитирует стремление выжить, найдя более безопасное и выгодное место.

Если какое-то решение накапливает слишком много повреждений (превышает заданный порог), оно "исключается из игры" — удаляется из популяции и заменяется новым случайным решением. Это напоминает выбывание игрока в battle royale и появление нового в следующем матче. Такой механизм обеспечивает постоянное обновление популяции и поддерживает разнообразие решений.

Периодически в алгоритме происходит сужение пространства поиска — аналог уменьшающейся игровой зоны в battle royale, которая заставляет игроков сближаться. Границы поиска сужаются вокруг лучшего найденного решения, что заставляет популяцию концентрироваться в более перспективных областях.

Благодаря такому подходу, алгоритм BRO балансирует между исследованием новых областей и использованием уже найденных хороших решений. Проигравшие решения стремятся к лучшим, сохраняя тенденцию к улучшению, а полностью проигравшие заменяются новыми, обеспечивая свежий взгляд на пространство поиска. В то же время, периодическое сужение границ усиливает локальный поиск вокруг перспективных решений.

bro-algorithm

Рисунок 1. Иллюстрация работы алгоритма BRO.

Данная иллюстрация показывает основные компоненты работы алгоритма Battle Royale Optimizer (BRO). Пространство поиска представлено в виде 2D-области с контурами, которые символизируют функцию оптимизации (более яркие области представляют лучшие решения). Глобальное лучшее решение отмечено красной звездой в центре самой высокой "горы". Решения-победители отмечены зелеными точками — это решения с нулевым уроном (выигравшие в сравнении с соседями). Решения-проигравшие — желтые (с 1 повреждением) и оранжевые (с 2 повреждениями) точки. Новые случайные решения — это синие точки, которые появляются, когда решение накапливает слишком много повреждений. Проигравшие решения перемещаются к лучшему решению (показано пунктирными стрелками). Сужение пространства поиска изображено оранжевой пунктирной рамкой, которая центрируется вокруг лучшего решения.

Ключевыми этапами алгоритма являются: инициализация, сравнение с соседями, движение в сторону лучшего решения и сужение пространства поиска.

Решения в алгоритме BRO конкурируют друг с другом, и проигравшие получают "повреждения". Решения со слишком большим количеством повреждений заменяются новыми случайными. Теперь, когда понятен принцип работы алгоритма, можем перейти к написанию псевдокода.

Инициализация:

Создать популяцию решений размером popSize
Для каждого решения установить счетчик повреждений в 0
Установить максимальный порог повреждений maxDamage
Определить количество эпох epochs
Вычислить начальное значение delta для периодического сужения пространства поиска

Основной алгоритм:

Создание начальной популяции:
- Для каждого решения в популяции:
  - Сгенерировать случайные координаты в пределах заданного пространства поиска
Для каждой эпохи выполнить:
- Обновить глобальное наилучшее решение, если найдено лучшее
- Проведение "сражений" между решениями:
  - Для каждого решения в популяции:
    - Найти ближайшего соседа (решение с минимальным расстоянием)
    - Сравнить качество текущего решения с соседом:
      - Если текущее решение лучше:
        Сбросить счетчик повреждений текущего решения
        Увеличить счетчик повреждений соседа
        Проигравший (сосед) двигается к наилучшему решению
      - Иначе:
        Увеличить счетчик повреждений текущего решения
        Сбросить счетчик повреждений соседа
        Проигравший (текущее решение) двигается к наилучшему решению
- Обработка сильно поврежденных решений:
  - Для каждого решения в популяции:
    - Если счетчик повреждений ≥ maxDamage :
      - Сбросить счетчик повреждений
      - Заменить решение на новое случайное
- Периодическое сужение пространства поиска:
  - Если номер текущей эпохи делится на delta :
    - Вычислить стандартные отклонения координат по всей популяции
    - Сузить пространство поиска вокруг наилучшего решения
    - Обновить значение delta
Возвращение наилучшего найденного решения

В алгоритме задействованы следующие формулы:

Расчет начального значения дельты для сужения пространства поиска: delta = ⌊epochs / log₁₀(epochs)⌋
Расчет евклидова расстояния между решениями: distance = √(∑(a[idx1][c] - a[idx2][c])²)
Движение проигравшего решения к глобальному лучшему: a[i][c] = a[i][c] + r × (cB[c] - a[i][c])
Расчет среднего значения для каждой координаты: mean[c] = (∑a[i][c]) / popSize
Расчет стандартного отклонения для каждой координаты: sdValues[c] = √(∑(a[i][c] - mean[c])² / popSize)
Формулы для сужения пространства поиска: newMin[c] = cB[c] - sdValues[c] newMax[c] = cB[c] + sdValues[c]
Обновление параметра delta после сужения пространства: delta = delta + ⌊delta / 2⌉

Для периодического сужения пространства поиска автор предлагает следующую формулу: Δ (delta) = maxEpochs / log₁₀(maxEpochs), график которой представлен ниже:

func

Рисунок 2. График функции зависимости параметра delta от количества эпох

График функции delta = epochs/log₁₀(epochs) имеет важное значение в работе алгоритма BRO, так как определяет, через какое количество итераций будет происходить сужение пространства поиска. Как видно из графика, значение delta растет с увеличением числа эпох, но не так быстро, как сами эпохи, благодаря делению на логарифм. Это создает нелинейную зависимость, которая обеспечивает следующие преимущества: на ранних этапах оптимизации (при малом количестве эпох) сужение происходит относительно часто, что помогает алгоритму быстрее сфокусироваться на перспективных областях, а на поздних этапах (при большом количестве эпох) сужение происходит реже, что дает возможность более тщательно исследовать уже найденные перспективные зоны.

В ходе моих экспериментов, я преобразовал формулу зависимости параметра delta, логарифмом применяется дважды, алгоритм работает лучше.

// Вычисление начального delta для сужения пространства поиска
  delta = (int)MathFloor(epochs / MathLog(MathLog(epochs)));

Перейдем к формированию кода, напишем пользовательский класс "C_AO_BRO", который наследуется от базового класса "C_AO", т.е. наследует все публичные и защищенные члены класса "C_AO" и может переопределять их поведение. Этот класс и будет представлять собой реализацию оптимизационного алгоритма, основанного на концепции "Battle Royale".

1. Публичные члены класса:

popSize — устанавливает размер популяции.
maxDamage — устанавливает максимальный порог повреждений, сколько "поражений" решение может выдержать, прежде чем будет устранено.
SetParams () — метод обновляет значения "popSize" и "maxDamage" на основе значений, хранящихся в массиве "params", что позволяет изменять параметры алгоритма во время выполнения.
Init () — метод инициализации алгоритма. Принимает следующие параметры:
- rangeMinP [] — минимальные значения диапазона поиска для каждой переменной.
- rangeMaxP [] — максимальные значения диапазона поиска.
- rangeStepP [] — шаг поиска для каждой переменной.
- epochsP — количество эпох (итераций) алгоритма. Значение по умолчанию - 0.
Moving () — метод реализует основную логику движения или обновления решений в пространстве поиска.
Revision () — метод реализует логику пересмотра текущих решений, здесь происходит оценка "ущерба", полученного каждым решением.
maxDamage — публичный член, хранящий максимальный порог повреждений.

2. Приватные поля класса:

delta — интервал для сужения (shrink) пространства поиска. Используется для адаптации размера шага поиска в процессе оптимизации.
damages [] — массив хранит количество "повреждений" для каждого решения в популяции.
epoch — текущая эпоха (номер итерации) алгоритма.
epoch — максимальное количество эпох (итераций) алгоритма.

3. Вспомогательные методы:

FindNearestNeighbor () — находит ближайшего соседа для решения по заданному индексу, используется для взаимодействия между решениями.
CalculateDistance () — вычисляет расстояние между двумя решениями, идентифицируемыми по их индексам.
CalculateStandardDeviations () — вычисляет стандартные отклонения значений решений популяции, используется для оценки разнообразия популяции и адаптации параметров поиска.
ShrinkSearchSpace () — метод сужает пространство поиска. Это стандартная техника для сходимости алгоритма к оптимальному решению.

Общее представление:

C_AO_BRO представляет собой класс для алгоритма оптимизации Battle Royale и основная идея алгоритма, если говорить кратко, заключается в следующем:

Инициализация: создается популяция случайных решений в определенном пространстве поиска.
Оценка: каждое решение оценивается с помощью целевой функции (fitness function).
Battle Royale: решения "сражаются" друг с другом (сравниваются по значениям целевой функции).
Повреждения: некоторые решения получают "повреждения", в зависимости от результатов "сражений".
Устранение: решения, получившие количество "damage", превышающее "maxDamage", удаляются из популяции.
Воспроизводство/замена: удаленные решения заменяются новыми случайными решениями.
Сужение пространства поиска: пространство поиска может быть сужено, чтобы сосредоточиться на наиболее перспективных областях.
Повторение: шаги 2-7 повторяются в течение заданного количества эпох.

//——————————————————————————————————————————————————————————————————————————————
class C_AO_BRO : public C_AO
{
  public: //--------------------------------------------------------------------
  ~C_AO_BRO () { }
  C_AO_BRO ()
  {
    ao_name = "BRO";
    ao_desc = "Battle Royale Optimizer";
    ao_link = "https://www.mql5.com/ru/articles/17688";

    popSize   = 100;    // размер популяции
    maxDamage = 3;      // максимальный порог повреждений

    ArrayResize (params, 2);

    params [0].name = "popSize";   params [0].val = popSize;
    params [1].name = "maxDamage"; params [1].val = maxDamage;
  }

  void SetParams ()
  {
    popSize   = (int)params [0].val;
    maxDamage = (int)params [1].val;
  }

  bool Init (const double &rangeMinP [],  // минимальный диапазон поиска
             const double &rangeMaxP [],  // максимальный диапазон поиска
             const double &rangeStepP [], // шаг поиска
             const int     epochsP = 0);  // количество эпох

  void Moving ();
  void Revision ();

  //----------------------------------------------------------------------------
  int maxDamage;    // максимальный порог повреждений

  private: //-------------------------------------------------------------------
  int    delta;      // интервал для сужения пространства поиска
  int    damages []; // количество повреждений для каждого решения
  int    epoch;      // текущая эпоха
  int    epochs;     // максимальное количество эпох

  // Вспомогательные методы
  int    FindNearestNeighbor (int index);
  double CalculateDistance (int idx1, int idx2);
  void   CalculateStandardDeviations (double &sdValues []);
  void   ShrinkSearchSpace ();
};
//——————————————————————————————————————————————————————————————————————————————

Метод "Init ()" инициализирует алгоритм BRO, вызывает "StandardInit ()" для стандартной инициализации, используя переданные диапазоны поиска и шаги. Если "StandardInit" возвращает "false", метод "Init ()" также возвращает "false", сигнализируя об ошибке инициализации. Инициализирует массив "damages", выделяя память для каждого решения в популяции "popSize" и устанавливая начальное количество "повреждений" каждого решения в 0. Устанавливает общее количество эпох "epochs" и сбрасывает текущую эпоху "epoch" на 0.

Значение "delta" вычисляется на основе общего количества эпох, чтобы пространство поиска сужалось постепенно. Если "delta" получается меньше или равно 0, устанавливается значение 1. В целом, этот метод подготавливает алгоритм к работе, инициализируя его основные параметры и структуры данных.

//——————————————————————————————————————————————————————————————————————————————
bool C_AO_BRO::Init (const double &rangeMinP  [],  // минимальный диапазон поиска
                     const double &rangeMaxP  [],  // максимальный диапазон поиска
                     const double &rangeStepP [],  // шаг поиска
                     const int     epochsP = 0)    // количество эпох
{
  if (!StandardInit (rangeMinP, rangeMaxP, rangeStepP)) return false;

  //----------------------------------------------------------------------------
  // Инициализация счетчиков повреждений для каждого решения
  ArrayResize (damages, popSize);
  ArrayInitialize (damages, 0);

  // Установка эпох
  epochs = epochsP;
  epoch  = 0;

  // Вычисление начального delta для сужения пространства поиска
  delta = (int)MathFloor (epochs / MathLog10 (epochs));
  if (delta <= 0) delta = 1;

  return true;
}
//——————————————————————————————————————————————————————————————————————————————

Метод "Moving ()" реализует логику инициализации популяции решений, при этом каждая координата каждого решения генерируется случайно между заданными минимальным и максимальным диапазоном "rangeMin" и "rangeMax" и дискретизируется с определенным шагом "rangeStep". Этот метод гарантирует, что популяция инициализируется только один раз.

/——————————————————————————————————————————————————————————————————————————————
void C_AO_BRO::Moving ()
{
  if (!revision)
  {
    // Инициализация популяции случайными решениями
    for (int i = 0; i < popSize; i++)
    {
      for (int c = 0; c < coords; c++)
      {
        double coordinate = u.RNDfromCI (rangeMin [c], rangeMax [c]);
        a [i].c [c] = u.SeInDiSp (coordinate, rangeMin [c], rangeMax [c], rangeStep [c]);
      }
    }

    revision = true;
  }
}
//——————————————————————————————————————————————————————————————————————————————

Метод "Revision ()", является ключевым шагом в оптимизационном алгоритме BRO. Каждая итерация метода обновляет лучшее решение: если какое-то решение в текущей популяции лучше, чем текущее лучшее глобальное решение, то лучшее глобальное решение обновляется.

Метод сравнивает решения с соседями: для каждого решения в популяции находится ближайший сосед. Затем их значения функции сравниваются. Лучшее решение в паре "награждается" сбросом счетчика повреждений, а счетчик повреждений худшего решения увеличивается. Худшее решение в паре смещается в сторону глобально лучшего решения.

Далее заменяются "поврежденные" решения: если какое-либо решение накопило достаточно "повреждений" (достигло значения "maxDamage"), оно заменяется новым, сгенерированным случайным образом. Периодически, в зависимости от переменной "delta", происходит сужение поисковой области. Этот процесс повторяется на протяжении нескольких итераций алгоритма. За счет сравнения с соседями, происходит перемещение решений в более выгодные области для поиска.

//——————————————————————————————————————————————————————————————————————————————
void C_AO_BRO::Revision ()
{
  epoch++;

  // Обновление глобального наилучшего решения
  for (int i = 0; i < popSize; i++)
  {
    if (a [i].f > fB)
    {
      fB = a [i].f;
      ArrayCopy (cB, a [i].c, 0, 0, WHOLE_ARRAY);
    }
  }

  // Сравнение каждого решения с его ближайшим соседом и обновление счетчиков повреждений
  for (int i = 0; i < popSize; i++)
  {
    int neighbor = FindNearestNeighbor (i);

    if (neighbor != -1)
    {
      if (a [i].f >= a [neighbor].f)
      {
        // Решение i побеждает
        damages [i] = 0;
        damages [neighbor]++;

        // Проигравший (сосед) движется к наилучшему решению
        for (int c = 0; c < coords; c++)
        {
          double r = u.RNDfromCI (0, 1);
          a [neighbor].c [c] = a [neighbor].c [c] + r * (cB [c] - a [neighbor].c [c]);
          a [neighbor].c [c] = u.SeInDiSp (a [neighbor].c [c], rangeMin [c], rangeMax [c], rangeStep [c]);
        }
      }
      else
      {
        // Решение i проигрывает
        damages [i]++;
        damages [neighbor] = 0;

        // Проигравший (i) движется к наилучшему решению
        for (int c = 0; c < coords; c++)
        {
          double r = u.RNDfromCI (0, 1);
          a [i].c [c] = a [i].c [c] + r * (cB [c] - a [i].c [c]);
          a [i].c [c] = u.SeInDiSp (a [i].c [c], rangeMin [c], rangeMax [c], rangeStep [c]);
        }
      }
    }
  }

  // Проверка, достигло ли какое-либо решение максимального повреждения, и его замена
  for (int i = 0; i < popSize; i++)
  {
    if (damages [i] >= maxDamage)
    {
      // Сброс счетчика повреждений
      damages [i] = 0;

      // Генерация нового случайного решения
      for (int c = 0; c < coords; c++)
      {
        double coordinate = u.RNDfromCI (rangeMin [c], rangeMax [c]);
        a [i].c [c] = u.SeInDiSp (coordinate, rangeMin [c], rangeMax [c], rangeStep [c]);
      }
    }
  }

  // Периодическое сужение пространства поиска
  if (epochs > 0 && epoch % delta == 0)
  {
    ShrinkSearchSpace ();
    // Обновление delta
    delta = delta + (int)MathRound (delta / 2);
  }
}
//——————————————————————————————————————————————————————————————————————————————

Метод "FindNearestNeighbor ()" находит индекс ближайшего соседа для решения с индексом "index" в популяции. Он перебирает все решения, вычисляет расстояние до каждого из них (исключая само решение "index"), и возвращает индекс решения с минимальным расстоянием. Если ближайшего соседа найти не удалось (например, в популяции только одно решение), то возвращает -1. В двух словах, метод находит ближайшего соседа для заданного решения.

//——————————————————————————————————————————————————————————————————————————————
int C_AO_BRO::FindNearestNeighbor (int index)
{
  double minDistance = DBL_MAX;
  int nearestIndex = -1;

  for (int i = 0; i < popSize; i++)
  {
    if (i == index) continue;

    double distance = CalculateDistance (index, i);
    if (distance < minDistance)
    {
      minDistance = distance;
      nearestIndex = i;
    }
  }

  return nearestIndex;
}
//——————————————————————————————————————————————————————————————————————————————

Метод "CalculateDistance ()" вычисляет евклидово расстояние между двумя решениями в популяции, заданными их индексами "idx1" и "idx2". Начинается с инициализации переменной "distanceSum" нулем. Эта переменная будет накапливать сумму квадратов разностей координат. Цикл "for" перебирает все координаты решений. На каждой итерации цикла вычисляется разность между соответствующими координатами решений "idx1" и "idx2". Квадрат этой разности добавляется к "distanceSum".

После завершения цикла, метод возвращает квадратный корень из "distanceSum", что представляет собой евклидово расстояние между двумя решениями. В итоге, метод возвращает численное значение, отражающее "расстояние" между двумя решениями в пространстве поиска. Чем больше это значение, тем дальше друг от друга находятся решения.

//——————————————————————————————————————————————————————————————————————————————
double C_AO_BRO::CalculateDistance (int idx1, int idx2)
{
  double distanceSum = 0.0;

  for (int c = 0; c < coords; c++)
  {
    double diff = a [idx1].c [c] - a [idx2].c [c];
    distanceSum += diff * diff;
  }

  return MathSqrt (distanceSum);
}
//——————————————————————————————————————————————————————————————————————————————

Метод "CalculateStandardDeviations ()" вычисляет стандартное отклонение для каждой координаты решений в популяции и сохраняет результаты в массиве "sdValues". Изменяется размер входного массива "sdValues" таким образом, чтобы он мог хранить стандартное отклонение для каждой из "coords" координат. Далее, цикл перебирает каждую координату решений и вычисляется стандартное отклонение. Метод обнуляет сумму квадратов отклонений для текущей координаты, затем, также обнуляет ее среднее значение. Цикл суммирует значения текущей координаты "c" для всех решений в популяции. Затем, вычисляет среднее значение этой координаты.

Вычисление суммы квадратов отклонений: цикл перебирает все решения в популяции и вычисляет сумму квадратов отклонений от среднего значения для текущей координаты. Вычисляет разницу между значением координаты "c" для решения "i" и ее средним значением. Добавляет квадрат разницы к сумме квадратов отклонений. Вычисляет стандартное отклонение, как квадратный корень из суммы квадратов отклонений, деленный на размер популяции. Результат сохраняется в соответствующий элемент массива "sdValues".

В итоге, метод вычисляет меру разброса значений для каждой координаты решений в популяции и сохраняет её в переданном массиве "sdValues", а стандартное отклонение показывает, насколько сильно значения координаты варьируются вокруг среднего значения.

//——————————————————————————————————————————————————————————————————————————————
void C_AO_BRO::CalculateStandardDeviations (double &sdValues [])
{
  ArrayResize (sdValues, coords);

  for (int c = 0; c < coords; c++)
  {
    double sum = 0.0;
    double mean = 0.0;

    // Вычисление среднего
    for (int i = 0; i < popSize; i++) mean += a [i].c [c];

    mean /= popSize;

    // Вычисление суммы квадратов отклонений
    for (int i = 0; i < popSize; i++)
    {
      double diff = a [i].c [c] - mean;
      sum += diff * diff;
    }

    sdValues [c] = MathSqrt (sum / popSize);
  }
}
//——————————————————————————————————————————————————————————————————————————————

Метод "ShrinkSearchSpace ()" сужает пространство поиска, основываясь на стандартных отклонениях координат и местоположении лучшего найденного решения. Он как бы фокусирует поиск в более перспективной области, где уже есть хорошее решение.

Сначала идет вычисление стандартных отклонений, для этого вызывается метод "CalculateStandardDeviations ()", который вычисляет стандартные отклонения для каждой координаты решений в популяции и сохраняет их в массиве "sdValues", или другими словами, насколько сильно значения каждой координаты различаются в популяции. Вычисление новых границ: новые границы центрируются вокруг наилучшего найденного решения, а их ширина определяется стандартным отклонением. Если стандартное отклонение мало, то поиск сужается вокруг лучшего решения. Если стандартное отклонение велико, то поиск остается более широким. Проверка на допустимость: поиск не выйдет за пределы исходного допустимого пространства решений.

//——————————————————————————————————————————————————————————————————————————————
void C_AO_BRO::ShrinkSearchSpace ()
{
  double sdValues [];
  CalculateStandardDeviations (sdValues);

  for (int c = 0; c < coords; c++)
  {
    // Новые границы центрированы вокруг наилучшего решения с шириной стандартного отклонения
    double newMin = cB [c] - sdValues [c];
    double newMax = cB [c] + sdValues [c];

    // Убедитесь, что новые границы находятся в пределах исходных ограничений
    if (newMin < rangeMin [c]) newMin = rangeMin [c];
    if (newMax > rangeMax [c]) newMax = rangeMax [c];

    // Обновление границ
    rangeMin [c] = newMin;
    rangeMax [c] = newMax;
  }
}
//——————————————————————————————————————————————————————————————————————————————

Результаты тестов

После проведенных тестов видно, что алгоритм работает достаточно хорошо на функциях Hilly и Forest, однако, на дискретной Megacity показатели сходимости гораздо слабее.

BRO|Battle Royale Optimizer|50.0|3.0|
=============================
5 Hilly's; Func runs: 10000; result: 0.7494493002235458
25 Hilly's; Func runs: 10000; result: 0.4983307394255448
500 Hilly's; Func runs: 10000; result: 0.27994639979348446
=============================
5 Forest's; Func runs: 10000; result: 0.6962444245506945
25 Forest's; Func runs: 10000; result: 0.3845619185097379
500 Forest's; Func runs: 10000; result: 0.20427058729050862
=============================
5 Megacity's; Func runs: 10000; result: 0.3815384615384616
25 Megacity's; Func runs: 10000; result: 0.21107692307692308
500 Megacity's; Func runs: 10000; result: 0.10607692307692404
=============================
All score: 3.51150 (39.02%)

На визуализации можно заметить разброс значений результатов и более слабые поисковые способности на последней дискретной функции Megacity.

Hilly

BRO на тестовой функции Hilly

Forest

BRO на тестовой функции Forest

Megacity

BRO на тестовой функции Megacity

По результатам тестирования алгоритм BRO замыкает рейтинговую таблицу популяционных алгоритмов оптимизации.

№	AO	Description	Hilly			Hilly Final	Forest			Forest Final	Megacity (discrete)			Megacity Final	Final Result	% of MAX
№	AO	Description	10 p (5 F)	50 p (25 F)	1000 p (500 F)	Hilly Final	10 p (5 F)	50 p (25 F)	1000 p (500 F)	Forest Final	10 p (5 F)	50 p (25 F)	1000 p (500 F)	Megacity Final	Final Result	% of MAX
1	ANS	across neighbourhood search	0,94948	0,84776	0,43857	2,23581	1,00000	0,92334	0,39988	2,32323	0,70923	0,63477	0,23091	1,57491	6,134	68,15
2	CLA	code lock algorithm (joo)	0,95345	0,87107	0,37590	2,20042	0,98942	0,91709	0,31642	2,22294	0,79692	0,69385	0,19303	1,68380	6,107	67,86
3	AMOm	animal migration ptimization M	0,90358	0,84317	0,46284	2,20959	0,99001	0,92436	0,46598	2,38034	0,56769	0,59132	0,23773	1,39675	5,987	66,52
4	(P+O)ES	(P+O) evolution strategies	0,92256	0,88101	0,40021	2,20379	0,97750	0,87490	0,31945	2,17185	0,67385	0,62985	0,18634	1,49003	5,866	65,17
5	CTA	comet tail algorithm (joo)	0,95346	0,86319	0,27770	2,09435	0,99794	0,85740	0,33949	2,19484	0,88769	0,56431	0,10512	1,55712	5,846	64,96
6	TETA	time evolution travel algorithm (joo)	0,91362	0,82349	0,31990	2,05701	0,97096	0,89532	0,29324	2,15952	0,73462	0,68569	0,16021	1,58052	5,797	64,41
7	SDSm	stochastic diffusion search M	0,93066	0,85445	0,39476	2,17988	0,99983	0,89244	0,19619	2,08846	0,72333	0,61100	0,10670	1,44103	5,709	63,44
8	BOAm	billiards optimization algorithm M	0,95757	0,82599	0,25235	2,03590	1,00000	0,90036	0,30502	2,20538	0,73538	0,52523	0,09563	1,35625	5,598	62,19
9	AAm	archery algorithm M	0,91744	0,70876	0,42160	2,04780	0,92527	0,75802	0,35328	2,03657	0,67385	0,55200	0,23738	1,46323	5,548	61,64
10	ESG	evolution of social groups (joo)	0,99906	0,79654	0,35056	2,14616	1,00000	0,82863	0,13102	1,95965	0,82333	0,55300	0,04725	1,42358	5,529	61,44
11	SIA	simulated isotropic annealing (joo)	0,95784	0,84264	0,41465	2,21513	0,98239	0,79586	0,20507	1,98332	0,68667	0,49300	0,09053	1,27020	5,469	60,76
12	ACS	artificial cooperative search	0,75547	0,74744	0,30407	1,80698	1,00000	0,88861	0,22413	2,11274	0,69077	0,48185	0,13322	1,30583	5,226	58,06
13	DA	dialectical algorithm	0,86183	0,70033	0,33724	1,89940	0,98163	0,72772	0,28718	1,99653	0,70308	0,45292	0,16367	1,31967	5,216	57,95
14	BHAm	black hole algorithm M	0,75236	0,76675	0,34583	1,86493	0,93593	0,80152	0,27177	2,00923	0,65077	0,51646	0,15472	1,32195	5,196	57,73
15	ASO	anarchy society optimization	0,84872	0,74646	0,31465	1,90983	0,96148	0,79150	0,23803	1,99101	0,57077	0,54062	0,16614	1,27752	5,178	57,54
16	RFO	royal flush optimization (joo)	0,83361	0,73742	0,34629	1,91733	0,89424	0,73824	0,24098	1,87346	0,63154	0,50292	0,16421	1,29867	5,089	56,55
17	AOSm	atomic orbital search M	0,80232	0,70449	0,31021	1,81702	0,85660	0,69451	0,21996	1,77107	0,74615	0,52862	0,14358	1,41835	5,006	55,63
18	TSEA	turtle shell evolution algorithm (joo)	0,96798	0,64480	0,29672	1,90949	0,99449	0,61981	0,22708	1,84139	0,69077	0,42646	0,13598	1,25322	5,004	55,60
19	DE	differential evolution	0,95044	0,61674	0,30308	1,87026	0,95317	0,78896	0,16652	1,90865	0,78667	0,36033	0,02953	1,17653	4,955	55,06
20	SRA	successful restaurateur algorithm (joo)	0,96883	0,63455	0,29217	1,89555	0,94637	0,55506	0,19124	1,69267	0,74923	0,44031	0,12526	1,31480	4,903	54,48
21	CRO	chemical reaction optimisation	0,94629	0,66112	0,29853	1,90593	0,87906	0,58422	0,21146	1,67473	0,75846	0,42646	0,12686	1,31178	4,892	54,36
22	BIO	blood inheritance optimization (joo)	0,81568	0,65336	0,30877	1,77781	0,89937	0,65319	0,21760	1,77016	0,67846	0,47631	0,13902	1,29378	4,842	53,80
23	BSA	bird swarm algorithm	0,89306	0,64900	0,26250	1,80455	0,92420	0,71121	0,24939	1,88479	0,69385	0,32615	0,10012	1,12012	4,809	53,44
24	HS	harmony search	0,86509	0,68782	0,32527	1,87818	0,99999	0,68002	0,09590	1,77592	0,62000	0,42267	0,05458	1,09725	4,751	52,79
25	SSG	saplings sowing and growing	0,77839	0,64925	0,39543	1,82308	0,85973	0,62467	0,17429	1,65869	0,64667	0,44133	0,10598	1,19398	4,676	51,95
26	BCOm	bacterial chemotaxis optimization M	0,75953	0,62268	0,31483	1,69704	0,89378	0,61339	0,22542	1,73259	0,65385	0,42092	0,14435	1,21912	4,649	51,65
27	ABO	african buffalo optimization	0,83337	0,62247	0,29964	1,75548	0,92170	0,58618	0,19723	1,70511	0,61000	0,43154	0,13225	1,17378	4,634	51,49
28	(PO)ES	(PO) evolution strategies	0,79025	0,62647	0,42935	1,84606	0,87616	0,60943	0,19591	1,68151	0,59000	0,37933	0,11322	1,08255	4,610	51,22
29	TSm	tabu search M	0,87795	0,61431	0,29104	1,78330	0,92885	0,51844	0,19054	1,63783	0,61077	0,38215	0,12157	1,11449	4,536	50,40
30	BSO	brain storm optimization	0,93736	0,57616	0,29688	1,81041	0,93131	0,55866	0,23537	1,72534	0,55231	0,29077	0,11914	0,96222	4,498	49,98
31	WOAm	wale optimization algorithm M	0,84521	0,56298	0,26263	1,67081	0,93100	0,52278	0,16365	1,61743	0,66308	0,41138	0,11357	1,18803	4,476	49,74
32	AEFA	artificial electric field algorithm	0,87700	0,61753	0,25235	1,74688	0,92729	0,72698	0,18064	1,83490	0,66615	0,11631	0,09508	0,87754	4,459	49,55
33	AEO	artificial ecosystem-based optimization algorithm	0,91380	0,46713	0,26470	1,64563	0,90223	0,43705	0,21400	1,55327	0,66154	0,30800	0,28563	1,25517	4,454	49,49
34	ACOm	ant colony optimization M	0,88190	0,66127	0,30377	1,84693	0,85873	0,58680	0,15051	1,59604	0,59667	0,37333	0,02472	0,99472	4,438	49,31
35	BFO-GA	bacterial foraging optimization - ga	0,89150	0,55111	0,31529	1,75790	0,96982	0,39612	0,06305	1,42899	0,72667	0,27500	0,03525	1,03692	4,224	46,93
36	SOA	simple optimization algorithm	0,91520	0,46976	0,27089	1,65585	0,89675	0,37401	0,16984	1,44060	0,69538	0,28031	0,10852	1,08422	4,181	46,45
37	ABHA	artificial bee hive algorithm	0,84131	0,54227	0,26304	1,64663	0,87858	0,47779	0,17181	1,52818	0,50923	0,33877	0,10397	0,95197	4,127	45,85
38	ACMO	atmospheric cloud model optimization	0,90321	0,48546	0,30403	1,69270	0,80268	0,37857	0,19178	1,37303	0,62308	0,24400	0,10795	0,97503	4,041	44,90
39	ADAMm	adaptive moment estimation M	0,88635	0,44766	0,26613	1,60014	0,84497	0,38493	0,16889	1,39880	0,66154	0,27046	0,10594	1,03794	4,037	44,85
40	CGO	chaos game optimization	0,57256	0,37158	0,32018	1,26432	0,61176	0,61931	0,62161	1,85267	0,37538	0,21923	0,19028	0,78490	3,902	43,35
41	ATAm	artificial tribe algorithm M	0,71771	0,55304	0,25235	1,52310	0,82491	0,55904	0,20473	1,58867	0,44000	0,18615	0,09411	0,72026	3,832	42,58
42	CFO	central force optimization	0,60961	0,54958	0,27831	1,43750	0,63418	0,46833	0,22541	1,32792	0,57231	0,23477	0,09586	0,90294	3,668	40,76
43	ASHA	artificial showering algorithm	0,89686	0,40433	0,25617	1,55737	0,80360	0,35526	0,19160	1,35046	0,47692	0,18123	0,09774	0,75589	3,664	40,71
44	ASBO	adaptive social behavior optimization	0,76331	0,49253	0,32619	1,58202	0,79546	0,40035	0,26097	1,45677	0,26462	0,17169	0,18200	0,61831	3,657	40,63
45	BRO	battle royale optimizer	0,74945	0,49833	0,27995	1,52773	0,69624	0,38456	0,20427	1,28507	0,38154	0,21108	0,10608	0,69870	3,512	39,02
	RW	neuroboids optimization algorithm 2(joo)	0,48754	0,32159	0,25781	1,06694	0,37554	0,21944	0,15877	0,75375	0,27969	0,14917	0,09847	0,52734	2,348	26,09

Выводы

Алгоритм BRO демонстрирует интересный подход к метаэвристической оптимизации, открывая путь "игровых" методов, используя метафору "Battle Royale", где решения соревнуются между собой. Сильными сторонами алгоритма являются концептуальная простота, алгоритм интуитивно понятен и относительно прост в реализации, автоматическое сужение пространства поиска на основе статистических характеристик популяции, использование концепции ближайших соседей для локальных соревнований. Алгоритм BRO является очень перспективным методом оптимизации, потенциал которого далеко не раскрыт.

Tab

Рисунок 3. Цветовая градация алгоритмов по соответствующим тестам

chart

Рисунок 4. Гистограмма результатов тестирования алгоритмов (по шкале от 0 до 100, чем больше, тем лучше, где 100 — максимально возможный теоретический результат, в архиве скрипт для расчета рейтинговой таблицы)

Плюсы и минусы алгоритма BRO:

Плюсы:

Интересная идея.
Простая реализация.
Перспективная разработка.

Минусы:

Слабые результаты на дискретных функциях.

К статье прикреплён архив с актуальными версиями кодов алгоритмов. Автор статьи не несёт ответственности за абсолютную точность в описании канонических алгоритмов, во многие из них были внесены изменения для улучшения поисковых возможностей. Выводы и суждения, представленные в статьях, основываются на результатах проведённых экспериментов.

github: https://github.com/JQSakaJoo/Population-optimization-algorithms-MQL5

Программы, используемые в статье

#	Имя	Тип	Описание
1	#C_AO.mqh	Включаемый файл	Родительский класс популяционных алгоритмов оптимизации
2	#C_AO_enum.mqh	Включаемый файл	Перечисление популяционных алгоритмов оптимизации
3	TestFunctions.mqh	Включаемый файл	Библиотека тестовых функций
4	TestStandFunctions.mqh	Включаемый файл	Библиотека функций тестового стенда
5	Utilities.mqh	Включаемый файл	Библиотека вспомогательных функций
6	CalculationTestResults.mqh	Включаемый файл	Скрипт для расчета результатов в сравнительную таблицу
7	Testing AOs.mq5	Скрипт	Единый испытательный стенд для всех популяционных алгоритмов оптимизации
8	Simple use of population optimization algorithms.mq5	Скрипт	Простой пример использования популяционных алгоритмов оптимизации без визуализации
9	Test_AO_BRO.mq5	Скрипт	Испытательный стенд для BRO

Прикрепленные файлы |

Загрузить ZIP

BRO.ZIP (423.38 KB)

Предупреждение: все права на данные материалы принадлежат MetaQuotes Ltd. Полная или частичная перепечатка запрещена.

Данная статья написана пользователем сайта и отражает его личную точку зрения. Компания MetaQuotes Ltd не несет ответственности за достоверность представленной информации, а также за возможные последствия использования описанных решений, стратегий или рекомендаций.

Другие статьи автора

Последние комментарии | Перейти к обсуждению на форуме трейдеров (1)

Juan Guillermo Marulanda Mesa | 23 янв. 2026 в 15:11

Выглядит очень интересно, я собираюсь опробовать его, чтобы найти наиболее оптимальные решения для нескольких комбинаций факторов, которые я измерял.

Возможности Мастера MQL5, которые вам нужно знать (Часть 39): Индекс относительной силы

RSI — популярный импульсный осциллятор, который измеряет темп и размер недавнего изменения цены ценной бумаги для оценки ситуаций переоценки или недооценки ее цены. Эти знания о скорости и масштабах имеют ключевое значение для определения точек разворота. Мы применим этот осциллятор в работе очередного пользовательского класса сигналов и изучим особенности некоторых из его сигналов. Однако начнем мы с того, что подведем итог нашему разговору о полосах Боллинджера.

Введение в MQL5 (часть 9): Использование объектов на графике

В этой статье мы научимся создавать и настраивать объекты графиков в MQL5, используя текущие и исторические данные. Здесь также представлено практическое руководство, с которым вы сможете отображать сделки на графике и использовать другие объекты MQL5 на практике.

Пример CNA (сетевого анализа причинно-следственных связей), SMOC (оптимального управления стохастической моделью) и теории игр Нэша с Глубоким обучением

Мы добавим Глубокое обучение к тем трем примерам, которые были опубликованы в предыдущих статьях, и сравним результаты с предыдущими. Цель состоит в том, чтобы научиться каким образом добавлять Глубокое обучение (DL) в другие советники.

Нейросети в трейдинге: Иерархия навыков для адаптивного поведения агентов (Окончание)

В статье рассматривается практическая реализация фреймворка HiSSD в задачах алгоритмического трейдинга. Показано, как иерархия навыков и адаптивная архитектура могут быть использованы для построения устойчивых торговых стратегий.