Обсуждение статьи "Методы оптимизации библиотеки Alglib (Часть II)"

fxsaber 2024.10.30 16:13 #1

Сведем полученные результаты в таблицу.

Просьба в комментариях привести полную сравнительную таблицу (вместе с другими AO-реализациями).

Andrey Dik 2024.10.30 17:32 #2

Полная табл.

В статье приведены визуализации только для двух из шести методов ввиду экономии места и читабельности. Все шесть визуализаций можно увидеть, запустив скрипты из архива к статье.

fxsaber 2024.10.30 18:27 #3

Andrey Dik #:

Полная табл.

В этом бенчмарке ALGLIB оказался аутсайдером.

Evgeniy Chernish 2024.10.31 09:32 #4

Если я правильно понял, ты мы хотим найти максимум функции Hill равный 1.

double Core (double x, double y)
  {
    double res = 20.0 + x * x + y * y - 10.0 * cos (2.0 * M_PI * x) - 10.0 * cos (2.0 * M_PI * y)
                 - 30.0  * exp (-(pow (x - 1.0,         2) + y * y) / 0.1)
                 + 200.0 * exp (-(pow (x + M_PI * 0.47, 2) + pow (y - M_PI * 0.2, 2)) / 0.1)  //global max
                 + 100.0 * exp (-(pow (x - 0.5,         2) + pow (y + 0.5,        2)) / 0.01)
                 - 60.0  * exp (-(pow (x - 1.33,        2) + pow (y - 2.0,        2)) / 0.02)               //global min
                 - 40.0  * exp (-(pow (x + 1.3,         2) + pow (y + 0.2,        2)) / 0.5)
                 + 60.0  * exp (-(pow (x - 1.5,         2) + pow (y + 1.5,        2)) / 0.1);

    return Scale (res, -39.701816104859866, 229.91931214214105, 0.0, 1.0);
  }

У этой функции всего два параметра.

Подключил MinBleic

Мне кажется нужно считать не средний результат который выдает оптимизатор, а максимальный. Ну и время конечно вы видите, феноменальные 8 миллисекунд.

Что проще - стабильные учитесь зарабатывать селяне [Эпизод Поиск max-min бара за

Andrey Dik 2024.10.31 10:20 #5

Evgeniy Chernish #:

1. Если я правильно понял, ты мы хотим найти максимум функции Hill равный 1.

2. У этой функции всего два параметра.

3. Подключил MinBleic

Мне кажется нужно считать не средний результат который выдает оптимизатор, а максимальный. Ну и время конечно вы видите, феноменальные 8 миллисекунд.

Спасибо за комментарий.

1. Да, верно. Все тестовые функции унифицированы и их значения лежат в диапазоне [0.0; 1.0].

2. У всех тестовых функций только два параметра. Но при тестировании алгоритмов используем многомерное пространство поиска (три типа тестов, 5*2=10, 25*2=50, 500*2=1000 параметров, чтобы оценить способность AO к масштабированию) путём многократного дублирования двумерной функции.

3. Задача с двумя параметрами слишком простая для адекватного сравнения алгоритмов между собой, практически все алгоритмы решают такую задачу мгновенно со 100% сходимостью. Трудности возникают у алгоритмов как раз с многомерными пространствами.

Брать ли максимальный результат? Дело в том, что имеет значение разброс результатов в отдельных запусках алгоритмов. Во всех алгоритмах на первой итерации рандомные значения посева точек, которые могут оказаться совершенно случайно очень близки к значению глобального экстремума, в таком случае алгоритм неоправданно быстро найдет лучший результат, поэтому среднее значение от результатов запусков лучше отражает характеристику работы алгоритма, чтобы исключить рандомную зависимость от "успеха" алгоритма.

Это связано с теорией вероятностей. Какой бы сложной не была целевая функция, но если параметр всего один, то даже сгенерировав 10 случайных значений одно из них окажется очень близко к глобальному экстремуму. Методы ALGLIB (вариации градиентного спуска) чувствительны к начальному положению точек в пространстве и так же относятся к детерминированной природе этих методов. С увеличением мерности пространства поиска сложность пространства увеличивается экспоненциально, уже никак не получится попасть в глобальный экстремум путем генерации случайных чисел.

Доказательством служат трудности этих методов сойтись даже на монотонном, гладком, унимодальном параболоиде, если мерность задачи возрастает.

Чем более стабильные результаты показывает AO независимо от начальных значений в пространстве поиска, тем больше этот метод может считаться надёжным в решении задач. Именно поэтому в тестировании выбираем среднее значение из множественных запусков AO.

Сегодняшние реалии таковы, что во многих задачах требуется оптимизировать миллионы, и даже миллиарды параметров (ИИ, LLM, генеративные сети, сложные комплексные задачи управления на производстве и бизнесе), при этом о гладкости и унимодальности задач говорить не приходится.

Обсуждение статьи "Алгоритм атомарного MetaTrader 5 Strategy Tester! Обсуждение статьи "Быстрый тестер

Evgeniy Chernish 2024.10.31 11:38 #6