Опубликована статья "Нейросети — это просто (Часть 40): Подходы к использованию Go-Explore на большом объеме данных".
В данной статье обсуждается применение алгоритма Go-Explore на протяжении длительного периода обучения, так как стратегия случайного выбора действий может не привести к прибыльному проходу с увеличением времени обучения.






























