文章 "群体自适应矩估计(ADAM)优化算法"

 

新文章 群体自适应矩估计(ADAM)优化算法已发布:

本文介绍了将广为人知且广受欢迎的ADAM梯度优化方法转变为群体算法的过程,并介绍了通过引入混合个体对其进行改进的方案。这种新方法能够利用概率分布创建融合了成功决策要素的智能体。关键创新点在于形成了群体混合个体,这些个体能够自适应地积累来自最具潜力解决方案的信息,从而提高了在复杂多维空间中的搜索效率。

2014年,两位杰出人才D. P. Kingma和J. Ba提出了ADAM算法,该算法融合了其前身(如AdaGrad算法和RMSProp算法)的优点。此算法是专门为利用神经元激活函数的梯度来优化神经网络权重而设计的。它基于自适应的一阶和二阶矩估计,不仅实现简单,而且计算效率极高。该算法所需的内存资源极少,且不依赖于梯度的对角缩放,这使其特别适用于数据量和参数庞大的问题。

ADAM算法在非平稳目标和梯度可能存在噪声或稀疏的情况下也表现出色。该算法的超参数易于解释,通常无需复杂的调优。

然而,尽管ADAM算法在神经网络领域效率极高,但它仅限于使用解析梯度,这限制了其应用范围。在本文中,我们提出了一种创新方法,通过将ADAM算法转变为一种能够处理数值梯度的基于群体的优化算法,对其进行改进。这一改进不仅将ADAM算法的应用范围扩展到了神经网络之外,还为解决各种优化问题开辟了新的可能性。

我们的研究旨在创建一种通用优化器,它既能保留原始ADAM算法的优点,又能在无法获取解析梯度的情况下有效运行。这将使改进后的ADAM算法能够应用于全局优化和多目标优化等领域,从而显著拓展了其潜力和实用价值。


作者:Andrey Dik