文章 "神经网络变得轻松(第五十四部分):利用随机编码器(RE3)进行高效研究"

 

新文章 神经网络变得轻松(第五十四部分):利用随机编码器(RE3)进行高效研究已发布:

无论何时我们研究强化学习方法时,我们都会面对有效探索环境的问题。解决这个问题通常会导致算法更复杂性,以及训练额外模型。在本文中,我们将看看解决此问题的替代方法。

高效探索的随机编码器(RE3)方法的主要目标是最大限度地降低训练模型的数量。在它们的工作中,RE3 方法的作者提请注意这样一个事实,即在图像处理领域,只有卷积网络能够识别单个对象的外在特点和内在特征。卷积网络将有助于降低多维空间的维度,突出特征并应对原始对象的缩放。

此处相当合理的问题是,如果我们另外转向卷积网络,我们正在谈论的已训练模型的最小化是什么样的?

在这个层面,关键词是 “已训练”。该方法的作者提请注意这样一个事实,即使卷积编码器采用随机参数初始化,也能有效地捕获有关两个状态相近度的信息。下面是可视化查找 k-最近态,通过测量随机初始化编码器(随机编码器)的表述空间,以及来自文章的真实状态空间中的距离。

k-最近态的可视化

作者:Dmitriy Gizlyk