文章 "神经网络变得轻松（第四十部分）：在大数据上运用 Go-Explore"

MetaQuotes 2023.11.23 15:33

本文讨论 Go-Explore 算法覆盖长周期训练的运用，因为随着训练时间的增加，随机动作选择策略也许不会导致可盈利验算。

Go-Explore 算法随着训练周期的增加，浮现出一定的困难。其中一些包括：

随着训练周期的增加，需要探索的状态空间维度也许会出现增加的问题。这也许会导致 “维度诅咒” 问题，其中可能状态的数量随着维度的增加呈指数增长。这令状态空间探索变得困难，并可能导致算法花费太多时间探索不相关的状态。

为了检查训练模型的品质和成效，我们依据训练和测试样本对其进行了测试。重点注意的是，我们的模型能够自 2023 年 5 月第一周的历史数据中获利，这些数据不包括在训练集之中，而是训练集的直接延续。

测试样本（2023 年 05 月）