文章 "您应当知道的 MQL5 向导技术(第 62 部分):结合 ADX 与 CCI 形态的强化学习 TRPO"

 

新文章 您应当知道的 MQL5 向导技术(第 62 部分):结合 ADX 与 CCI 形态的强化学习 TRPO已发布:

ADX 振荡器和 CCI 振荡器是趋势跟踪和动量指标,可在开发智能系统时配对。我们延续上一篇文章未竟的话题,实证如何得益于强化学习来实际运用训练、并更新我们已开发的模型。我们正在使用的算法尚未在本系列中涵盖,其称为可信区域政策优化。一如既往,由 MQL5 向导汇编的智能系统令我们能够更快地搭建测试模型,且可配合不同类型信号进行测试、并派发。

以往用法,为了提示计算机程序有可用或实际响应,必须将这个响应手写进程序当中。本质上,if-从句是大多数程序编程的核心。若您思考过有关内容,依赖 if-从句意味着用户输入数据、或由程序处理的数据必须属于某些类别。必须是离散的。因此,对于大部分而论,我们在响应中开发和使用离散数据是对编程约束,而与数据或正在解决的问题无关。

然后,2023 年秋季 OpenAI 推出了他们的首个公开 GPT,一切都随之变化。变换器网络和 GPT 的发展并非一夜发生,在于第一批感知器是在 60 年代末才被开发出来的,但可以确凿地说,ChatGPT 的推出是一个重要的里程碑。随着大语言模型的广泛运用,日益清楚,词元化、单词嵌入,当然还有自我注意力,已成为模型能够扩充其可处理内容的关键组件。没有更多 if-从句。配合词元化、以及单词嵌入,令网络输入尽可能连续的背景下,我们也令监督学习 MLP 的输入“更加连续”。

您应当知道的 MQL5 向导技术(第 62 部分)


作者:Stephen Njuki