文章 "神经网络变得轻松（第三十九部分）：Go-Explore，一种不同的探索方式"

MetaQuotes 2023.11.17 16:32

我们继续在强化学习模型中研究环境。在本文中，我们将见识到另一种算法 — Go-Explore，它允许您在模型训练阶段有效地探索环境。

Go-Explore 的主要思想是记忆并回归至更有前途的状态。这是奖励数量有限时有效操作的基础。这个思路是如此灵活和广泛，以至于可以经由多种途径实现。

与大多数强化学习算法不同，Go-Explore 并不专注于直接解决目标问题，而是专注于在状态空间中寻找可以导致达成目标状态的相关状态和动作。为了达成这一点，该算法有两个主要阶段：搜索和重用。

第一阶段是遍历状态空间中的所有状态，并将访问的每个状态记录在状态“映射”当中。此后，该算法开始研究每个所访问状态的细节，并收集有关可能导致其它有趣状态的操作信息。

第二阶段是重用以前学习的状态和操作，寻找新的解。该算法存储最成功的轨迹，并用它们来生成新的状态，从而产生更成功的解。

star-ik 2023.04.28 22:22 #1

你好。Faza 1 在测试器中正常工作，并在共享文件夹 GoExploer 中创建了一个空文件。bd.Faza 2 没有连接到图表。

star-ik 2023.04.28 22:31 #2

第二次尝试时，程序启动了。开始日期设置得很远，设置为您有一个月的时间。

mytarmailS 2023.04.30 17:23 #3

star-ik #:
第二次尝试时，程序启动了。开始日期设定得很远，我设定为你有一个月的时间。

结果呢？

star-ik 2023.04.30 19:39 #4

或多或少。但缩水很大。他打开一笔交易，然后等待很长时间，等待有利时机再关闭。经常补仓。很少卖出，总是只买入。箭头出现在每个柱状图上。一旦市场开始运行，我就会在演示版上试试。

star-ik 2023.05.01 09:09 #5

在演示上，他特别减分。每打开一个新栏，它就会填满。我不明白他是如何在测试版中获得加分的。

mytarmailS 2023.05.01 11:57 #6

star-ik #:
在演示上，他特别减分。每打开一个新栏，它就会填满。我不明白在测试版中怎么会变成正数。

谢谢

Ivan Butko 2023.05.01 15:20 #7

star-ik #:
在演示中，他专门做了减法。每打开一个新栏，它就会填满。我不明白他是如何在测试器中做出加号的。

啊哈哈哈))))

土拨鼠日。

我很同情你。

试着在策略测试器中按几次 "开始 "按钮。你会大吃一惊的。

Viktor Kudriavtsev 2023.05.01 16:51 #8

下午好，迪米特里。感谢您提供如此精彩的系列文章。我已经试过了您的所有智能交易系统，但最新的几个遇到了问题。

第 36 篇文章中的智能交易系统（拥有最大神经网络的系统）在测试器中通过了测试，但在测试过程中显卡无法加载，智能交易系统也无法尝试交易。余额图没有变化。在 Common\Files 文件夹中出现了 1 kb 的文件。

第 37 条和第 38 条中的智能交易系统根本没有测试。测试已经开始，但没有任何进展。与此同时，显卡以 100% 的速度加载。以此类推，直到在管理器中杀死 MT5 进程。Common\Files 中没有创建任何文件。测试仪中没有任何错误。

本文中的智能交易系统 Faza1 正确通过了测试，日志中没有错误，但也创建了大小为 1kb 的 GoExploer.bd 文件。

您能告诉我该从哪里查找吗？本系列文章中的其他智能交易系统（被抛在图表上）工作正常，被视为显卡。显卡 RTX 3060 c 12Gb。

Discussing the article: "Neural

Dmitriy Gizlyk 2023.05.02 09:40 #9

Viktor Kudriavtsev #:

本文中的智能交易系统 Faza1 也正确通过了测试，日志中没有出现错误，但 GoExploer.bd 文件也创建了 1kb 大小。

根据测试结果，Faza1 Expert Advisor 只向数据库添加正收益数据。如果所有通道都无利可图，则不会保存任何数据。请尝试在优化模式下运行几次。

Dmitriy Gizlyk 2023.05.02 10:24 #10

star-ik #:
在演示中，他专门做了减法。每打开一个新栏，它就会填满。我不明白他是如何在测试仪中获得加分的。

训练期是多久？短时间的培训只能了解模型是否能够学习。但没有这样的经验，不足以将其推断为系统的未来状态。

1 2 3