文章 "强化学习中的随机决策森林" - 页 2 12345678910 新评论 Vasily Belozerov 2018.06.03 16:27 #11 对不起,迈克西姆,我走神了,把你的名字拼错了。 Vasily Belozerov 2018.06.03 16:40 #12 忘了补充。在策略游戏中,解决办法是组合学(寻找重复组合)、概率分析、确定对手的心理类型和创建行为模型。 Maxim Dmitrievsky 2018.06.05 02:21 #13 Vasily Belozerov: 忘了补充。在战略游戏中,解决办法是组合学(寻找重复组合)、概率分析、确定对手的心理类型和创建行为模型。您好,关于心理模型--当然不适用于市场。除此之外,RL 很大程度上是博弈论的遗产。例如,你可以将多个 RL 代理视为相互竞争的玩家,每个玩家都试图击败其他玩家。或者,让它们相互促进。 从本质上讲,市场和代理之间会形成一个支付矩阵。如果市场的策略没有改变,代理就开始在可能的情况下击败市场。 Vasily Belozerov 2018.06.06 11:09 #14 我只是在建议,也许正确的棋子应该加上一些不正确的东西,类似于人类的行动。例如,第一招 e2 - e4,然后第二招 e4 - e2,第三招又是 e2 - e4。基本上就是这样。 Maxim Dmitrievsky 2018.06.06 11:24 #15 Vasily Belozerov: 我只是在建议,也许正确的棋子应该加上一些不正确的东西,类似于人类的行动。例如,第一招 e2 - e4,然后第二招 e4 - e2,第三招又是 e2 - e4。基本上就是这样。我们的任务不是让交易与人类交易相似(你怎么知道,机器人必须通过图灵测试?),而且你凭什么认为人类能比智能交易系统交易得更好,这完全取决于策略。我们的目标是让机器自己寻找一些模式并进行交易。 Ivan Gurov 2018.06.29 22:23 #16 Vasily Belozerov: 我只是在建议,也许正确的棋子应该加上一些不正确的东西,类似于人类的行动。例如,第一步棋是 e2 - e4,第二步棋是 e4 - e2,第三步棋又是 e2 - e4。诸如此类。这就是 "随机森林",它的要点是:它本身就构成了开局之书。 Ivan Gurov 2018.06.29 22:36 #17 马克西姆,尝试生成新的随机树有什么影响吗?例如,我们第一次生成了一棵树,第二次我们又生成了其他树,这些树的训练效率更高。还是说对最终的训练结果完全没有影响? Maxim Dmitrievsky 2018.06.30 04:46 #18 Ivan Gurov: 马克西姆,尝试生成新的随机树有什么影响吗?例如,我们第一次生成了一棵树,第二次又生成了其他树,这些树的训练效率更高。还是说根本不会影响最终的训练结果? 不是树的问题,而是在同一数据上训练多个森林的问题,是的,会有影响。因为构建过程是随机的,结果可能会有所不同。让我感到惊讶的是,森林的集合会带来明显的改进,即在相同数据上训练多个森林,然后取平均值。(您也可以进行不同的设置。如果有突变,效果应该会更好,但我还没有达到这个水平。 forexman77 2018.07.06 19:43 #19 我喜欢这篇文章。我希望有人能在 alglib 中重新设计森林,这样就可以调整树木的深度了。 FxTrader562 2018.07.19 01:43 #20 感谢您分享这篇非常有用的文章。 我试图在代码中添加更多指标,但我不是程序员专家,也没有使用成员函数的良好经验,因此我不知道如何在 OnInit() 函数中添加更多指标和规则。代码只包含 RSI 指标,并从中创建买入和卖出规则。能否提供更多指标的示例代码,如移动平均线或 MACD 或随机指标或 SAR,以便在代码中使用? 特别是,我想知道如何在与当前价格比较的同时创建规则并添加到进入条件中。当前代码的主要问题是,有时它会长时间持有亏损的交易,而快速关闭盈利的交易,因此,如果能提供这方面的建议,我将不胜感激。我认为需要对退出逻辑进行更多过滤。 另外,我还有一个问题,请您回答: OPT 文件是否会持续更新,以便在长时间后通过微调策略本身来改进进入和退出? 还是说 EA 只是使用策略测试器来 优化 EA 值,并像普通优化 EA 一样使用最近盈利的相同进入和退出值? 我的意思是,像其他神经网络 EA 一样,它是否会在交易过程中微调交易进入和退出的整体策略? 12345678910 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
忘了补充。在战略游戏中,解决办法是组合学(寻找重复组合)、概率分析、确定对手的心理类型和创建行为模型。
您好,关于心理模型--当然不适用于市场。除此之外,RL 很大程度上是博弈论的遗产。例如,你可以将多个 RL 代理视为相互竞争的玩家,每个玩家都试图击败其他玩家。或者,让它们相互促进。
从本质上讲,市场和代理之间会形成一个支付矩阵。如果市场的策略没有改变,代理就开始在可能的情况下击败市场。我只是在建议,也许正确的棋子应该加上一些不正确的东西,类似于人类的行动。例如,第一招 e2 - e4,然后第二招 e4 - e2,第三招又是 e2 - e4。基本上就是这样。
我们的任务不是让交易与人类交易相似(你怎么知道,机器人必须通过图灵测试?),而且你凭什么认为人类能比智能交易系统交易得更好,这完全取决于策略。我们的目标是让机器自己寻找一些模式并进行交易。
我只是在建议,也许正确的棋子应该加上一些不正确的东西,类似于人类的行动。例如,第一步棋是 e2 - e4,第二步棋是 e4 - e2,第三步棋又是 e2 - e4。诸如此类。
这就是 "随机森林",它的要点是:它本身就构成了开局之书。
马克西姆,尝试生成新的随机树有什么影响吗?例如,我们第一次生成了一棵树,第二次又生成了其他树,这些树的训练效率更高。还是说根本不会影响最终的训练结果?
感谢您分享这篇非常有用的文章。
我试图在代码中添加更多指标,但我不是程序员专家,也没有使用成员函数的良好经验,因此我不知道如何在 OnInit() 函数中添加更多指标和规则。代码只包含 RSI 指标,并从中创建买入和卖出规则。能否提供更多指标的示例代码,如移动平均线或 MACD 或随机指标或 SAR,以便在代码中使用?
特别是,我想知道如何在与当前价格比较的同时创建规则并添加到进入条件中。当前代码的主要问题是,有时它会长时间持有亏损的交易,而快速关闭盈利的交易,因此,如果能提供这方面的建议,我将不胜感激。我认为需要对退出逻辑进行更多过滤。
另外,我还有一个问题,请您回答:
OPT 文件是否会持续更新,以便在长时间后通过微调策略本身来改进进入和退出?
还是说 EA 只是使用策略测试器来 优化 EA 值,并像普通优化 EA 一样使用最近盈利的相同进入和退出值?
我的意思是,像其他神经网络 EA 一样,它是否会在交易过程中微调交易进入和退出的整体策略?