交易中的机器学习:理论、模型、实践和算法交易 - 页 738 1...731732733734735736737738739740741742743744745...3399 新评论 Dr. Trader 2018.03.12 17:41 #7371 迈克尔的基础很好。对于那些正在寻找起点的人来说,这是一个很好的例子。 他有一些好的指标,我想即使是来自证券交易所的指标,也已经比标准的mashka和rsishka好了。然后,他不只是把所有这些东西塞进神经网络,还通过各种手段评估指标,并选择最适合的指标进行预测。然后训练神经元卡,但不是一个简单的神经元,而是一个有内置过拟合控制的神经元。而这整个策略是在测试器中用走动式测试的。 SanSanych已经在这个话题的开头描述了这样一个方案,终于有人决定使用它了。否则,许多交易者可能会不假思索地想把更多的指标放到神经元中。 我还会通过vtreat或caret对指标进行预处理。还有一个更充分的神经元卡与kfold。而且我想为培训提供更多的例子,我同意其他批评者的意见。 Mihail Marchukajtes 2018.03.12 18:32 #7372 我知道,兄弟们!!。我将一次性告诉你...每个人都在自己的教育范围内跳舞,但最终的结果才是解决我们的争端。可以说,结果是这样的。到目前为止,我是赢家,因为存款在增长。我知道我的方法是正确的方法之一。 顺便说一下,我用vtreat来选择重要的预测因子+洗牌的技巧。 这将在有关BOO的文章中详细讨论。 СанСаныч Фоменко 2018.03.12 19:12 #7373 Mihail Marchukajtes:我知道,兄弟们!!。我将一次性告诉你...每个人都在自己的教育程度上跳舞,但解决我们争议的是最终的结果。可以说,结果是这样的。到目前为止,我是赢家,因为存款在增长。我知道我的方法是正确的方法之一。 顺便说一下,我用vtreat来选择重要的预测因子+洗牌的技巧。 关于BO的文章将详细谈及这个问题。上面你写到了相互信息。这与它有什么关系? Mihail Marchukajtes 2018.03.12 19:42 #7374 桑桑尼茨-弗门科。你在上面写到了相互信息。这跟它有什么关系?选择使用哪种模式的决定性标准。它准备好了ditset。你训练10次。我们得到10个具有相同训练结果的模型(作为一个例子),其中所有模型的训练错误数量是相同的。然后,我们在训练部分的模型结果不是以二进制形式保存,而是以dable形式保存。多项式计算的结果最初是在dable...... 中计算的。 然后我们计算与输出有关的多项式的VI。工作模型被认为具有高于输出熵的VI或简单地超过0.7的约....。 选择一个高OI的模型,但不高于0.95。虽然我还没有核实....IMHO Mihail Marchukajtes 2018.03.12 20:13 #7375 至于增加训练样本的问题。是的,可以增加,但会降低网络的质量,从而导致交易量下降。网络开始工作更长的时间,但 "不知道 "状态的数量增加,事实证明,网络运行的频率降低。使用这种方法,有必要训练几个模型并并行运行。 更有甚者,现在的训练期是由vtreat.R来支配我。这与我的输入数据一起为我提供了不同样本长度的输入集。我选择了最大的学习周期与它选择的最大输入变量数....,奇怪的是,它从20个样本旋转到50个。显然,我的输入是这样的。我可以做什么... Dr. Trader 2018.03.12 20:23 #7376 Mihail Marchukajtes: ...选择使用哪种模式的决定性标准 ... 我会试着把它翻译成MO。 虽然该模型是一个分类模型,但它不仅可以返回二进制的0和1的结果,还可以返回属于某个类别的概率(0到1的小数)。因此,该模型不仅可以用分类指标估计,也可以用回归指标估计。我不知道为什么我选择了相互信息,但它与MOC有很好的相关性,所以它是可以的。 在R中,可以这样计算 library(entropy) mi.plugin(rbind(target,prediction)) 在这里,结果越小越好。 Ivan Negreshniy 2018.03.12 20:23 #7377 我不 确定它是什么。当然,但在统计学中,误差(变异)与1/sqrt(N)成正比,其中N是观测值的数量,这里一切都取决于初始变异,变异越大,需要更多的观测值才能将误差装入5%的四分位数中。 "寻找从中受益的人" ((c) 列宁) 只有无用甚至有害的工具才会被公开展示和销售,原因显而易见,这个微不足道的事实应该永远铭记在心,altotrading不是网页设计或其他一些特许经营,它是直接从市场上偷钱的功能,一切公开和容易获得的东西,更不是广告,先验地不能在这种情况下有用,垃圾或骗局,我们有如此积极和竞争的环境。是啊,5%的胜率和无限丰富的公开可用的工具是一个克朗代克。 而我最近不得不做了一个自定义的神经网络组件,经过测试,它比TensorFlow的狡猾的DNN要好三个数量级。 最重要的是,没有任何复杂的数学或复杂的技术,而是简单的,虽然是原创的解决方案。 在这种背景下,米哈伊尔坚持雷谢托夫的设计一点也不令我惊讶。 Dr. Trader 2018.03.12 20:46 #7378 我不知道。这就是我的意思,就是这样。如果我通过我的基础设施取40个样本,我也不能保证结果,4000分是非常少的。当然,除非我们谈论的是战斗策略,而不是文章策略。我坚持以下经验法则--新数据上的EA不会对超过10%的训练条数起作用。如果我在4000个柱子上进行了训练,这意味着这个EA不会在超过400个柱子上工作。例如,如果我想在m15上交易一周,我需要至少4800(4*24*5*10,10周)条的历史记录用于训练。 有一天,MT5将在专家中引入并行线程,以便能够在后台优化专家顾问,然后就可以用极少的条数进行有趣的实验,也许我可以用40条做实验。虽然我可能做不到。即使我有不到1000个样本,神经元的结果也会向趋势倾斜,一旦发生变化,就会很糟糕。 Maxim Dmitrievsky 2018.03.13 04:29 #7379 Mihail Marchukajtes:至于增加训练样本的问题。是的,可以增加,但会降低网络的质量,导致交易量下降。网络开始工作更长的时间,但 "不知道 "状态的数量增加,事实证明,网络运行的频率降低。使用这种方法,有必要训练几个模型并并行运行。 更有甚者,现在的训练期是由vtreat.R来支配我。这与我的输入数据一起为我提供了不同样本长度的输入集。我选择了最大的学习周期与它选择的最大输入变量数....,奇怪的是,它从20个样本旋转到50个。显然,我的输入是这样的。你能做什么... 不是网络的质量会下降,而是会有更少的过度拟合,你的模型会以其所有的荣耀和贫穷出现我的雷舍托夫的神经元选择了3个月在3部智能小说上的1000多笔交易,而在真实上的效果为零。而其他神经元的优化甚至更好。我不知道你为什么一直用你的100个交易说这样的废话,你太愚蠢了,你的自理能力还是你想向别人证明什么? Alexander Ivanov 2018.03.13 04:56 #7380 嗯...下午好!) Curwafitter "这个词有什么特殊含义吗? 1...731732733734735736737738739740741742743744745...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
迈克尔的基础很好。对于那些正在寻找起点的人来说,这是一个很好的例子。
他有一些好的指标,我想即使是来自证券交易所的指标,也已经比标准的mashka和rsishka好了。然后,他不只是把所有这些东西塞进神经网络,还通过各种手段评估指标,并选择最适合的指标进行预测。然后训练神经元卡,但不是一个简单的神经元,而是一个有内置过拟合控制的神经元。而这整个策略是在测试器中用走动式测试的。
SanSanych已经在这个话题的开头描述了这样一个方案,终于有人决定使用它了。否则,许多交易者可能会不假思索地想把更多的指标放到神经元中。
我还会通过vtreat或caret对指标进行预处理。还有一个更充分的神经元卡与kfold。而且我想为培训提供更多的例子,我同意其他批评者的意见。
我知道,兄弟们!!。我将一次性告诉你...每个人都在自己的教育范围内跳舞,但最终的结果才是解决我们的争端。可以说,结果是这样的。到目前为止,我是赢家,因为存款在增长。我知道我的方法是正确的方法之一。
顺便说一下,我用vtreat来选择重要的预测因子+洗牌的技巧。
这将在有关BOO的文章中详细讨论。
我知道,兄弟们!!。我将一次性告诉你...每个人都在自己的教育程度上跳舞,但解决我们争议的是最终的结果。可以说,结果是这样的。到目前为止,我是赢家,因为存款在增长。我知道我的方法是正确的方法之一。
顺便说一下,我用vtreat来选择重要的预测因子+洗牌的技巧。
关于BO的文章将详细谈及这个问题。
上面你写到了相互信息。这与它有什么关系?
你在上面写到了相互信息。这跟它有什么关系?
选择使用哪种模式的决定性标准。它准备好了ditset。你训练10次。我们得到10个具有相同训练结果的模型(作为一个例子),其中所有模型的训练错误数量是相同的。然后,我们在训练部分的模型结果不是以二进制形式保存,而是以dable形式保存。多项式计算的结果最初是在dable...... 中计算的。
然后我们计算与输出有关的多项式的VI。工作模型被认为具有高于输出熵的VI或简单地超过0.7的约....。
选择一个高OI的模型,但不高于0.95。虽然我还没有核实....IMHO
至于增加训练样本的问题。是的,可以增加,但会降低网络的质量,从而导致交易量下降。网络开始工作更长的时间,但 "不知道 "状态的数量增加,事实证明,网络运行的频率降低。使用这种方法,有必要训练几个模型并并行运行。
更有甚者,现在的训练期是由vtreat.R来支配我。这与我的输入数据一起为我提供了不同样本长度的输入集。我选择了最大的学习周期与它选择的最大输入变量数....,奇怪的是,它从20个样本旋转到50个。显然,我的输入是这样的。我可以做什么...
Mihail Marchukajtes:
...
选择使用哪种模式的决定性标准
...
我会试着把它翻译成MO。
虽然该模型是一个分类模型,但它不仅可以返回二进制的0和1的结果,还可以返回属于某个类别的概率(0到1的小数)。因此,该模型不仅可以用分类指标估计,也可以用回归指标估计。我不知道为什么我选择了相互信息,但它与MOC有很好的相关性,所以它是可以的。
在R中,可以这样计算
library(entropy)
mi.plugin(rbind(target,prediction))
在这里,结果越小越好。
当然,但在统计学中,误差(变异)与1/sqrt(N)成正比,其中N是观测值的数量,这里一切都取决于初始变异,变异越大,需要更多的观测值才能将误差装入5%的四分位数中。
"寻找从中受益的人" ((c) 列宁)
只有无用甚至有害的工具才会被公开展示和销售,原因显而易见,这个微不足道的事实应该永远铭记在心,altotrading不是网页设计或其他一些特许经营,它是直接从市场上偷钱的功能,一切公开和容易获得的东西,更不是广告,先验地不能在这种情况下有用,垃圾或骗局,我们有如此积极和竞争的环境。
是啊,5%的胜率和无限丰富的公开可用的工具是一个克朗代克。
而我最近不得不做了一个自定义的神经网络组件,经过测试,它比TensorFlow的狡猾的DNN要好三个数量级。
最重要的是,没有任何复杂的数学或复杂的技术,而是简单的,虽然是原创的解决方案。
在这种背景下,米哈伊尔坚持雷谢托夫的设计一点也不令我惊讶。
这就是我的意思,就是这样。如果我通过我的基础设施取40个样本,我也不能保证结果,4000分是非常少的。当然,除非我们谈论的是战斗策略,而不是文章策略。
我坚持以下经验法则--新数据上的EA不会对超过10%的训练条数起作用。如果我在4000个柱子上进行了训练,这意味着这个EA不会在超过400个柱子上工作。例如,如果我想在m15上交易一周,我需要至少4800(4*24*5*10,10周)条的历史记录用于训练。
有一天,MT5将在专家中引入并行线程,以便能够在后台优化专家顾问,然后就可以用极少的条数进行有趣的实验,也许我可以用40条做实验。虽然我可能做不到。即使我有不到1000个样本,神经元的结果也会向趋势倾斜,一旦发生变化,就会很糟糕。
至于增加训练样本的问题。是的,可以增加,但会降低网络的质量,导致交易量下降。网络开始工作更长的时间,但 "不知道 "状态的数量增加,事实证明,网络运行的频率降低。使用这种方法,有必要训练几个模型并并行运行。
更有甚者,现在的训练期是由vtreat.R来支配我。这与我的输入数据一起为我提供了不同样本长度的输入集。我选择了最大的学习周期与它选择的最大输入变量数....,奇怪的是,它从20个样本旋转到50个。显然,我的输入是这样的。你能做什么...
嗯...下午好!)
Curwafitter "这个词有什么特殊含义吗?