交易中的机器学习：理论、模型、实践和算法交易

Dr. Trader 2018.03.12 17:41 #7371

迈克尔的基础很好。对于那些正在寻找起点的人来说，这是一个很好的例子。

他有一些好的指标，我想即使是来自证券交易所的指标，也已经比标准的mashka和rsishka好了。然后，他不只是把所有这些东西塞进神经网络，还通过各种手段评估指标，并选择最适合的指标进行预测。然后训练神经元卡，但不是一个简单的神经元，而是一个有内置过拟合控制的神经元。而这整个策略是在测试器中用走动式测试的。

SanSanych已经在这个话题的开头描述了这样一个方案，终于有人决定使用它了。否则，许多交易者可能会不假思索地想把更多的指标放到神经元中。

我还会通过vtreat或caret对指标进行预处理。还有一个更充分的神经元卡与kfold。而且我想为培训提供更多的例子，我同意其他批评者的意见。

Mihail Marchukajtes 2018.03.12 18:32 #7372

我知道，兄弟们！！。我将一次性告诉你...每个人都在自己的教育范围内跳舞，但最终的结果才是解决我们的争端。可以说，结果是这样的。到目前为止，我是赢家，因为存款在增长。我知道我的方法是正确的方法之一。

顺便说一下，我用vtreat来选择重要的预测因子+洗牌的技巧。

这将在有关BOO的文章中详细讨论。

СанСаныч Фоменко 2018.03.12 19:12 #7373

Mihail Marchukajtes:

我知道，兄弟们！！。我将一次性告诉你...每个人都在自己的教育程度上跳舞，但解决我们争议的是最终的结果。可以说，结果是这样的。到目前为止，我是赢家，因为存款在增长。我知道我的方法是正确的方法之一。

顺便说一下，我用vtreat来选择重要的预测因子+洗牌的技巧。

关于BO的文章将详细谈及这个问题。

上面你写到了相互信息。这与它有什么关系？

Mihail Marchukajtes 2018.03.12 19:42 #7374

桑桑尼茨-弗门科。

你在上面写到了相互信息。这跟它有什么关系？

选择使用哪种模式的决定性标准。它准备好了ditset。你训练10次。我们得到10个具有相同训练结果的模型（作为一个例子），其中所有模型的训练错误数量是相同的。然后，我们在训练部分的模型结果不是以二进制形式保存，而是以dable形式保存。多项式计算的结果最初是在dable...... 中计算的。

然后我们计算与输出有关的多项式的VI。工作模型被认为具有高于输出熵的VI或简单地超过0.7的约....。

选择一个高OI的模型，但不高于0.95。虽然我还没有核实....IMHO

Mihail Marchukajtes 2018.03.12 20:13 #7375

至于增加训练样本的问题。是的，可以增加，但会降低网络的质量，从而导致交易量下降。网络开始工作更长的时间，但 "不知道 "状态的数量增加，事实证明，网络运行的频率降低。使用这种方法，有必要训练几个模型并并行运行。

更有甚者，现在的训练期是由vtreat.R来支配我。这与我的输入数据一起为我提供了不同样本长度的输入集。我选择了最大的学习周期与它选择的最大输入变量数....，奇怪的是，它从20个样本旋转到50个。显然，我的输入是这样的。我可以做什么...

Dr. Trader 2018.03.12 20:23 #7376

Mihail Marchukajtes:

...

选择使用哪种模式的决定性标准

...

我会试着把它翻译成MO。

虽然该模型是一个分类模型，但它不仅可以返回二进制的0和1的结果，还可以返回属于某个类别的概率（0到1的小数）。因此，该模型不仅可以用分类指标估计，也可以用回归指标估计。我不知道为什么我选择了相互信息，但它与MOC有很好的相关性，所以它是可以的。

在R中，可以这样计算
library(entropy)
mi.plugin(rbind(target,prediction))
在这里，结果越小越好。

Ivan Negreshniy 2018.03.12 20:23 #7377

我不确定它是什么。

当然，但在统计学中，误差（变异）与1/sqrt(N)成正比，其中N是观测值的数量，这里一切都取决于初始变异，变异越大，需要更多的观测值才能将误差装入5%的四分位数中。

"寻找从中受益的人" ((c) 列宁)

只有无用甚至有害的工具才会被公开展示和销售，原因显而易见，这个微不足道的事实应该永远铭记在心，altotrading不是网页设计或其他一些特许经营，它是直接从市场上偷钱的功能，一切公开和容易获得的东西，更不是广告，先验地不能在这种情况下有用，垃圾或骗局，我们有如此积极和竞争的环境。

是啊，5％的胜率和无限丰富的公开可用的工具是一个克朗代克。

而我最近不得不做了一个自定义的神经网络组件，经过测试，它比TensorFlow的狡猾的DNN要好三个数量级。

最重要的是，没有任何复杂的数学或复杂的技术，而是简单的，虽然是原创的解决方案。

在这种背景下，米哈伊尔坚持雷谢托夫的设计一点也不令我惊讶。

Dr. Trader 2018.03.12 20:46 #7378

我不知道。

这就是我的意思，就是这样。如果我通过我的基础设施取40个样本，我也不能保证结果，4000分是非常少的。当然，除非我们谈论的是战斗策略，而不是文章策略。

我坚持以下经验法则--新数据上的EA不会对超过10%的训练条数起作用。如果我在4000个柱子上进行了训练，这意味着这个EA不会在超过400个柱子上工作。例如，如果我想在m15上交易一周，我需要至少4800（4*24*5*10，10周）条的历史记录用于训练。

有一天，MT5将在专家中引入并行线程，以便能够在后台优化专家顾问，然后就可以用极少的条数进行有趣的实验，也许我可以用40条做实验。虽然我可能做不到。即使我有不到1000个样本，神经元的结果也会向趋势倾斜，一旦发生变化，就会很糟糕。

[删除] 2018.03.13 04:29 #7379

Mihail Marchukajtes:

至于增加训练样本的问题。是的，可以增加，但会降低网络的质量，导致交易量下降。网络开始工作更长的时间，但 "不知道 "状态的数量增加，事实证明，网络运行的频率降低。使用这种方法，有必要训练几个模型并并行运行。

更有甚者，现在的训练期是由vtreat.R来支配我。这与我的输入数据一起为我提供了不同样本长度的输入集。我选择了最大的学习周期与它选择的最大输入变量数....，奇怪的是，它从20个样本旋转到50个。显然，我的输入是这样的。你能做什么...

不是网络的质量会下降，而是会有更少的过度拟合，你的模型会以其所有的荣耀和贫穷出现

我的雷舍托夫的神经元选择了3个月在3部智能小说上的1000多笔交易，而在真实上的效果为零。而其他神经元的优化甚至更好。我不知道你为什么一直用你的100个交易说这样的废话，你太愚蠢了，你的自理能力还是你想向别人证明什么？

Alexander Ivanov 2018.03.13 04:56 #7380

嗯...下午好！)

Curwafitter "这个词有什么特殊含义吗？

交易中的机器学习：理论、模型、实践和算法交易 - 页 738