交易中的机器学习：理论、模型、实践和算法交易

Rorschach 2020.07.23 14:29 #19081

Mihail Marchukajtes:

我有一个7700列的肮脏文件，在那里我采取了24个联盟，所以不要继续下去，而是看这里。这是你的文件。

而这是我的。

有什么区别????我不会让你有悬念。在主成分分析中，当每一列都是自己的坐标系时，重要的是它们可以被聚类，以便不同列的点可以被绘制在同一坐标系上。解释很简单。垂直和水平矢量越多，就越酷。你所拥有的是一个直截了当的统一点。

如果你想压缩信息，先检查自相关，你可以安全地只留下1个输入，但网络将无法工作，因为没有内存。

Mihail Marchukajtes 2020.07.23 14:43 #19082

Rorschach:

如果你想压缩信息，那么先检查自相关，你可以安全地只留下1个输入，只是网络将无法工作，因为没有记忆。

对于一个网络来说，内存并不是最重要的东西--是提供内存的滞后性--但类的划分质量（如果我们谈论的是分类）是非常重要的。有必要获得一个不会有不一致的数据集，而且类会被捆绑在一起。所有这些都导致了质的分离。我在Rattle（P的图形外壳）中运行了你的文件，有一种参考向量的方法，结果是65%的冗余。也就是说，如果数据集是一个普通的G，那么其中就不会有鱼。但这些方法不需要大型数据集。也许你使用的是这样的人工智能配置，使用整套的人工智能可以得到很高的学习分数，但这通常是有点牵强的，仅此而已。

[删除] 2020.07.23 15:20 #19083

Mihail Marchukajtes:

那么，此外，该模型估计。

预测器表示文件中的列数

258个矢量的总数。我去掉了0类，把2类重命名为0，因为它们与1类在数量上是平衡的，19.60是二次误差，或者说是直线和二次之间的差异，它应该趋于零，79.141是一般概括能力，当你到了100时，误差之间的差异就会减少，69.767是spicification。总的控制情节是75，一般普遍性是70。我们在总样本的77个向量上得到的答案是 "不知道"，而对照组有17个。

事实上，我在训练中得到的结果更差，但在对照图中却好得多。此外，这不是一个像你这样的测试网站，而是一个控制网站，也就是网络根本没有看到的那个网站。测试阶段是指它在训练阶段进行训练，以便在测试阶段工作得很好，也就是说，在训练期间，网络有可能看到测试部分。测试的那个没有。问题????

阿达巴斯特给我的是79分

Mihail Marchukajtes 2020.07.23 15:28 #19084

Maxim Dmitrievsky:

阿达巴斯特给了我79的价格

你能用我的模型换取OOS吗？

Rorschach 2020.07.23 15:48 #19085

Mihail Marchukajtes:
也许你使用的是一种人工智能配置，可以使用整个集合获得高的学习分数

这正是它的特点。让我试着以另一种方式来解释它。假设我们有一个关于Ma(100)和价格的经典系统。横盘向上买入，横盘向下卖出。通常情况下，我们将马云和价格输入，将系统信号输入输出。这导致了投入上的节约，因为马匹是事先计算好的，并以现成的形式送入网络。另外，也可以不给网络提供ma，而是在输入端提供100个滞后的价格（供网络自己计算），在输出端提供系统信号。在这种形式下，不能用少于100的价格滞后来喂养网。

Mihail Marchukajtes 2020.07.23 16:41 #19086

Rorschach:

这就是它。让我试着以不同的方式来解释它。假设有一个关于ma(100)和价格的经典系统。向上交叉买入，向下交叉卖出。通常情况下，我们将马云和价格输入，将系统信号输入输出。这导致了投入上的节约，因为马匹是事先计算好的，并以现成的形式送入网络。另外，也可以不给网络提供ma，而是在输入端提供100个滞后的价格（供网络自己计算），在输出端提供系统信号。在这种形式下，网络不能以少于100个滞后期的价格进货。

原始的想法，你越早摆脱它们，你就越早跳出妄想的深渊。你违反了模型准备的主要规则之一。请记住，我们在这里曾经与阿列克谢-维亚泽姆斯基是活跃在奥运会上，所以作为一个感谢的标志，我已经podnakil他的滞后和效果，我很惊讶。我是一个实践者，然后是一个理论家。请允许我引用我通信中的部分内容，其中揭示了滞后的本质

引用。

咳咳，咳咳...有趣的是。好吧，我不烦你了，你对我很好，所以我就告诉你。我是一个实践者，经常偶然发现各种现象，后来我试图在理论上解释这些现象，或者详细研究我发现的效果。但最有趣的部分是得到我问题的答案。所以我们有一个问题。在训练分类器时，如何用历史数据而不是当前数据来装备它。当建立一个基于回归的预测模型时，数据的顺序是非常重要的，也就是说，如果一个训练文件是由历史形成的，那么在任何情况下它们都不应该被调换或混合起来。正是数据的顺序（按照严格的顺序）使预测模型能够看到训练样本的整个历史，正如我所说，训练样本中最开始的数据由于排序而影响到最后的数据。这是从过去到未来，它们永远不应该被混为一谈。记得麦克斯曾经尝试过，但结果令人失望。因为混合不适用于回归。分类则是另一回事，这时需要采用随机混合训练集的方法来避免过度训练。换句话说，我们得到的是对训练质量的真实估计，而不是因为数据被成功洗牌而膨胀的估计。我们轮换10个纪元，洗牌，再次轮换，再次洗牌。在这种情况下，训练向量之间没有联系，基本上每个向量都是独立的。

2020.07.02 22:47

因此，我想知道如何为NS提供不仅是当前信号的指标值，而且是历史数据。最后，我有一个想法。这非常简单。我们在信号出现的那一刻保存指标，然后为当前信号取前一个指标的值，然后为前一个信号取另一个指标，等等。因此，对于当前信号，不仅其指标，而且以前信号的指标也被保存。目前，我采取了24个信号的滞后。也就是说，对于当前的信号，我保存的是24个信号之前的指标值。我记得在论坛上说过，训练文件包含50行7500列，但没有人能够猜到它们是怎么来的。MO地区的问题，我们这里都太聪明了 :-)

2020.07.02 22:52

现在让我们进入正题：
你可能已经注意到，我保存了15个工具的数据，并使用这些数据来建立几个指标。我采取随机函数。我取的是累积标准差，仅此而已。因此，我有307个独特的输入条，是当前信号的主要内容。因此，我把当前信号的这307根柱子，加上之前24个信号的307根柱子，就成了它（信号）。这个法令的意义在于，在信号出现时，立即向国家统计局提交过去24个信号的数据。这是允许分类深入研究当前信号的历史的转变。它本质上是一个滞后于24的深度

2020.07.02 22:59

但我把最有趣的部分留给了最后一段。我相信你已经听说过P的vtreat插件，所以这个野兽通过识别输出变量的有意义的列来进行数据预处理。作为一项规则，在其处理之后，有130-180个真正有意义的列。但矛盾的是，当前信号的指标值极少落入这个样本。非常少。在后期处理的文件中，同样的24个滞后也不是一个不常见的客人。换句话说，24个滞后期之前的指标值对目标函数至关重要。基本上，这个想法就像5戈比一样简单。保存一个相当大的样本，然后将有偏移的列向下乘以一个Excel单元格，并进行后处理。这就是它的利润!

这句话是完整的。

网络不会自己做任何事情。你给它的输入就是你得到的结果。实践证明，并不是所有的滞后都是好的，在你的这套作品中，没有一列能帮助NS以某种方式获得足够的模型.....。好运!!!!!

Документация по MQL5: Константы, перечисления и структуры / Константы объектов / Типы объектов

www.mql5.com

При создании графического объекта функцией ObjectCreate() необходимо указать тип создаваемого объекта, который может принимать одно из значений перечисления ENUM_OBJECT. Дальнейшие уточнения свойств созданного объекта возможно с помощью функций по работе с графическими объектами.

Mihail Marchukajtes 2020.07.23 16:43 #19087

如果操作正确，该模型的工作原理是这样的：.....

Aleksey Nikolayev 2020.07.23 16:46 #19088

Valeriy Yastremskiy:

是的，错了）显然，这都是解析中的故障，或者是读取数据上的故障。

正常化不太可能是方便的。好在我们在终端需要存档的新闻数据，有可能定期加载它们，并有服务来处理它们。我不认为没有档案）但从创造者的立场来看，直到用户说出他们的话，他们想要什么，它不会开始，如果它开始，首先是付费版本）。

嗯，是的，自由和良好的日历几乎不可能）。

Valeriy Yastremskiy 2020.07.23 17:18 #19089

Aleksey Nikolayev:

是的，好吧，一个免费的好日历几乎不可能)

是的，你可以做一个坏的日历，长的和准确的）在档案馆）这是一个薄荷服务）关于现在自己的解析）。

Rorschach 2020.07.23 17:40 #19090

Mihail Marchukajtes:

谢谢，这很有趣，我不会想到要使用以前的信号。这就提出了一个问题，也许网根本就是一个不必要的环节？

这就是使网络对我感兴趣的原因，这样它就不会夺走标志。否则，做一个经典的系统会更容易。

我将不得不再修补一些实验，我将在Machka系统上采取非常多的例子，这样在训练时就不会有单一的重复，我可以装入一个epoch。

交易中的机器学习：理论、模型、实践和算法交易 - 页 1909