交易中的机器学习:理论、模型、实践和算法交易 - 页 1909

 
Mihail Marchukajtes:

我有一个7700列的肮脏文件,在那里我采取了24个联盟,所以不要继续下去,而是看这里。这是你的文件。

而这是我的。

有什么区别????我不会让你有悬念。在主成分分析中,当每一列都是自己的坐标系时,重要的是它们可以被聚类,以便不同列的点可以被绘制在同一坐标系上。解释很简单。垂直和水平矢量越多,就越酷。你所拥有的是一个直截了当的统一点。

如果你想压缩信息,先检查自相关,你可以安全地只留下1个输入,但网络将无法工作,因为没有内存。

 
Rorschach:

如果你想压缩信息,那么先检查自相关,你可以安全地只留下1个输入,只是网络将无法工作,因为没有记忆。

对于一个网络来说,内存并不是最重要的东西--是提供内存的滞后性--但类的划分质量(如果我们谈论的是分类)是非常重要的。有必要获得一个不会有不一致的数据集,而且类会被捆绑在一起。所有这些都导致了质的分离。我在Rattle(P的图形外壳)中运行了你的文件,有一种参考向量的方法,结果是65%的冗余。也就是说,如果数据集是一个普通的G,那么其中就不会有鱼。但这些方法不需要大型数据集。也许你使用的是这样的人工智能配置,使用整套的人工智能可以得到很高的学习分数,但这通常是有点牵强的,仅此而已。
 
Mihail Marchukajtes:

那么,此外,该模型估计。

预测器表示文件中的列数

258个矢量的总数。我去掉了0类,把2类重命名为0,因为它们与1类在数量上是平衡的,19.60是二次误差,或者说是直线和二次之间的差异,它应该趋于零,79.141是一般概括能力,当你到了100时,误差之间的差异就会减少,69.767是spicification。总的控制情节是75,一般普遍性是70。我们在总样本的77个向量上得到的答案是 "不知道",而对照组有17个。

事实上,我在训练中得到的结果更差,但在对照图中却好得多。此外,这不是一个像你这样的测试网站,而是一个控制网站,也就是网络根本没有看到的那个网站。测试阶段是指它在训练阶段进行训练,以便在测试阶段工作得很好,也就是说,在训练期间,网络有可能看到测试部分。测试的那个没有。问题????

阿达巴斯特给我的是79分

 
Maxim Dmitrievsky:

阿达巴斯特给了我79的价格

你能用我的模型换取OOS吗?
 
Mihail Marchukajtes:
也许你使用的是一种人工智能配置,可以使用整个集合获得高的学习分数

这正是它的特点。让我试着以另一种方式来解释它。假设我们有一个关于Ma(100)和价格的经典系统。横盘向上买入,横盘向下卖出。通常情况下,我们将马云和价格输入,将系统信号输入输出。这导致了投入上的节约,因为马匹是事先计算好的,并以现成的形式送入网络。另外,也可以不给网络提供ma,而是在输入端提供100个滞后的价格(供网络自己计算),在输出端提供系统信号。在这种形式下,不能用少于100的价格滞后来喂养网。

 
Rorschach:

这就是它。让我试着以不同的方式来解释它。假设有一个关于ma(100)和价格的经典系统。向上交叉买入,向下交叉卖出。通常情况下,我们将马云和价格输入,将系统信号输入输出。这导致了投入上的节约,因为马匹是事先计算好的,并以现成的形式送入网络。另外,也可以不给网络提供ma,而是在输入端提供100个滞后的价格(供网络自己计算),在输出端提供系统信号。在这种形式下,网络不能以少于100个滞后期的价格进货。

原始的想法,你越早摆脱它们,你就越早跳出妄想的深渊。你违反了模型准备的主要规则之一。请记住,我们在这里曾经与阿列克谢-维亚泽姆斯基是活跃在奥运会上,所以作为一个感谢的标志,我已经podnakil他的滞后和效果,我很惊讶。我是一个实践者,然后是一个理论家。请允许我引用我通信中的部分内容,其中揭示了滞后的本质

引用。

咳咳,咳咳...有趣的是。好吧,我不烦你了,你对我很好,所以我就告诉你。我是一个实践者,经常偶然发现各种现象,后来我试图在理论上解释这些现象,或者详细研究我发现的效果。但最有趣的部分是得到我问题的答案。所以我们有一个问题。在训练分类器时,如何用历史数据而不是当前数据来装备它。当建立一个基于回归的预测模型时,数据的顺序是非常重要的,也就是说,如果一个训练文件是由历史形成的,那么在任何情况下它们都不应该被调换或混合起来。正是数据的顺序(按照严格的顺序)使预测模型能够看到训练样本的整个历史,正如我所说,训练样本中最开始的数据由于排序而影响到最后的数据。这是从过去到未来,它们永远不应该被混为一谈。记得麦克斯曾经尝试过,但结果令人失望。因为混合不适用于回归。分类则是另一回事,这时需要采用随机混合训练集的方法来避免过度训练。换句话说,我们得到的是对训练质量的真实估计,而不是因为数据被成功洗牌而膨胀的估计。我们轮换10个纪元,洗牌,再次轮换,再次洗牌。在这种情况下,训练向量之间没有联系,基本上每个向量都是独立的。
2020.07.02 22:47
因此,我想知道如何为NS提供不仅是当前信号的指标值,而且是历史数据。最后,我有一个想法。这非常简单。我们在信号出现的那一刻保存指标,然后为当前信号取前一个指标的值,然后为前一个信号取另一个指标,等等。因此,对于当前信号,不仅其指标,而且以前信号的指标也被保存。目前,我采取了24个信号的滞后。也就是说,对于当前的信号,我保存的是24个信号之前的指标值。我记得在论坛上说过,训练文件包含50行7500列,但没有人能够猜到它们是怎么来的。MO地区的问题,我们这里都太聪明了 :-)
2020.07.02 22:52
现在让我们进入正题:
你可能已经注意到,我保存了15个工具的数据,并使用这些数据来建立几个指标。我采取随机函数。我取的是累积标准差,仅此而已。因此,我有307个独特的输入条,是当前信号的主要内容。因此,我把当前信号的这307根柱子,加上之前24个信号的307根柱子,就成了它(信号)。这个法令的意义在于,在信号出现时,立即向国家统计局提交过去24个信号的数据。这是允许分类深入研究当前信号的历史的转变。它本质上是一个滞后于24的深度
2020.07.02 22:59
但我把最有趣的部分留给了最后一段。我相信你已经听说过P的vtreat插件,所以这个野兽通过识别输出变量的有意义的列来进行数据预处理。作为一项规则,在其处理之后,有130-180个真正有意义的列。但矛盾的是,当前信号的指标值极少落入这个样本。非常少。在后期处理的文件中,同样的24个滞后也不是一个不常见的客人。换句话说,24个滞后期之前的指标值对目标函数至关重要。基本上,这个想法就像5戈比一样简单。保存一个相当大的样本,然后将有偏移的列向下乘以一个Excel单元格,并进行后处理。这就是它的利润!


这句话是完整的。

网络不会自己做任何事情。你给它的输入就是你得到的结果。实践证明,并不是所有的滞后都是好的,在你的这套作品中,没有一列能帮助NS以某种方式获得足够的模型.....。好运!!!!!

Документация по MQL5: Константы, перечисления и структуры / Константы объектов / Типы объектов
Документация по MQL5: Константы, перечисления и структуры / Константы объектов / Типы объектов
  • www.mql5.com
При создании графического объекта функцией ObjectCreate() необходимо указать тип создаваемого объекта, который может принимать одно из значений перечисления ENUM_OBJECT. Дальнейшие уточнения свойств созданного объекта возможно с помощью функций по работе с графическими объектами.
 

如果操作正确,该模型的工作原理是这样的:.....


 
Valeriy Yastremskiy:

是的,错了)显然,这都是解析中的故障,或者是读取数据上的故障。

正常化不太可能是方便的。好在我们在终端需要存档的新闻数据,有可能定期加载它们,并有服务来 处理它们。我不认为没有档案)但从创造者的立场来看,直到用户说出他们的话,他们想要什么,它不会开始,如果它开始,首先是付费版本)。

嗯,是的,自由和良好的日历几乎不可能)。

 
Aleksey Nikolayev:

是的,好吧,一个免费的好日历几乎不可能)

是的,你可以做一个坏的日历,长的和准确的)在档案馆)这是一个薄荷服务)关于现在自己的解析)。
 
Mihail Marchukajtes:

谢谢,这很有趣,我不会想到要使用以前的信号。这就提出了一个问题,也许网根本就是一个不必要的环节?

这就是使网络对我感兴趣的原因,这样它就不会夺走标志。否则,做一个经典的系统会更容易。

我将不得不再修补一些实验,我将在Machka系统上采取非常多的例子,这样在训练时就不会有单一的重复,我可以装入一个epoch。