交易中的机器学习:理论、模型、实践和算法交易 - 页 1016

 
桑桑尼茨-弗门科

我带来这个链接是因为这个表格:对预测因素的重新审视,也是对亚历山大关于ACF思想的发展。

新鲜,你是认真的吗? 老得像......猛犸象。它如何比傅里叶或其他分解或自回归系数及其值或过滤器更好?

这一切都不起作用。

 
马克西姆-德米特里耶夫斯基

新鲜,你是认真的吗? 老得像......猛犸象。它如何比傅里叶或其他分解或自回归系数及其值或过滤器更好?

这一切都不起作用。

这条线的新鲜度。

那么,你都试过什么?

到底是什么?为了什么目标?

 
桑桑尼茨-弗门科

本支部的新鲜事。

那么,你都试过什么?

具体是什么?为了哪个目标?

我尝试了不同的分解,自回归(与acf没有区别),同时也尝试了系数。

在相关度很高的序列上工作(把第二行作为一个夹具,例如在工具之间建立一个VAR,把它作为一个预测器并训练模型)。嗯,它是有效的--只要相关关系没有被打破。

在第一种仪器上,它的工作方式与其他许多预测器相同,都是超拟合。自动选择目标的。

 
伊万-内格雷什尼

谢谢,我对会员资格不感兴趣,我知道这涉及到重大的困难,但要看一下水平,这可能是不小的困难。

"会员 "是正确的)))任何会员通常都是偶然认识和/或巧合的结果,有一些先进的家伙在即兴发挥他们的 "库克卢斯克兰 "的文化和仪式,我在那里只呆了几个月,直到我学到了非常有价值的东西。但事实上,这个生态系统至少是相对封闭的,这对这种讨论和交流他们的算法基础设施的备件来说是一个很大的好处。我不认为这样的欺凌会持续很久,我需要寻找类似的团体,不至于让Geks如此羞愧。

你写道,这个小组正在研究国防部模型的统一表述,这些是我希望看到的模型。

是的,这样的想法被大声说出来了,而且不仅是在那里,我顺便听说了,在精英交易员的发言中回忆,也许在这里听到了类似的东西,我提议私下讨论,如果你想建立一个共享模型的格式,我也有关于这个问题的想法,事实上每个编码者都知道如何做他们自己的方式,只是一个标准问题,像fullstack C++ dll-grall模式,接受原始数据并输出预测,以及从Sharp的Peyton中插入几行代码,等等谁在乎在哪里。

为了比较,因为准备展示他们的,适度的发展,我训练的模型以二进制或文本格式和源代码的形式进行序列化。

主要的想法是利用退出战略的机制。

 

振亚

你写道,在这个小组中,正在考虑统一表述国防部的模型,这些是我希望看到的模型。

是的,这样的想法被大声说出来了,顺便说一下,不仅在那里我听说过,在elit-trader我记得,也许在这里我听到了类似的事情,如果你愿意,我建议私下讨论我们如何调整模型交流的格式,我也有关于这个问题的想法,事实上每个编码员都知道。如何用自己的方式做,只是一个标准问题,像fullstack C++的dll-grall模式,接受原始数据并输出预测,以及从Sharp的Peyton插入几行代码,等等。谁在乎在哪里。

例如,有PMML。

https://ru.wikipedia.org/wiki/Язык_разметки_прогнозного_моделирования

有一个R库(也叫pmml)可以把大多数流行的模型转换成这种格式。

有可能。
1)像往常一样在R中训练模型
2) 将模型转换为pmml
3) 将pmml模型保存为一个xml文件,并分享它

前段时间,我想为mql做一个脚本,它可以读取带有pmml模型的xml文件,在这种情况下,我可以用几行代码(包括脚本+pmml作为资源)将经过训练的gbm从r中做出的预测嵌入EA。但我还没来得及做。


如果你想对模型本身保密,这是不合适的,因为在xml文件中会有神经元或森林分支的规定权重。

对于模型安排的完全保密,你可以使用一个数据科学家竞赛的想法--他们需要一个上面有数十万个预测的文件。从那里,他们可以使用这个文件对预测进行插值,以获得现有预测旁边的预测。

 
交易员博士

例如,有PMML。

https://ru.wikipedia.org/wiki/Язык_разметки_прогнозного_моделирования

有一个R库(也叫pmml),可以将大多数流行的模型转换为这种格式。

你可以这样做。
1)像往常一样在R中训练模型
2) 将模型转换为pmml
3) 将pmml模型保存为一个xml文件,并分享它

前段时间,我想为mql做一个脚本,它可以读取带有pmml模型的xml文件,然后我就可以用几行代码把从r训练出来的gbm预测嵌入到EA中(包括脚本+pmml作为资源)。但我还没来得及做。

如果你想对模型本身保密,那就不适合了,因为在xml文件中会有神经元或森林分支的规定权重。

不幸的是,保密是这里的一个主要要求))))。这是关于由C++模型混淆的交换协议,在输入和输出预测时采取原始数据,所以你可以采取一个模型,并对其输入和输出进行描述,使用它例如一个月或多长时间,它的设计没有修改(额外的训练等),并得出结论(购买,租赁等)。

最好只是一个有文件的文件夹,不同的二进制,在其中了解细节是不划算的。

对于模型设备的完全保密,你可以使用数据科学家竞赛的一个想法--他们需要一个有数十万个预测的文件。从那里,他们可以使用这个文件对预测进行插值,以获得现有预测旁边的预测。

如果你指的是numerai,那么他们的方法是行不通的,在这种情况下,他们所说的 "模型 "指的是将原始数据转化为预测的全部过程,首先它是标志,numerai有一个学生竞赛来推销他们的硬币(NMR),它不可能与真实市场有某种联系,对冲基金最不需要的就是将纯分类外包。如果你说的是另一场比赛,那么请告诉我。

 
谁能说说MO在非平稳序列中的这种使用:组合模型?引入一些额外的参数,对应于过程的状态,模型参数取决于这些参数。这个参数也是预测的。该方法在文章中被用于预测温度。当然,模型的这种复杂化充满了过度拟合,但至少我们可以以某种方式处理非平稳性问题。
 

是的。

他们的方式并非没有道理。我试着用我的模型来预测数十万个随机实例。然后对于黑箱预测,我在坐标中寻找最接近的点,并将其结果作为预测本身。这个原型是有效的,但我可以在实际中加以改进--找到3个最接近的点,并对平均结果进行三角测量。但这在计算上是很昂贵的,即使是用opencl小工具,也可能需要几秒钟来进行预测。

 
Aleksey Nikolayev:
引入了一些额外的参数,对应于过程的状态,模型参数取决于这些参数。这个参数也是预测的。

它与RNN(递归神经网络)中的记忆非常相似

预测器和另外一个值(记忆)被送入模型。该模型在预测中产生两个数字--目标本身,以及一个新的记忆值,将在下一次预测中与预测器一起使用。这就是为什么它是一个循环网络,它的输出将被用作下一次的输入,以此类推,每次都是一个循环。

外汇中的RNN是非常过度喂养的,这很糟糕,你不能通过教科书和认沽交易来做所有事情。
但对于一个只有几个参数的模型来说,它有相当好的准确性,可与一个有大隐层的正常神经元相媲美,这仍然让我感到惊讶。

 
交易员博士

这与RNN(递归神经网络)的记忆非常相似。

预测器和另一个值(记忆)被送入模型的输入。该模型在预测中输出两个数字--目标本身,以及一个新的内存值,在下一次预测中与预测器一起使用。这就是为什么它是一个递归网络,它的输出将被用作下一次的输入,以此类推,每次都是一个循环。

外汇中的RNN是非常过度喂养的,这很糟糕,你不能按照教科书上的方法做所有的事情,把交易。
但对于一个只有几个参数的模型来说,它有相当好的准确性,可与一个有大隐层的普通神经元相媲美,这仍然让我感到惊讶。

谢谢你,它看起来真的很像。