交易中的机器学习：理论、模型、实践和算法交易

Vladimir Perervenko 2018.04.11 21:41 #8371

Mihail Marchukajtes:

一般来说，我使用这个特殊的包来选择预测器。很明显，有一些缺点，特别是缺乏与目标有关的几个预测因素的互动。但总的来说，到目前为止，这对我的优化来说已经足够了...因此，如果有其他的数据预处理软件包，我很乐意考虑它们。

根据我的经验，我可以推荐RandomUniformForest 包，因为它最全面、最专业地处理了预测器重要性的各个方面。在这里可以看到一些例子

祝好运

PS：顺便说一下，这是少数几个允许你在新数据上重新训练模型的软件之一。这节省了大量的时间。

govich 2018.04.11 22:26 #8372

交易员博士。

每周都有一个新的旅游项目。在一个星期内，你必须训练模型并将预测结果发送给他们。但你的模型的前向估计只有在再过三周后才能知道，你的预测将与这三周的真实预测进行比较。

我认为他们至少保留了90%。

你说 "我认为他们至少保留了90%"是什么意思？你认为他们会交易这些寄给他们的预测吗？一般来说，你怎样才能找出征兆，提前计算出预测？通过内插法还是什么？他们在文件中写道，这只是一个 "工作证明"，就像挖矿一样，赢家是随机选择的，可能有一半的结果几乎是一样的，然后随机抛出一个过滤器，另外排名，好吧，这是一个可耻的赌场，数据集可能是纯粹的合成，噪音与低信号占比，根本没有市场。所有这些关于对冲基金等的废话，纯粹是为了给他们的硬币赢得人气。

Mihail Marchukajtes 2018.04.12 03:17 #8373

马克西姆-德米特里耶夫斯基。

那么，米哈伊尔，你从你的狂热中恢复过来了吗？你会很快开始理智地、不狂热地评估你的海啸吗？:)

我没有任何狂犬病。只有冷计算，自上次以来没有任何变化。更不用说方法论了，它仍然有效。有那么一瞬间...

Dr. Trader 2018.04.12 03:38 #8374

govich。

具体来说，他们为自己保留了多少东西--这没有正式写出来。各种财经杂志都写到2016年的利润是150万，如果你比较一下其中有多少是支付给参与者的，那就不多。

> 你认为他们会交易这些寄给他们的预测吗？
是的，这就是策略。例如，我将创建一堆功能，创建一个培训电子表格，把它们发送到论坛，10个人将给出他们的预测，我将按他们的预测进行交易--就是这么简单。
他们在很长一段时间内没有自己的加密货币，他们用比特币支付。他们只是在一年内每周拿几千美元的比特币。然后他们发布了自己的加密货币，这样他们就不用和比特币打交道了。

> 你如何事先知道要计算预测的标志？这是一个插曲吗？
插值，通过最近的邻居进行预测，聚类，有很多选择，他们不会告诉你具体的答案，你只能猜测。

Aleksei Kuznetsov 2018.04.12 12:58 #8375

弗拉基米尔-佩雷文科。

根据我的经验，我可以推荐RandomUniformForest 软件包，它是处理预测器重要性的各个方面的最全面和最专业的方法。例子可以在这里找到

祝好运

PS：顺便说一下，这是少数几个允许你在新数据上重新训练模型的软件之一。这节省了大量的时间。

试过了。无法得到任何结果。

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300, threads = 2, nodesize = 2)

在5分钟内，它产生了。
OOB.投票中的错误 - Y：不相似的多维矩阵

提交的矩阵的结构。

> str(x1)
num [1：20000，1：9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 1 1 1 ...。
> str(x2)
num [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 ...

这并不清楚--与它所要求的相似性是什么。
试过没有xtest = x2, ytest = y2 --同样的结果。
转到下一个包。

Machine learning in trading: 机器学习模型的变量评估和选择深度神经网络 (第七部分)。神经网络的融合: 堆叠

СанСаныч Фоменко 2018.04.12 13:25 #8376

elibrarius。

试过了。没能得到任何结果...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300, threads = 2, nodesize = 2)

5分钟后。
OOB中的错误。

被输入的矩阵的结构。

> str(x1)
num [1：20000，1：9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 1 1 1 ...。
> str(x2)
num [1：10000，1：9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 ...

这并不清楚--什么与它所要求的相似性。
试过没有xtest = x2, ytest = y2 --同样的结果。
转到下一个包。

不知道为什么没有用，它对我来说是有效的。

获得了良好的效果。那里有三种预测器选择的功能--它们有不同的效率，消耗不同的计算资源。

还有一个非常有趣的软件包--CORElearn。这个软件包包含两个选择预测器的函数，我把它们放在一起使用，它们对我的预测器给出了非常好的结果。特别令人好奇的是attrEval，它有一套绝对奇妙的选择评估方法，其中一个特殊的位置是Relief组，它不仅评估一个观察值（字符串），还评估最近的字符串。

好运。

PS。

不要忘记，预测器的选择至少应包括以下步骤。

选择方式：与目标相关的预测因素。Wizard在这里给出了一个关于这一步的理论链接。可以区分两种方法：统计学和熵。对于这两者，这里有代码
通过列举与未来模型不相关的包进行选择
选择，这是根据模型结果进行的。在线性模型中非常有效。例如，通过glm，我们只选择有意义的预测因子，然后只将它们纳入网络。其结果可能令人惊讶。

在选择预测器之前，可能需要进行预处理，例如居中处理。弗拉基米尔-佩雷文科的 文章中对其进行了详细描述

Vladimir Perervenko 2018.04.12 13:28 #8377

elibrarius。

试过了。没能得到任何结果...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300, threads = 2, nodesize = 2)

5分钟后。
OOB中的错误。

被输入的矩阵的结构。

> str(x1)
num [1：20000，1：9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 1 1 1 ...。
> str(x2)
num [1：10000，1：9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 ...

这并不清楚--什么与它所要求的相似性。
试过没有xtest = x2, ytest = y2 --同样的结果。
转到下一个包。

你能公布原始的套装吗？

你需要说明这不是一个回归，因为你的目标不是一个因素。添加参数

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300, threads = 2, nodesize = 2, regression = FALSE)

或

ruf <- randomUniformForest( X = x1, Y = y1 %>% as. factor, xtest = x2, ytest = y2 %>% as. factor, mtry = 3,

ntree = 300, threads = 2, nodesize = 2)

祝好运

Vladimir Perervenko 2018.04.12 13:48 #8378

桑桑尼茨-弗门科。

还有一个非常有趣的软件包：CORElearn。该软件包中有两个用于选择预测器的函数，我把它们配对使用，它们在我的预测器上给出了非常好的结果。特别令人好奇的是attrEval，它有一套绝对奇妙的选择评估方法，其中一个特殊的位置是Relief组，它不仅评估一个观察值（字符串），还评估最近的字符串。

同意。原则上，这可能是最严重的射频包。你应该关注开发者马尔科-罗布尼克-西科尼亚。

祝好运

Aleksei Kuznetsov 2018.04.12 14:02 #8379

弗拉基米尔-佩雷文科。

你能公布原始的套装吗？

你需要说明这不是一个回归，因为你的目标不是一个因素。添加参数

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300, threads = 2, nodesize = 2, regression = FALSE)

或

ruf <- randomUniformForest( X = x1, Y = y1 %>% as. factor, xtest = x2, ytest = y2 %>% as. factor, mtry = 3,

ntree = 300, threads = 2, nodesize = 2)

祝好运

这很有帮助。谢谢你!

govich 2018.04.12 15:24 #8380

交易员博士。

具体来说，他们为自己保留多少钱并没有正式写下来。各种金融杂志在2016年写了150万的利润，如果你比较一下其中有多少是支付给参与者的，这并不多。

> 你认为他们会交易这些寄给他们的预测吗？
是的，这就是整个战略。例如，我将创建一堆功能，创建一个培训电子表格，将它们发送到论坛，10个人将给出他们的预测，我将按他们的预测进行交易 - 一切都很简单。
他们在很长一段时间内没有自己的加密货币，他们用比特币支付。他们只是在一年内每周拿几千美元的比特币。然后他们发布了自己的加密货币，这样他们就不用和比特币打交道了。

> 你如何提前知道你可以计算出预测的标志？这是一个插曲吗？
如果你不知道确切的答案，你只能猜测。

150万美元是几分钱，就像Entire Kantor一样，我听说当时他们把他们的加密货币放在交易所时，一些参与者（谁在上面）即使不拿几百万美元，也会拿几十万美元，你可以得到一次第一名和4000NMR，每个硬币200美元=800.000k$，但这个球很快就用完了，NMR崩溃了，开始少给硬币，但也许有人幸运。

IMHO我认为一开始他们可能试图交易预测，甚至有的地方或多或少都有预测，可能90%的钱都是他们自己付的，前一百名中大部分可能是他们的公子哥，钱没有泄露给谁知道。但现在它是一个纯粹的赌场，有 "工作证明 "和大量的随机性，这至少是传言。

PS：在他们的硬币之前，他们曾经每周支付6千美元（但给谁呢？），也就是说，每年288千美元只是 "诚实的"~20%的利润给了数量主义者））。但显然，所有这些数字，都是可以捏造的。

交易中的机器学习：理论、模型、实践和算法交易 - 页 838