交易中的机器学习:理论、模型、实践和算法交易 - 页 838

 
Mihail Marchukajtes:

一般来说,我使用这个特殊的包来选择预测器。很明显,有一些缺点,特别是缺乏与目标有关的几个预测因素的互动。但总的来说,到目前为止,这对我的优化来说已经足够了...因此,如果有其他的数据预处理软件包,我很乐意考虑它们。

根据我的经验,我可以推荐RandomUniformForest 包,因为它最全面、最专业地处理了预测器重要性的各个方面。 在这里 可以看到一些例子

祝好运

PS:顺便说一下,这是少数几个允许你在新数据上重新训练模型的软件之一。这节省了大量的时间。

 
交易员博士

每周都有一个新的旅游项目。在一个星期内,你必须训练模型并将预测结果发送给他们。但你的模型的前向估计只有在再过三周后才能知道,你的预测将与这三周的真实预测进行比较。

我认为他们至少保留了90%。

你说 "我认为他们至少保留了90%"是什么意思?你认为他们会交易这些寄给他们的预测吗?一般来说,你怎样才能找出征兆,提前计算出预测?通过内插法还是什么?他们在文件中写道,这只是一个 "工作证明",就像挖矿一样,赢家是随机选择的,可能有一半的结果几乎是一样的,然后随机抛出一个过滤器,另外排名,好吧,这是一个可耻的赌场,数据集可能是纯粹的合成,噪音与低信号占比,根本没有市场。所有这些关于对冲基金等的废话,纯粹是为了给他们的硬币赢得人气。

 
马克西姆-德米特里耶夫斯基

那么,米哈伊尔,你从你的狂热中恢复过来了吗?你会很快开始理智地、不狂热地评估你的海啸吗?:)

我没有任何狂犬病。只有冷计算,自上次以来没有任何变化。更不用说方法论了,它仍然有效。有那么一瞬间...

 
govich

具体来说,他们为自己保留了多少东西--这没有正式写出来。各种财经杂志都写到2016年的利润是150万,如果你比较一下其中有多少是支付给参与者的,那就不多。

> 你认为他们会交易这些寄给他们的预测吗?
是的,这就是策略。例如,我将创建一堆功能,创建一个培训电子表格,把它们发送到论坛,10个人将给出他们的预测,我将按他们的预测进行交易--就是这么简单。
他们在很长一段时间内没有自己的加密货币,他们用比特币支付。他们只是在一年内每周拿几千美元的比特币。然后他们发布了自己的加密货币,这样他们就不用和比特币打交道了。

> 你如何事先知道要计算预测的标志?这是一个插曲吗?
插值,通过最近的邻居进行预测,聚类,有很多选择,他们不会告诉你具体的答案,你只能猜测。

 
弗拉基米尔-佩雷文科

根据我的经验,我可以推荐RandomUniformForest 软件包,它是处理预测器重要性的各个方面的最全面和最专业的方法。例子可以 在这里 找到

祝好运

PS:顺便说一下,这是少数几个允许你在新数据上重新训练模型的软件之一。这节省了大量的时间。

试过了。无法得到任何结果。

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300, threads = 2, nodesize = 2)

在5分钟内,它产生了。
OOB.投票中的错误 - Y:不相似的多维矩阵

提交的矩阵的结构。

> str(x1)
num [1:20000,1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 1 1 1 ...。
> str(x2)
num [1:10000, 1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 ...

这并不清楚--与它所要求的相似性是什么。
试过没有xtest = x2, ytest = y2 --同样的结果。
转到下一个包。

 
elibrarius

试过了。没能得到任何结果...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300, threads = 2, nodesize = 2)

5分钟后。
OOB中的错误。

被输入的矩阵的结构。

> str(x1)
num [1:20000,1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 1 1 1 ...。
> str(x2)
num [1:10000,1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 ...

这并不清楚--什么与它所要求的相似性。
试过没有xtest = x2, ytest = y2 --同样的结果。
转到下一个包。

不知道为什么没有用,它对我来说是有效的。

获得了良好的效果。那里有三种预测器选择的功能--它们有不同的效率,消耗不同的计算资源


还有一个非常有趣的软件包--CORElearn。这个软件包包含两个选择预测器的函数,我把它们放在一起使用,它们对我的预测器给出了非常好的结果。特别令人好奇的是attrEval,它有一套绝对奇妙的选择评估方法,其中一个特殊的位置是Relief组,它不仅评估一个观察值(字符串),还评估最近的字符串。


好运。


PS。

不要忘记,预测器的选择至少应包括以下步骤。

  • 选择方式:与目标相关的预测因素。Wizard在这里给出了一个关于这一步的理论链接。可以区分两种方法:统计学和熵。对于这两者,这里有代码
  • 通过列举与未来模型不相关的包进行选择
  • 选择,这是根据模型结果进行的。在线性模型中非常有效。例如,通过glm,我们只选择有意义的预测因子,然后只将它们纳入网络。其结果可能令人惊讶。


在选择预测器之前,可能需要进行预处理,例如居中处理。弗拉基米尔-佩雷文科的 文章中对其进行了详细描述

 
elibrarius

试过了。没能得到任何结果...

> ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 1, ntree = 300, threads = 2, nodesize = 2)

5分钟后。
OOB中的错误。

被输入的矩阵的结构。

> str(x1)
num [1:20000,1:9] 0.00148 0.33309 0.46698 0.26331 -0.05916 ...
> str(y1)
num [1:20000, 1] 0 0 0 0 0 0 1 1 1 ...。
> str(x2)
num [1:10000,1:9] 0.000746 0.162699 0.379051 -0.529729 -0.340744 ...
> str(y2)
num [1:10000, 1] 0 0 1 1 0 0 0 0 ...

这并不清楚--什么与它所要求的相似性。
试过没有xtest = x2, ytest = y2 --同样的结果。
转到下一个包。

你能公布原始的套装吗?

你需要说明这不是一个回归,因为你的目标不是一个因素。添加参数

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300, threads = 2, nodesize = 2, regression = FALSE)

ruf <- randomUniformForest( X = x1, Y = y1 %>% as. factor, xtest = x2, ytest = y2 %>% as. factor, mtry = 3,

ntree = 300, threads = 2, nodesize = 2)

祝好运

 
桑桑尼茨-弗门科

还有一个非常有趣的软件包:CORElearn。该软件包中有两个用于选择预测器的函数,我把它们配对使用,它们在我的预测器上给出了非常好的结果。特别令人好奇的是attrEval,它有一套绝对奇妙的选择评估方法,其中一个特殊的位置是Relief组,它不仅评估一个观察值(字符串),还评估最近的字符串。


同意。原则上,这可能是最严重的射频包。你应该关注开发者马尔科-罗布尼克-西科尼亚

祝好运

 
弗拉基米尔-佩雷文科

你能公布原始的套装吗?

你需要说明这不是一个回归,因为你的目标不是一个因素。添加参数

ruf <- randomUniformForest( X = x1,Y = y1,xtest = x2, ytest = y2,mtry = 3, ntree = 300, threads = 2, nodesize = 2, regression = FALSE)

ruf <- randomUniformForest( X = x1, Y = y1 %>% as. factor, xtest = x2, ytest = y2 %>% as. factor, mtry = 3,

ntree = 300, threads = 2, nodesize = 2)

祝好运

这很有帮助。谢谢你!
 
交易员博士

具体来说,他们为自己保留多少钱并没有正式写下来。各种金融杂志在2016年写了150万的利润,如果你比较一下其中有多少是支付给参与者的,这并不多。

> 你认为他们会交易这些寄给他们的预测吗?
是的,这就是整个战略。例如,我将创建一堆功能,创建一个培训电子表格,将它们发送到论坛,10个人将给出他们的预测,我将按他们的预测进行交易 - 一切都很简单。
他们在很长一段时间内没有自己的加密货币,他们用比特币支付。他们只是在一年内每周拿几千美元的比特币。然后他们发布了自己的加密货币,这样他们就不用和比特币打交道了。

> 你如何提前知道你可以计算出预测的标志?这是一个插曲吗?
如果你不知道确切的答案,你只能猜测。

150万美元是几分钱,就像Entire Kantor一样,我听说当时他们把他们的加密货币放在交易所时,一些参与者(谁在上面)即使不拿几百万美元,也会拿几十万美元,你可以得到一次第一名和4000NMR,每个硬币200美元=800.000k$,但这个球很快就用完了,NMR崩溃了,开始少给硬币,但也许有人幸运。

IMHO我认为一开始他们可能试图交易预测,甚至有的地方或多或少都有预测,可能90%的钱都是他们自己付的,前一百名中大部分可能是他们的公子哥,钱没有泄露给谁知道。但现在它是一个纯粹的赌场,有 "工作证明 "和大量的随机性,这至少是传言。


PS:在他们的硬币之前,他们曾经每周支付6千美元(但给谁呢?),也就是说,每年288千美元只是 "诚实的"~20%的利润给了数量主义者))。但显然,所有这些数字,都是可以捏造的。

原因: