交易中的机器学习:理论、模型、实践和算法交易 - 页 387

 
交易员博士

那么这些钱可以提取吗?
 
交易员博士

而不是一种赚钱的方式。

如果你想赚钱,numerae已经有点推出了他们自己的加密货币。它的持有人有点有机会间接参与投资。

我不能说更多的细节,我想把它找出来,但我不能这样做。

 
交易员博士

有趣的是,验证数据上的logloss 0.690 - 0.691在新数据上几乎都显示出良好的结果,我不知道这是什么原因。

最有可能的是不贪心,没有过度复杂的模型,因此没有过度拟合,虽然有像一个家伙在一些巡回赛中的~0.65,在现场~0.68+。

我更困惑的是在他们的数据中混入了样本,"时代 "与未知的ID无法重现他们对过去巡演的计算结果。所以我不知道训练集里到底有什么,如果能把上几轮的LIVE样本摆出来就好了,这样就可以为这个测试数据集训练一个模型,至少可以了解为什么会有这么大的差别。IMHO,这就像他们从很久以前就开始积累积分,然后随机发放子集作为火车,ID并不反映数据集积累的时间顺序,然后活的积分,需要先锋队,并没有单独给予修正模型,得到一个 "天上的手指 "在野外戳,偶然。

我希望他们能解决这个问题 :)

[删除]  
谁能证实使用随机森林 进行二元分类比较好?在一般情况下,还是有可能在特殊情况下选取一个神经网络,使其误差稍小?


 
pantural
那么这些钱可以提取吗?

是的,以目前的汇率即时提取比特币。


组合器

如果你想赚钱,numerae已经算是发布了他们自己的加密货币。它的持有人有点有机会间接地参与投资。

我不会说更多的细节,我想把它找出来,但我找不到它。

是的,现在他们把他们的加密货币和美元一起送给赢家。例如,我有300个NMR(Numeraire),但他们现在不能提取它们或用它们做什么。总的来说,他们真的没有开始周转,到目前为止,他们只把它送出去。

NMR本身是以太坊加密代币(https://github.com/ethereum/EIPs/issues/20),投资他们提供的东西也是基于以太坊的可能性。更确切地说,它甚至不是一项投资,而是一个把钱放在你的预测上的机会。你上传你的预测,在NMR中下注,然后以太坊中的算法及时定义赢家并发放奖金(https://numer.ai/whitepaper.pdf)。赌场,简而言之。


马克西姆-德米特里耶夫斯基
有人能确认,使用随机森林进行二元分类比较好吗?在一般情况下,还是在特殊情况下,我可以选择神经元网,这样可以减少一点误差?
在这里发表的文章中,我读到分类的世界是由梯度分档(特殊的一种森林)统治的,例如在R包gbm中。
 
交易员博士

是的,以目前的汇率即时提取比特币。

嗯......奇怪。

问题是,为什么美国的对冲基金,在文艺复兴叔叔的赞助下,有点像地球上最酷的量子,工资在20-30万,还有六位数的奖金,这些谓语来自ML 爱好者 世界(俄罗斯、印度、中国......),价格相当于整个人群(>300人)的一个普通莫斯科程序员的工资 ?????

仿佛他们没有自己的量化指标来做这件事?或者哈佛大学的量化师不想做,他们只与投资者沟通,并将模型外包给....。

嗯......他们怎么能不为这种缺乏远见的行为付出代价......

[删除]  
交易员博士


我在这里发表的文章中看到,分类的世界是由梯度提升(一种特殊的森林)来统治的,例如在R包gbm。

他们说他们也是过量的......但我要读更多......总之,比MLP好。顺便说一下,在工作室中,提升的决策树比简单的决策树的误差略差。
 
马克西姆-德米特里耶夫斯基

他们说他们也喂得太多了......但我要看看......至少比MLP好。顺便说一下,提升的决策树比简单的决策树在以下方面产生的误差要差一些。


ada比Randomforest要好一点。但caret与ada有一些摩擦(不记得是哪个了),所以不值得麻烦。

最有希望的是预测器的选择。这都是我们的。

这条线使用了大量的预测器,但都是从单一货币对中得出的。

为什么是一对而不是很多?

为什么是货币对而不是预测器?

而宏观经济数据去哪儿了?


到目前为止,我在新文件上的错误率只有不到30%。20%是不可能通过任何技巧实现的,替换模型也是无济于事的。

但我没有力量去尝试回答上述问题。

[删除]  
桑桑尼茨-弗门科


Ada比Randomforest略好。但在caret中,有一些与ada有关的有趣的东西(我不记得是哪些了),所以不值得麻烦。

最有希望的是预测器的选择。它们都是我们的。

这条线使用了大量的预测器,但都是从单一货币对中得出的。

为什么是一对而不是很多?

为什么是货币对而不是预测器?

而宏观经济数据去哪儿了?


到目前为止,我在新文件上的错误率只有不到30%。20%是不可能通过任何伎俩实现的,替换模型也没有任何结果。

但我没有力量去尝试回答上述问题。


我已经有了预测器,奇怪的是。我有一个准备好的机器人,它站在真实的位置上,我在不到一个月的时间里写了它。最重要的是--预测者,它是没有问题的。例如,以我发炎的想象力,预测者可以在短时间内被选中,我已经做了5年的分析员工作了:)我认为选择预测器并不像研究NS架构那样困难,主要是坐下来选一个,需要2-3周时间 :)

特别是,现在最后流行的是LSTM,它们对计算能力要求很高,但给出的结果却很厉害。我现在正考虑买一台强大的游戏电脑,至少要用显卡计算,最多是用NVidia tesla。

从ns小编的经验来看--他们需要重新接受自动培训,或者要重新培训,这是一个强制性的过程。使用GA为NS选择相同预测器的参数也是必须的。所有这些都需要力量,但这确实值得。我们已经有了一些考虑到这三个组成部分的人工智能的雏形。过度训练+遗传学+力量

 

桑桑尼茨-弗门科

到今天为止,我在新文件中的错误率仅为30%以下。20%是不可能通过任何技巧实现的,替换模型会导致一无所获。

即使是HFT也有很高的结果,你能不能检查一下csv中的数据集,它给出了这样的结果,我想确保它没有过度拟合。

从高和远有时呼应,甚至文艺复兴分钟预测准确率不超过65-70%,鉴于他们是由数以千计的难以想象的功能,包括从卫星图像处理和世界各地的特大城市的城市基础设施活动的数据,所有做自然和地球上的人群 - 数据的训练。