交易中的机器学习:理论、模型、实践和算法交易 - 页 385

 
马克西姆-德米特里耶夫斯基


他们做这种工作吗? 我知道这是一个对冲基金,如果你注册了,它将做什么?

我正在用不同的模型运行,到目前为止,与你一样得到了0.5

好吧,0.5和0.513是不同的,当然对交易来说不是那么重要,但仍然是。他们称自己为对冲基金,我不知道他们的法律结构是什么,在美国似乎没有这种正式的组织类型,但我可能是错的。如果你注册,你可以提前一周参与预测市场,在这样的数据集上,有人设法在上面筹集到>1万美元,但我个人知道那些人只赚了几百英镑)))。
 
阿利奥沙
好吧,0.5和0.513是不同的,当然这对交易来说是不多的,但仍然是。他们称自己为对冲基金,我不知道他们的法律结构是什么,在美国没有这种类型的正式组织,但我可能是错的。如果你注册,你可以提前一周参与预测市场,在这样的数据集上,有人设法在上面筹集到>1万美元,但我个人知道那些人只赚了几百英镑)))。


那么,它是如何工作的呢? 他们抛出数据集,我必须在上面训练网络,然后呢?)

https://docs.microsoft.com/ru-ru/azure/machine-learning/machine-learning-data-science-select-features

Выбор признаков в процессе обработки и анализа данных группы
Выбор признаков в процессе обработки и анализа данных группы
  • 2017.03.24
  • bradsev
  • docs.microsoft.com
В этой статье описаны цели выбора характеристик и приводятся примеры, поясняющие его роль в совершенствовании данных в процессе машинного обучения. Эти примеры взяты из Студии машинного обучения Azure. Реконструирование признаков: этот процесс направлен на создание дополнительных признаков на основе соответствующих существующих необработанных...
 
马克西姆-德米特里耶夫斯基


他们抛出一个数据集,我必须在上面训练网络,然后呢? 我认为它有一个技巧,我需要进行特征选择。)

https://docs.microsoft.com/ru-ru/azure/machine-learning/machine-learning-data-science-select-features

登录并阅读车把式,它们有半页长。只要下载这套软件,教它,在一个测试中运行,然后发给他们,有一个例子说明结果应该是什么样的,所以id和列名应该和他们的一样。
 
阿利奥沙
注册并阅读卷宗,那里有半页纸。只要下载这套软件,学习它,在一个测试中运行,然后发送给他们,有一个例子说明结果应该是怎样的,所以id和列名应该和他们的一样。

是的,我稍后会尝试......总之,这个数据集是没有希望的,没有模式 )
 

numerai今年已经改变了好几次规则。

它曾经是简单而好的--在训练表上训练一个模型,在测试表上检查误差,把预测结果发给他们,他们把预测结果推算到他们隐藏的测试表上,计算其误差。谁在隐藏表上的错误少,谁就赢了。这是非常好的,也是正确的,测试数据集上的错误确实与他们的隐藏数据集上的错误相吻合,所以你可以检查你的模型。

然后他们改变了一些东西,测试数据集上的错误不再与他们隐藏的检查数据集上的错误相关。所有来自高层的领导人都消失了,只是随机的人幸运地把他们的模型弄到了他们的隐藏检查表中,赢得了胜利。我认为这是Numerai的失败之处,是一些随意的垃圾,而不是一场比赛。

然后他们看到所有足够的人都从他们的随机竞赛中脱身,意识到他们的错误,并改变了一些东西。现在根据几个标准对预测进行评估。最让我生气的标准是 "独特性",如果有人以前发过类似的结果,那么你的结果就会被当作剽窃而被拒绝。也就是说,如果有几个人使用同一个框架来创建模型,那么早起并发送预测的人将得到钱。
在计算利润时,模型的准确性现在完全没有用。你可以得到错误0,排在第一名的位置,却什么也赚不到,因为第一名显示的是他们给自己下载的测试数据上的结果,第一名不再显示他们隐藏的检查表的结果。
目前他们的比赛的迭代是无稽之谈,没有透明度,一切都乱套了。等待着他们再次改变比赛中的一些东西,希望它能再次充分。

 
马克西姆-德米特里耶夫斯基

是的,我以后会试一下......总之这个数据集没有希望,没有模式)
试试这个表格。只对那些data_type=="validation "的行进行模型训练。这是用来评估模型和进入顶部的数据。如果你达到100%的准确率,你将在顶部的第一个位置。但你不会因为这样的作弊行为而得到现金奖励。
附加的文件:
 
交易员博士
试试这个表格。只对那些data_type=="validation "的行进行模型训练。这是用来评估模型和进入顶层的数据。如果你达到100%的准确率,你将在顶部的第一个位置。但是他们不会因为这个作弊行为而给你现金奖励。

哦,好的,我明天试试......很好的练习机会 )
 
交易员博士
试试这个表格。只对那些data_type=="validation "的行进行模型训练。这是用来评估模型和进入顶层的数据。如果你达到100%的准确率,你将在顶部的第一个位置。但你不会因为这样的作弊行为而得到金钱奖励。


又是0.5



 

了解训练和评估数据集上的结果是如何重合的,这一点很重要。我看到那里有一个分割的数据集,按照逻辑(也许我错了),数据被随机分成两组,第一组由模型训练,第二组只由模型预测和评估。

如果你预测它所训练的同样的数据,结果会是什么?
然后预测它没有被训练过的数据,并比较两种情况下模型的准确性。

如果在训练过的数据上,它的预测准确率是100%,而在估计的数据上--50%--那么这个模型就过度训练了,它很糟糕。

 
交易员博士

了解训练和评估数据集上的结果是如何重合的,这一点很重要。我看到那里有一个分割的数据集,按照逻辑(也许我错了),数据被随机分成两组,第一组由模型训练,第二组只由模型预测和评估。

如果我预测用于训练的相同数据,结果会是怎样?
然后预测没有用于训练的数据,比较两种情况下的模型准确性。

如果在训练过的数据上,它的预测准确率是100%,而在估计的数据上--50%--那么这个模型就太过训练了,它很糟糕。


我也学会了50%的预测。 我去掉了分割日期,并提交了同一组的测试。

那么首先这个集合非常大,其次我们不知道特征的性质,像向量和森林这样的线性模型显然不适合这里,我们需要做一个复杂的非网格,也许这就是原因。我仍然不确定如何在这个工作室里修改神经网络,使其更加复杂,例如卷积,以尝试做

从这个:https://gallery.cortanaintelligence.com/Experiment/Neural-Network-Convolution-and-pooling-deep-net-2

我仍然是网格方面的新手 ...)

原因: