交易中的机器学习：理论、模型、实践和算法交易

Алёша 2017.06.05 17:55 #3841

马克西姆-德米特里耶夫斯基。

他们做这种工作吗？我知道这是一个对冲基金，如果你注册了，它将做什么？

我正在用不同的模型运行，到目前为止，与你一样得到了0.5

好吧，0.5和0.513是不同的，当然对交易来说不是那么重要，但仍然是。他们称自己为对冲基金，我不知道他们的法律结构是什么，在美国似乎没有这种正式的组织类型，但我可能是错的。如果你注册，你可以提前一周参与预测市场，在这样的数据集上，有人设法在上面筹集到>1万美元，但我个人知道那些人只赚了几百英镑）））。

[删除] 2017.06.05 18:00 #3842

阿利奥沙。
好吧，0.5和0.513是不同的，当然这对交易来说是不多的，但仍然是。他们称自己为对冲基金，我不知道他们的法律结构是什么，在美国没有这种类型的正式组织，但我可能是错的。如果你注册，你可以提前一周参与预测市场，在这样的数据集上，有人设法在上面筹集到>1万美元，但我个人知道那些人只赚了几百英镑）））。

那么，它是如何工作的呢？他们抛出数据集，我必须在上面训练网络，然后呢？）

https://docs.microsoft.com/ru-ru/azure/machine-learning/machine-learning-data-science-select-features

Выбор признаков в процессе обработки и анализа данных группы

2017.03.24
bradsev
docs.microsoft.com

В этой статье описаны цели выбора характеристик и приводятся примеры, поясняющие его роль в совершенствовании данных в процессе машинного обучения. Эти примеры взяты из Студии машинного обучения Azure. Реконструирование признаков: этот процесс направлен на создание дополнительных признаков на основе соответствующих существующих необработанных...

Алёша 2017.06.05 18:17 #3843

马克西姆-德米特里耶夫斯基。

他们抛出一个数据集，我必须在上面训练网络，然后呢？我认为它有一个技巧，我需要进行特征选择。）

https://docs.microsoft.com/ru-ru/azure/machine-learning/machine-learning-data-science-select-features

登录并阅读车把式，它们有半页长。只要下载这套软件，教它，在一个测试中运行，然后发给他们，有一个例子说明结果应该是什么样的，所以id和列名应该和他们的一样。

[删除] 2017.06.05 18:47 #3844

阿利奥沙。
注册并阅读卷宗，那里有半页纸。只要下载这套软件，学习它，在一个测试中运行，然后发送给他们，有一个例子说明结果应该是怎样的，所以id和列名应该和他们的一样。

是的，我稍后会尝试......总之，这个数据集是没有希望的，没有模式 )

Dr. Trader 2017.06.05 19:10 #3845

numerai今年已经改变了好几次规则。

它曾经是简单而好的--在训练表上训练一个模型，在测试表上检查误差，把预测结果发给他们，他们把预测结果推算到他们隐藏的测试表上，计算其误差。谁在隐藏表上的错误少，谁就赢了。这是非常好的，也是正确的，测试数据集上的错误确实与他们的隐藏数据集上的错误相吻合，所以你可以检查你的模型。

然后他们改变了一些东西，测试数据集上的错误不再与他们隐藏的检查数据集上的错误相关。所有来自高层的领导人都消失了，只是随机的人幸运地把他们的模型弄到了他们的隐藏检查表中，赢得了胜利。我认为这是Numerai的失败之处，是一些随意的垃圾，而不是一场比赛。

然后他们看到所有足够的人都从他们的随机竞赛中脱身，意识到他们的错误，并改变了一些东西。现在根据几个标准对预测进行评估。最让我生气的标准是 "独特性"，如果有人以前发过类似的结果，那么你的结果就会被当作剽窃而被拒绝。也就是说，如果有几个人使用同一个框架来创建模型，那么早起并发送预测的人将得到钱。
在计算利润时，模型的准确性现在完全没有用。你可以得到错误0，排在第一名的位置，却什么也赚不到，因为第一名显示的是他们给自己下载的测试数据上的结果，第一名不再显示他们隐藏的检查表的结果。
目前他们的比赛的迭代是无稽之谈，没有透明度，一切都乱套了。等待着他们再次改变比赛中的一些东西，希望它能再次充分。

Dr. Trader 2017.06.05 19:16 #3846

马克西姆-德米特里耶夫斯基。

是的，我以后会试一下......总之这个数据集没有希望，没有模式)

试试这个表格。只对那些data_type=="validation "的行进行模型训练。这是用来评估模型和进入顶部的数据。如果你达到100％的准确率，你将在顶部的第一个位置。但你不会因为这样的作弊行为而得到现金奖励。

附加的文件：

numerai_tournament_data.zip 2704 kb

[删除] 2017.06.05 19:20 #3847

交易员博士。
试试这个表格。只对那些data_type=="validation "的行进行模型训练。这是用来评估模型和进入顶层的数据。如果你达到100％的准确率，你将在顶部的第一个位置。但是他们不会因为这个作弊行为而给你现金奖励。

哦，好的，我明天试试......很好的练习机会 )

[删除] 2017.06.06 03:55 #3848

交易员博士。
试试这个表格。只对那些data_type=="validation "的行进行模型训练。这是用来评估模型和进入顶层的数据。如果你达到100％的准确率，你将在顶部的第一个位置。但你不会因为这样的作弊行为而得到金钱奖励。

又是0.5

Dr. Trader 2017.06.06 05:24 #3849

了解训练和评估数据集上的结果是如何重合的，这一点很重要。我看到那里有一个分割的数据集，按照逻辑（也许我错了），数据被随机分成两组，第一组由模型训练，第二组只由模型预测和评估。

如果你预测它所训练的同样的数据，结果会是什么？
然后预测它没有被训练过的数据，并比较两种情况下模型的准确性。

如果在训练过的数据上，它的预测准确率是100%，而在估计的数据上--50%--那么这个模型就过度训练了，它很糟糕。

[删除] 2017.06.06 05:39 #3850

交易员博士。

了解训练和评估数据集上的结果是如何重合的，这一点很重要。我看到那里有一个分割的数据集，按照逻辑（也许我错了），数据被随机分成两组，第一组由模型训练，第二组只由模型预测和评估。

如果我预测用于训练的相同数据，结果会是怎样？
然后预测没有用于训练的数据，比较两种情况下的模型准确性。

如果在训练过的数据上，它的预测准确率是100%，而在估计的数据上--50%--那么这个模型就太过训练了，它很糟糕。

我也学会了50%的预测。我去掉了分割日期，并提交了同一组的测试。

那么首先这个集合非常大，其次我们不知道特征的性质，像向量和森林这样的线性模型显然不适合这里，我们需要做一个复杂的非网格，也许这就是原因。我仍然不确定如何在这个工作室里修改神经网络，使其更加复杂，例如卷积，以尝试做

从这个：https://gallery.cortanaintelligence.com/Experiment/Neural-Network-Convolution-and-pooling-deep-net-2

我仍然是网格方面的新手 ...)

交易中的机器学习：理论、模型、实践和算法交易 - 页 385