交易中的机器学习:理论、模型、实践和算法交易 - 页 1376

 
阿列克谢-维亚兹米 金。

为什么要研究不到整个样本的10%,更多的抽样不是应该导致改进吗?

而且为什么要超过5千?如果你不能在他们身上训练,你就不能在更多的地方训练。

 
阿列克谢-维亚兹米 金。

为什么要训练不到整个样本的10%,增加样本不是应该导致改善吗?

过度训练的系统呢,你认为它将导致什么?

 
法尔哈特-古扎罗夫

一个重新培训的系统呢,你认为这将导致什么?

样本越大,就需要更多的叶子/树而言,就越难拟合模型。

 
尤里-阿索连科

通过x - 交易号码,通过y -以点为单位的利润金额


是4位数,还是5位数?

 
sibirqk:


是4字头,还是5字头?

这根本就不是一个标志)。
 
尤里-阿索连科
这根本不是一个标志))。
那么它是什么意思--以pps为单位的利润额?
 
sibirqk:
那么,把利润放在点上是什么意思?
这是一个交流工具。它显示了在最简单的系统上获利的可能性。其余的还不重要。
 
弗拉基米尔-佩雷文科

这不完全正确。例如,你有train[2000, ] 和test[500, ] 。你在train上进行训练,初始例子权重=1.0,让test[]预测训练后的模型。根据每个测试前缀的质量,你给它一个权重。然 后将训练和测试结合起来,形成一个新的训练样本,训练模型,测试模型,如此反复,直到所有的训练样本都有这样得到的权重。你可以对它们应用一个减少系数,用于老式酒吧,但我没有检查过。当然,所有这些都是为了分类。

用ELM检查,给出了良好的结果。

祝好运

我不太明白这怎么能提高模型在新数据上的性能。

因此,在进一步的训练中,相当于从样本中删除这些线条,在测试中,一切都会很好,有100%的准确性,在测试中,在同一个圆圈中的标记--也会一切都很好。但是有了全新的数据,我们将无法收回这些线条,它已经是模型真正能够做到的了。

或者反过来说,你是否为错误的例子增加了重量?

 
elibrarius

我不太明白这怎么能提高模型在新数据上的性能。

例如,如果类的定义不正确,我们就把权重递减,作为一个极端的变量0.所以在随后的训练中,相当于从样本中删除这些行,一切都会很好,在托盘上有100%的准确性,在测试中,我们也循环标记 - 一切也会很好。但在全新的数据上,我们将无法抛弃线,而且会有已经是模型的真正能力。

还是你反而为错误的例子增加了权重?

当然,降级是针对 "坏 "的例子。如果你往上走--那就是典型的助推。

只要做一个实验并检查一下就可以了。

我现在不这么做了。在训练前进行预处理时,我删除或突出了有噪声的例子。

祝好运

 
尤里-阿索连科

为什么你需要超过5,000个?如果你不能用它来学习,你就不能用更多的东西来学习。

这句话被归入愚蠢声明的库房。

阿列克谢-维亚兹米 金。

样本越大,就需要更多的树叶/树木,就越难拟合模型。

完全正确,越多越好(少于10万是噪音),但我们必须考虑到市场的变化,如何在训练中考虑到这一点是一个大秘密。