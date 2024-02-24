交易中的机器学习：理论、模型、实践和算法交易 - 页 3285

Maxim Dmitrievsky #:
继续量化 😵‍💫

终于有了一些合理的建议！

 
Aleksey Vyazmikin #:

结果如下--最后两列

结果确实有所改善。我们可以假设，样本越多，训练结果就越好。

我们有必要尝试对训练样本的 1 部分和 2 部分进行训练，如果结果不会比 2 部分和 3 部分差很多，那么样本新鲜度的因素就可以被认为没有样本量那么重要。

好了，训练已经完成，结果如下表所示--最后两列。


我们可以初步得出结论，训练的成功与否确实取决于样本的大小。不过，我注意到"-1p1-2 "样本的结果与"-1p2-3"样本相当，甚至在某些标准上更好，而 "0p1-2 "样本的结果在符合给定标准的模型数量上是"-1p2-3 "样本的两倍。

现在，我运行了一个时间顺序颠倒的样本，其中 train 样本由初始考试+测试+train_p3 样本组成，测试样本为train_p2，考试样本为 train_p1 这样做的目的是想看看是否有可能在较新的数据上建立一个 10 年前就能成功的模型。

您认为结果会如何？

 
再多一点点，就会得到最微不足道的结果......也可能不会得到，但会有颠覆 ME 世界的发现！

该走了！

 
СанСаныч Фоменко #:

我曾多次写过关于 "预测因子的预测能力 "的文章。

我发现了一个计算距离的工具列表：

除了标准工具外，它还有自己的距离集

不错的构建
这是一项没有输入的任务：...
您认为结果会是什么？😀

就像之前一样：这里是没有特征的特征值.....

然后他会写道：没有人猜到，结果是这样的😁😁😁😁🥳
 
马克斯，我不明白你为什么要取笑我。

如果没有假设--就不要说，如果有假设--就说出来，比如 "结果会很糟糕"。

 
Aleksey Vyazmikin #:
...

你认为结果会怎样？

我不知道，但我很想知道。

 
那么，你认为前两列的模型数量会有可比性吗？尽管它们相差两倍。请更具体地说明琐碎性。

我上面写的是 matstat。在此之前，我写过关于 kozul 的文章。甚至在此之前，我还写过关于 Oracle 错误（标记错误）的文章，当数据以一种你无法理解的方式标记出来时。从这些文章中，我们可以清楚地认识到，在不同的大块数据和不同长度的训练中，结果会有所不同。这取决于没有提供或描述的数据。
标记错误会影响结果和时间段。哪只鸡用哪只爪子做标记，就会得出哪只鸡的结果。

这里的人喜欢谈论学习的基本支柱：预处理、量化、判定者与目标的关系....。但是，他们并没有写到用哪只爪子做标记，左爪还是右爪。这比上述所有内容都更重要。
 
好吧，这听起来已经像是专业人士的观点了（对错是另一个问题）。
也没必要取笑。
