交易中的机器学习:理论、模型、实践和算法交易 - 页 2729

 
Aleksey Nikolayev #:

意义不在于标准,而在于使用标准的方式。您使用标准的方式完全不明确--您将什么与什么进行比较,目的是什么)。

好吧,既然你自作聪明,就不愿意往这方面想。我就不费口舌了。

 
Aleksey Vyazmikin #:

好吧,如果你是个聪明人,那你就别往那方面想了。我就不打扰了

阿列克谢,如果你真的想让别人理解你,就学着表达你的想法...

 
mytarmailS #:

阿列克谢,如果你想让别人理解你,就要学会表达自己的想法。

你从哪里听不懂我的话?

我的思想是有条理的--我明白我在说什么,如果有人不明白--可以问我。也许你需要学会更好地理解本质,而不是拘泥于术语....。

 
Aleksey Vyazmikin #:

好吧,如果你是个聪明人,那你就别往那方面想了。我就不打扰了

你要么无法提出想法,要么不想分享想法。在这两种情况下,我们就没有必要继续讨论这个话题了,我们还是不要针对个人了。

 
Aleksey Vyazmikin #:

您认为该标准不合理吗?取十个不同大小的样本进行比较--选择在几项指标上得分最高的样本,这些指标决定了样本的相似性/相似性/同质性。

我们把样本拿去混合,得到不同的分数......我们会很伤心。

* 把它们混在一起。既然没人禁止,既然训练的又不是顺序模型,那么样本的顺序就不重要了。重要的是分类误差,通过混合可以减少误差。

要搜索某样东西,你需要非常准确地了解你要找的是什么,否则你就会一直在玩弄样本,直到迷失方向。没有人知道我们在搜索什么,如果有人知道,请告诉我。
 
还有一个技巧。特征的信息量越少,训练样本就应该越小。

信息量越大、数量越少的属性,可以/应该提取的样本就越大。而几乎所有人的想法都恰恰相反。
 
Aleksey Nikolayev #:

你要么无法提出想法,要么不想分享想法。在这两种情况下,我们都没有必要继续讨论这个话题,也不要针对个人。

我不是写过,我们的想法是比较样本(训练和应用),如果你的理论是正确的,那么随着样本的增加,样本将不再相似,而要理解这一点,你需要评估其变化的标准,这些标准来自于评估相似性的方法吗?

此外,我还谈到了根据某种可比倾向特征将整个样本划分为若干部分,并在这些组内进行排序。而这种排序也可以通过样本的 "相似性 "标准来完成。

我不是针对你--我看到了答案的风格,我只是感到困惑--人们在这里做什么--他们想显示自己的独特性吗?我感兴趣的是找到解决问题的方法,我感兴趣的是利用别人的知识和分享自己的知识。

 
Maxim Dmitrievsky #:
采集并混合样本,获得不同的估计值...... 悲伤的

* 将它们相互混合。既然没有人禁止,既然训练的又不是顺序模型,那么样本的顺序就不重要了。重要的是分类误差,通过混合可以减少误差。

要搜索某样东西,你需要非常准确地了解你要找的是什么,否则你就会一直在玩弄样本,直到迷失方向。没有人知道我们在搜索什么,如果有人知道,请告诉我。

你只能在一个样本内进行混合,如果你混合了两个样本,那就意味着否认市场正在发生变化。

 
Maxim Dmitrievsky #:
采集并混合样本,获得不同的估计值...... 悲伤的

* 将它们相互混合。既然没人禁止,既然训练的又不是顺序模型,那么样本的顺序就不重要了。重要的是分类误差,通过混合可以减少误差。

要搜索某样东西,你需要非常准确地了解你要找的是什么,否则你就会一直在玩弄样本,直到迷失方向。没有人知道我们在搜索什么,如果有人知道了,请告诉我。

我不太喜欢你和阿列克谢在推理中的共同点--你们都是在特定模型的背景下研究训练样本变化时的行为。理想情况下,我希望在选择训练样本时不受特定模型 的影响,这也是我现在决定使用之字形顶点的原因。但你们可能都是对的,完全独立于 TC 类型几乎是不可能的。

 
Aleksey Vyazmikin #:

我不是写过,比较样本(训练和应用)的想法是,如果你的理论是正确的,随着样本的增加,样本将不再相似,而要实现这一点,你需要评估其变化的标准,这些标准来自评估相似性的方法?

在这里,您显然是在谈论多元样本(每个元素都是一张表格的一行,即一个向量),而您的三个链接中的同质性标准是关于数字样本的。matstat 中的多元同质性标准是另一首歌,我不太清楚。

Aleksey Vyazmikin#:

此外,我说的是根据某些可比趋势特征将整个样本划分为 若干部分,并在这些组内进行排序。这种排序也可以根据样本的 "相似性 "标准来进行。

这与寻找许多变化点的检测任务类似。事实再次证明,我们必须处理多维(矢量)情况,这使问题变得更加复杂。

嗯,总的来说,我不喜欢依赖于选择哪些属性进行研究。如果我们选择不同的属性集,结果可能会不同。