交易中的机器学习:理论、模型、实践和算法交易 - 页 3375

 
Maxim Kuznetsov #:

以表格形式呈现的离散数据。

非 TO ?

那我就直接糊涂了......什么是表格/非表格数据.....?表格数据是线性度量,Y 完全依赖于 X?

表格数据是异构的,比如员工列表。其中列出了性别、年龄、工资等。表格数据中的更多行通常互不相关,例如,如果你把几个工人加起来,那么擎天柱就不会工作。但如果把几个像素相加,就会得到擎天柱。
 
在我们的案例中,原始数据是时间序列,而不是表格。如果我们不使用新闻分析,那么就使用表格。

因此,在第一种情况下,NS 和 bousting 都适用,也许 NS 更好,这取决于数据表示。在第二种情况下,bousting 更好。

因此,我们要学会区分初始数据表示和处理后的数据表示。
 
Aleksey Nikolayev #:
如果它们可以写入表格,但不能写入矩阵)。
那么,NS 在同类数据中效果更好。如果数据类型相同,表格数据可以写入矩阵。
 
对于表格数据,有一种神经元 TabNet 架构

它被定位为 boosts 的竞争对手。
我已经试过了,效果很好,而且不会...
 
的确有这样的网络。但我们的课题需要的是处理序列的网络,而不是表格。因为它们从一开始就是序列。
 
Maxim Dmitrievsky #:
的确有这样的网络。但我们的课题需要的是处理序列的网络,而不是表格。因为它们从一开始就是序列。

你能证明它们是序列吗?

你能证明它们是序列吗?

 
我从这一提示中了解到的表格数据

这就是所谓的整洁数据,即 "整洁数据"。

在表格中,每一行都是一个观测值,每一列都是一个特征。

 
Maxim Dmitrievsky #:
主题需要更多的网络来处理序列而不是表格。
我不明白,序列不能是表格格式吗?
 
Maxim Dmitrievsky #:
的确有这样的网络。但我们的课题需要的是处理序列的网络,而不是表格。因为它们从一开始就是序列。

第一种选择,表格--Excel 电子表格,每一行都有一个时间标记。这是最常见的财务数据形式。

第二种,手写信件。与老师一起学习,老师是一封打印出来的信,下面一栏是该信的手写变体。

比较 Bousting 和 NS。哪种方法更适合哪种情况?或者是否等同?

PS.

来自 Rattle,其中有 rpart(简单树)、rf、ada、SVM、glm、nnet(可能是最简单的 NS)。结果最差的是 rpart,排在第二位的是 nnet,其他四种都差不多,这取决于输入数据。

 
Maxim Kuznetsov #:

我现在心情很好。

你能证明它们是序列吗?

时间序列更准确在我看来,你必须先提出一个替代方案。否则要么有要么没有