交易中的机器学习:理论、模型、实践和算法交易 - 页 3385

 
Maxim Dmitrievsky #:
你不是想写一篇关于规则的文章吗?这也许是个有趣的话题,比最小化测试功能更有趣。还是你对 OOS 的验证有问题?或者没有问题,只是懒得写。
我不知道,没什么好写的。
我会写如何将木质模型分解成规则,那又怎样?
事实上,我的帖子已经说明了一切。

还是你指的是我以前的帖子?如果是这样的话,在拆分过程中,我没有发现超强的愈合能力,但有一些优点是不能给模型带来任何影响的。

1.可以大大降低模型的维度。



2. 可以知道每条规则的统计数据(这一点非常重要)。

例如,我们有一个包含 100 条规则的木质模型,但我们永远不知道每条规则在 100 条规则中是起作用一次(没有模式),还是 10 条规则起作用 50 次(有模式)。
如果我们不打破这个模型,我们就不会知道,两个模型对我们来说都是一样的。

 
mytarmailS #:
我不知道,我真的没什么可写的。
我会写如何将木制模型分解成规则,那又怎样?
基本上,我的帖子已经向你展示了一切。

还是你指的是我以前的帖子?如果是这样的话,在拆分过程中,我没有发现超级愈合特性,但有一些优点是不能给模型带来任何影响的。

1.可以大大降低模型的维度。



2. 可以知道每条规则的统计数据(这一点非常重要)。

例如,我们有一个包含 100 条规则的木质模型,但我们永远不知道每条规则在 100 条规则中是起作用一次(没有模式),还是 10 条规则起作用 50 次(有模式)。
如果我们不打破这个模型,我们就不会知道,两个模型对我们来说都是一样的。

在树状模型中,你通常可以计算出每个特征的每个观测值对模型的影响和贡献,例如通过 shap 值。如果我们只留下有用的特征,并只对它们进行训练,就能得到近似规则搜索的结果。顺便说一句,神经元也可以做到这一点。

很难理解什么时候只有规则才是唯一有用的。也许是为了结果的可解释性。虽然形状值也能提供很好的可解释性,算是吧。
 
Maxim Dmitrievsky #:
在树状结构中,你通常可以计算出每个观测值对每个性状的影响,例如,通过 shap 值计算出它对模型的贡献。如果只留下有用的观测值,并只对它们进行训练,就能得到近似规则搜索的结果。顺便说一句,神经元也可以做到这一点。

很难理解什么时候只有规则才是唯一有用的。也许是为了结果的可解释性。虽然形状值也能提供很好的可解释性。
每个特征的影响、每个观察结果的影响和每个规则的影响都是不同的
 
mytarmailS #:
每个特征的影响、每个观测值的影响和每个规则的影响都是不同的
规则是连接特征和标签的模型元素。唯一的问题是,神经网络没有不连续性,但可以人为地制造不连续性。

我想说的是,我不认为规则有什么意义(意味深长地抽着烟斗)。
 
Maxim Dmitrievsky #:
规则是模型中连接属性和标签的元素。唯一的问题是,神经网络没有不连续性,但可以人为地制造不连续性。 。

我想说的是,我不认为规则有什么意义。

我从哈巴罗夫斯克的角度试试看......


任何模型都是一定模式的总和,夸张地说,一个模式可以被称为一个 TS。


假设一个模型由 100 个 TC 组成。


可能在模式 #1 中,100 个 TS 做了一笔交易。

也可能在模式 #2 中,一个 TS 做了 100 笔交易,而其他 99 个 TS 没有做任何交易。


如何 计算每个 TS 的统计数据

如果是规则模型,则简单明了。

如果是神经模型?

 
mytarmailS #:

我从哈巴罗夫斯克附近试试。

如果模型是神经元?

/\
!
!

你和桑尼奇不是在同一个工作室工作吗?
你选择的例子都是NS能很好预测的。你只用它们来训练另一个 NS。根据自己的喜好重复几次。几轮之后,你就能找到 "规则 "最好的 NS。

也很容易,我不会说不可理解。
 
Maxim Dmitrievsky #:

选择 NS 预测良好的示例。只对它们训练另一个 NS。根据自己的喜好重复几次。几轮之后,你就会得到 "规则 "最好的 NS。
你怎么知道这个子样本中只有一个模式、两个还是二十个?你真的不知道区别吗?

 
mytarmailS #:
好吧,我们得到了一个神经元预测良好的子样本。 你怎么知道在这个子样本中是一种模式,两种还是二十种?你真的不知道区别吗?

通过剩下的例子数量有多少样本就有多少模式这是一个近似规则,我不是说它和严格规则一样。但你可以进一步划分样本,直到每种模式都划分完整。
 
Maxim Dmitrievsky #:
根据剩下的例子数量。有多少个示例,就有多少种模式。
可能有 200 个例子,但只有 5 种模式。
一个例子不是一种模式,一个例子就是一个观察结果。
 
mytarmailS #:
可以有 200 个例子,但只有 5 种模式。
一个例子不是一个模式,一个例子就是一个观察结果。
如果误差已经停止下降或等于零,则可以通过某种接近度:)将剩余的示例划分为模式。例如聚类。然后计算还剩下多少个。甚至为每个模式/聚类写一个平均条件(取聚类的中心点),你就会得到一个输出规则。