交易中的机器学习:理论、模型、实践和算法交易 - 页 1928

 
Aleksey Vyazmikin:

这就是特征生成的方式--我们需要以基本规则的形式准备一个构造器。

例如,描述一次价格在渠道中的表现,然后就改变渠道,如此反复。

我理解这是规则的一部分,如果是这样,可以实施。

 
Aleksey Vyazmikin:

在聚类过程中,许多行被分配到了不同的区域,并生成了一张地图,我想它可以通过调用。

然后对每一行进行加权,并将其分配给一个或另一个聚类中心。我只是不明白单行是如何加权的......


这个地图被称为原型或集群中心,新数据与每个中心进行比较,得到最接近的中心标签。

对于每个函数,都嵌入了帮助,只需在控制台写上"?",并将函数命名为"?Kmeans"。

底下总是有一些例子。

如何预测https://stackoverflow.com/questions/53352409/creation-prediction-function-for-kmean-in-r


决定看一下有意义的市场逆转。以重大调头为目标。以为会出现混乱,但没有。

将逆转归为有意义的规则是什么?

之字形的膝盖。


所以,非常有趣。谢谢你的提示。

你能为傻瓜分享一下代码吗?

弗拉基米尔公布了代码。你可能需要学习基础知识,否则你可能会有太多的问题,而增加很少的帮助。


谢谢你,我成功地卸下了集群。

.

 
Aleksey Vyazmikin:

那么,你的方法怎么会比我的好呢--收集叶子基本上是由现有数据得出的新预测器。你只需要建立树,不仅使用比较,还需要转换和组合目标的层次,一般来说,你可以在普通树的基础上实现,并从那里拖动叶子。

如果你的方法能产生我写给Maxim的这种规则,那就没什么。

 
mytarmailS:

如果你的方法能够生成我写给Maxim的这种规则,那么就没有什么

我的方法将允许生成不是随机的,而是有意义的--可以说是更多的产量,但基于一个有规律的树。

一般来说,我的意思是,我们可以在树形算法中加入一些转换程序进行训练,比如将一个预测器与另一个预测器进行比较,进行乘法、除法、加法、减法和其他操作。重点是,在树的遗传构建过程中,变体的选择不是随机的,而是对样本进行一些描述,这将减少搜索解决方案的时间。从样本中抛出随机预测因子,我们将能够在考虑到这些转换的情况下建立不同的树。

 
Rorschach:
你在哪里遇到过关于如何最好地使输入正常化的研究:增量、减量ma、滑动窗口?

你说的 "正常化 "是什么意思?使变量的分布尽可能地接近正常?

 
Aleksey Vyazmikin:

我的方法将允许不是随机地生成,而是有意义地生成--可以说是更多的产量,但基于一个有规律的树。

一般来说,我的意思是,在训练过程中,我们可以在树形算法中加入一些转换程序,比如将一个预测器与另一个预测器进行比较,乘法、除法、加法、减法,其他动作。重点是,在树的遗传构建过程中,变体的选择不是随机的,而是对样本进行一些描述,这将减少搜索解决方案的时间。从样本中随机抛出预测因子,我们将能够在考虑到这些转换的情况下建立不同的树。

阅读我给出的那个规则作为例子,并尝试在树上建立一个这样的规则生成器。

 
Vladimir Perervenko:

你说的 "正常化 "是什么意思?让一个变量的分布尽可能地接近正常?

将变量的范围扩大到+-1

 
弗拉基米尔-佩雷文科

在继续一次个人谈话中

您的版本

umap_transform(X = X[tr,], model = origin.sumap, n_threads = 4 L, 
               verbose = TRUE) -> train.sumap
head(train.sumap)
[1,] 22.196741
[2,] 14.934501
[3,] 17.350166
[4,]  1.620347
[5,] 17.603270
[6,] 16.646723

纯粹的变体

train.sumap <- umap_transform(X = X[tr,], model = origin.sumap, n_threads = 4 L, 
               verbose = TRUE)
head(train.sumap)
[1,] 22.742882
[2,]  7.147971
[3,]  6.992639
[4,]  1.598861
[5,]  7.197366
[6,] 17.863510

正如你所看到的,数值有很大不同,你可以自己检查一下


在我的模型中

n_components = 1

因此只有一列,但这并不重要。

===================UPD

伙计,你每次运行 umap_tranform 时它们都是不同的,不应该是这样的

 
mytarmailS:

阅读我给出的规则作为一个例子,并尝试将这种规则生成器构建到树中。

问题是什么--在开始时创建组件,这些规则将被堆叠。

 
Aleksey Vyazmikin:

有什么问题呢--在一开始就创建组件来组成规则。

我不知道,我不能把我的手指放在它上面。