交易中的机器学习：理论、模型、实践和算法交易

Valeriy Yastremskiy 2020.07.28 13:36 #19271

Aleksey Vyazmikin:

这就是特征生成的方式--我们需要以基本规则的形式准备一个构造器。

例如，描述一次价格在渠道中的表现，然后就改变渠道，如此反复。

我理解这是规则的一部分，如果是这样，可以实施。

mytarmailS 2020.07.28 15:10 #19272

Aleksey Vyazmikin:

在聚类过程中，许多行被分配到了不同的区域，并生成了一张地图，我想它可以通过调用。

然后对每一行进行加权，并将其分配给一个或另一个聚类中心。我只是不明白单行是如何加权的......

这个地图被称为原型或集群中心，新数据与每个中心进行比较，得到最接近的中心标签。

对于每个函数，都嵌入了帮助，只需在控制台写上"？"，并将函数命名为"?Kmeans"。

底下总是有一些例子。

如何预测https://stackoverflow.com/questions/53352409/creation-prediction-function-for-kmean-in-r

决定看一下有意义的市场逆转。以重大调头为目标。以为会出现混乱，但没有。

将逆转归为有意义的规则是什么？

之字形的膝盖。

所以，非常有趣。谢谢你的提示。

你能为傻瓜分享一下代码吗？

弗拉基米尔公布了代码。你可能需要学习基础知识，否则你可能会有太多的问题，而增加很少的帮助。

谢谢你，我成功地卸下了集群。

.

mytarmailS 2020.07.28 15:12 #19273

Aleksey Vyazmikin:

那么，你的方法怎么会比我的好呢--收集叶子基本上是由现有数据得出的新预测器。你只需要建立树，不仅使用比较，还需要转换和组合目标的层次，一般来说，你可以在普通树的基础上实现，并从那里拖动叶子。

如果你的方法能产生我写给Maxim的这种规则，那就没什么。

Aleksey Vyazmikin 2020.07.28 16:02 #19274

mytarmailS:

如果你的方法能够生成我写给Maxim的这种规则，那么就没有什么

我的方法将允许生成不是随机的，而是有意义的--可以说是更多的产量，但基于一个有规律的树。

一般来说，我的意思是，我们可以在树形算法中加入一些转换程序进行训练，比如将一个预测器与另一个预测器进行比较，进行乘法、除法、加法、减法和其他操作。重点是，在树的遗传构建过程中，变体的选择不是随机的，而是对样本进行一些描述，这将减少搜索解决方案的时间。从样本中抛出随机预测因子，我们将能够在考虑到这些转换的情况下建立不同的树。

Vladimir Perervenko 2020.07.28 16:10 #19275

Rorschach:
你在哪里遇到过关于如何最好地使输入正常化的研究：增量、减量ma、滑动窗口？

你说的 "正常化 "是什么意思？使变量的分布尽可能地接近正常？

mytarmailS 2020.07.28 16:29 #19276

Aleksey Vyazmikin:

我的方法将允许不是随机地生成，而是有意义地生成--可以说是更多的产量，但基于一个有规律的树。

一般来说，我的意思是，在训练过程中，我们可以在树形算法中加入一些转换程序，比如将一个预测器与另一个预测器进行比较，乘法、除法、加法、减法，其他动作。重点是，在树的遗传构建过程中，变体的选择不是随机的，而是对样本进行一些描述，这将减少搜索解决方案的时间。从样本中随机抛出预测因子，我们将能够在考虑到这些转换的情况下建立不同的树。

阅读我给出的那个规则作为例子，并尝试在树上建立一个这样的规则生成器。

Rorschach 2020.07.28 16:32 #19277

Vladimir Perervenko:

你说的 "正常化 "是什么意思？让一个变量的分布尽可能地接近正常？

将变量的范围扩大到+-1

mytarmailS 2020.07.28 16:34 #19278

弗拉基米尔-佩雷文科。

在继续一次个人谈话中

您的版本

umap_transform(X = X[tr,], model = origin.sumap, n_threads = 4 L, 
               verbose = TRUE) -> train.sumap

head(train.sumap)
[1,] 22.196741
[2,] 14.934501
[3,] 17.350166
[4,]  1.620347
[5,] 17.603270
[6,] 16.646723

纯粹的变体

train.sumap <- umap_transform(X = X[tr,], model = origin.sumap, n_threads = 4 L, 
               verbose = TRUE)

head(train.sumap)
[1,] 22.742882
[2,]  7.147971
[3,]  6.992639
[4,]  1.598861
[5,]  7.197366
[6,] 17.863510

正如你所看到的，数值有很大不同，你可以自己检查一下

在我的模型中

n_components = 1

因此只有一列，但这并不重要。

===================UPD

伙计，你每次运行 umap_tranform 时它们都是不同的，不应该是这样的

Aleksey Vyazmikin 2020.07.28 16:53 #19279

mytarmailS:

阅读我给出的规则作为一个例子，并尝试将这种规则生成器构建到树中。

问题是什么--在开始时创建组件，这些规则将被堆叠。

mytarmailS 2020.07.28 17:41 #19280

Aleksey Vyazmikin:

有什么问题呢--在一开始就创建组件来组成规则。

我不知道，我不能把我的手指放在它上面。

交易中的机器学习：理论、模型、实践和算法交易 - 页 1928