交易中的机器学习：理论、模型、实践和算法交易

Aleksey Nikolayev 2022.02.05 08:44 #25681

mytarmailS#:
谁知道是否有趋势决定论的测试...

你需要知道这是否真的是一种趋势或随机的波动...

也许是同一个赫斯特？

对不同类型的趋势进行开箱测试

R best!!!!

对于线性趋势，sens.slope()是不错的选择。

vladavd 2022.02.05 08:53 #25682

mytarmailS#:

金融数学和IR有什么好理解的，你需要知道市场的机制和它的参与者

在大多数情况下，群众必然会输，因为它的反面角色是一个 "主要角色"。

1）你需要看到零售买家和卖家的不平衡，例如，如果有许多卖家，那么 "大玩家"（买家）就在交易的另一边。

比如说现在在犹太人身上，很多卖家

2）也有逆向交易的时刻，这是做市商

人们总是看到，价格的走势与人群相反（反相关）。

当人群在购买并相信增长时，价格会下降，反之亦然......

这就是整个市场...

p.s. 而且我肯定会看视频的。

这也有问题，而且问题不小。我们只掌握了市场上的一小部分，不知道其代表性和可靠性如何。第二张图片（一般情绪）根本没有用。首先，反转经常发生在 "逆向 "趋势似乎应该继续的极端点。第二，制裁只是简单地重复价格（颠倒了，少了趋势）--反转任何振荡器，你会得到一个非常相似的画面。好吧，如果指标重复了价格，这意味着它的预测并不比价格图表本身更容易，对吗？第一张图片（玻璃和开仓）和利润率的价值更有价值，但它也是如此。非常值得怀疑。

Aleksey Vyazmikin 2022.02.05 09:05 #25683

Aleksey Nikolayev#:

具体如何编码（从组合学的角度来看）并无太大区别。重点是一样的--每条线都有哪些规则被执行，哪些不被执行的特点。它总是2^N的变体，其中N是规则的数量。之后，这些规则中的每一条都将被纳入最终的2^(2^N)个变体的集合。很明显，不可能只是正式地尝试这么多的变体。这就是为什么以合理的方式安排它们是有意义的。例如，首先我们采取所有只由一条规则描述的变体，然后是所有只由两条规则描述的变体，以此类推。或者类似这样的事情。

也许我没有解释清楚，但我想再次强调，我们正在使用初始样本，在CatBoost学习算法中，初始样本被量化了一次，即假设我们有1000个预测器，我们把它们各自量化为10个段，结果我们有10000个段--进一步说，CatBoost算法随机拉出预测器，并通过边缘/量子进行分割/分裂，为了选择一个处于中间的量子，它需要建立3个不等式或创建8个叶子，其中7个叶子会说垃圾，一个叶子说有价值的信息。算法是否会建立这样的树也是不确定的，因为有爱的随机性，一个相邻的量子可以进入叶子。而且只让它成为一棵树。在我的方法中，一个不平等就足够了--2片叶子。即使所有的预测因子都被使用，并且每个预测因子都有1片有用的叶子，在创建模型时，组合的数量也会少很多。但重要的是，噪音也会减少，因为不会有那么多错误的样本分区来稳定需要建立一个新的树（提升原理）。

Aleksey Nikolayev# :

例如，许多其他玩家迟早会发现他们。

那么，也许人们应该以某种方式检验这一理论？据此，有一个最小的优势重复出现的频率，在增加之后，它更有可能消失，而不是继续存在？

例如，我们衡量每半年，有一个1.5年的优势 - 我们认为半年将工作，如果它已经是2.5年，没有意义，并采取它 - 概率是更多，它将停止工作。

我不擅长科学公式，你能告诉我如何进行这种计算并检查假设吗？

mytarmailS 2022.02.05 09:29 #25684

Aleksey Nikolayev#:

对于线性趋势，sens.slope()是不错的选择。

谢谢

vladavd#:

这也有问题，而且是相当多的问题。我们只有一小部分市场可用，我们不知道它的指示性和可靠性如何。第二张图片（整体情绪）完全没有用。首先，反转经常发生在 "逆向 "趋势似乎应该继续的极端点。第二，制裁只是简单地重复价格（颠倒了，少了趋势）--反转任何振荡器，你会得到一个非常相似的画面。好吧，如果指标重复了价格，这意味着它的预测并不比价格图表本身更容易，对吗？第一张图片（玻璃和开仓）和利润率的价值更有价值，但它也是如此。非常值得怀疑。

你在很多事情上迷失了方向，你太肤浅了，对信息的认知不假思索。

Aleksey Nikolayev 2022.02.05 09:33 #25685

Aleksey Vyazmikin#:

也许我没有解释清楚，但我想再次强调，我们的工作对象是原始样本，在CatBoost学习算法中，它被量化了一次，即假设我们有1000个预测器，我们把它们各自量化为10个段，结果我们有10000个段--进一步说，CatBoost算法随机拉出预测器，并通过边缘/量子进行分割/分裂，为了选择一个处于中间的量子，它需要建立3个不等式或创建8个叶子，其中7个叶子会说垃圾，一个叶子说有价值的信息。算法是否会建立这样一棵树也是不确定的，因为有爱的随机性，相邻的量子可以进入一个叶子。而且只让它成为一棵树。在我的方法中，一个不平等就足够了--2片叶子。即使所有的预测因子都被使用，并且每个预测因子都有1片有用的叶子，在创建模型时，组合的数量也会少很多。但重要的是，噪音也会减少，因为不会有那么多错误的样本分区来稳定你需要建立一个新的树（提升原理）。

也许你应该在一个单一决策树的例子上描述你的方法。不过，就其本身而言，提升已经建立了一个相当复杂的结构--精炼树序列。而你还在用它做别的事情）。

Aleksey Vyazmikin#:

那么也许你需要以某种方式检查这个理论？据此，有一个最小的优势复现频率，在其增加之后，其消失的可能性大于其继续存在的可能性？

例如，我们每半年测量一次，有1.5年的优势--我们认为半年后仍然可以工作，如果已经是2.5年了，就没有意义了，采取它--它将停止工作的概率更高。

我对科学公式不擅长，你能告诉我如何进行这样的计算并检查假设吗？

类似于带有半衰期的放射性公式）我不认为人类活动可以用这种简单的公式来描述）你的 "优势频率 "会发生变化，很可能是某种非常不可预测的变化。

Aleksey Vyazmikin 2022.02.05 09:50 #25686

Aleksey Nikolayev#:

也许你应该以一棵决策树为例来阐述你的方法。然而，提升本身已经建立了一个相当复杂的结构--树的精炼序列。而你还在用它做别的事情）。

是的，我理解，要立即理解这个方法并不容易。我打算更详细地描述它。而数据在提交给CatBoost之前已经被处理过了，但我想做我自己的算法，这将考虑到分裂时 "衰减 "的变化动态，正如你所说的。

Aleksey Nikolayev#:

有点像带有半衰期的放射性公式）我不认为人类活动可以用任何这样简单的公式来描述）你的 "优势频率 "很可能以某种高度不可预测的方式改变。

可能什么都没有，但你怎么检查呢？

vladavd 2022.02.05 09:53 #25687

mytarmailS#:

谢谢

你在很多事情上迷失了方向，太肤浅，对这些信息不加思考。

是的，我只是用这个工具工作了好几年，根本没有真正想清楚。

你到底不同意什么？

Aleksei Kuznetsov 2022.02.05 09:54 #25688

Aleksey Vyazmikin#:

是的，我们这么说吧。

不，现在我们把不等式规则的执行作为一个，看一下规则被样本触发时目标（比方说二元分类）的平均值，如果最初的平均值是，比方说，样本中的0.45，而只通过反应评估后是0.51，那么我们认为预测器（其图/量）的预测能力为0.06，即6%。

我们收集了很多这样的预测器，这些预测器已经是独立的二进制预测器，并使用它们来建立一个模型。

将所有这样的量子与所有（无论有无预测能力）的量子结合起来，的确不是一件快事，但如果用一个基础预测器来做，在此基础上确定一个有预测能力的量子，也许不是不合理的。

但是，即使在理论上，这种再培训也会比较少，因为可能的组合比全样本中的少。

尚待理解的是，为什么这种量子模式可以工作7年，然后突然停止......

我是否正确理解了你在做什么？:

1）我们得到1棵树。
2）每个节点最多可以给出10个分支（在图片中我们发现更少，就说10个分支），每个分支由1个量子产生（一个量子是一块预测器的10%：要么是百分数，要么是10%的振幅，取决于使用哪种量化方法）。
3) 在第一次分裂后，我们找到3个量子，这些量子随后导致了一个成功的叶子
4) 随后的分裂又找到了一些好的分裂/量子，导致了成功的叶子
5) 我们在成功的叶子前记住了成功的量子
6) 建立一个新的树，它只使用我们选择的量子作为预测器

用我们量化第一棵树的方法来做，用我们的脚本量化预测器，我们从100个预测器中得到1000个，它们已经是二进制的0或1。如果预测器的值在这个范围内，它=1，如果不在，它=0。
由于我们只选择成功的路径/量子，所有被选中的量子的值都=1。如果所有预测因子=1，那么新的树就不能学习。答案已经知道了。

还是没有必要再建一棵新树？如果预测器的值落在选定的量子范围内，我们会立即这样做吗？

mytarmailS 2022.02.05 10:08 #25689

vladavd#:

是的，我只是用这个工具工作了多年，所以我根本没有真正想过这个问题。

不同意什么，确切地说？

究竟用哪种工具？

vladavd 2022.02.05 10:10 #25690

mytarmailS#:

用什么样的工具？

那么，照片里有什么呢？玻璃和制裁。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2569