交易中的机器学习:理论、模型、实践和算法交易 - 页 2569

 
mytarmailS#:
谁知道是否有趋势决定论的测试...
你需要知道这是否真的是一种趋势或随机的波动...

也许是同一个赫斯特?


对不同类型的趋势进行开箱测试

R best!!!!

对于线性趋势,sens.slope()是不错的选择。

 
mytarmailS#:

金融数学和IR有什么好理解的,你需要知道市场的机制和它的参与者

在大多数情况下,群众必然会输,因为它的反面角色是一个 "主要角色"。

1)你需要看到零售买家和卖家的不平衡,例如,如果有许多卖家,那么 "大玩家"(买家)就在交易的另一边。

比如说现在在犹太人身上,很多卖家

2)也有逆向交易的时刻,这是做市商

人们总是看到,价格的走势与人群相反(反相关)。

当人群在购买并相信增长时,价格会下降,反之亦然......

这就是整个市场...


p.s. 而且我肯定会看视频的。

这也有问题,而且问题不小。我们只掌握了市场上的一小部分,不知道其代表性和可靠性如何。第二张图片(一般情绪)根本没有用。首先,反转经常发生在 "逆向 "趋势似乎应该继续的极端点。第二,制裁只是简单地重复价格(颠倒了,少了趋势)--反转任何振荡器,你会得到一个非常相似的画面。好吧,如果指标重复了价格,这意味着它的预测并不比价格图表本身更容易,对吗?第一张图片(玻璃和开仓)和利润率的价值更有价值,但它也是如此。非常值得怀疑。


 
Aleksey Nikolayev#:

具体如何编码(从组合学的角度来看)并无太大区别。重点是一样的--每条线都有哪些规则被执行,哪些不被执行的特点。它总是2^N的变体,其中N是规则的数量。之后,这些规则中的每一条都将被纳入最终的2^(2^N)个变体的集合。很明显,不可能只是正式地尝试这么多的变体。这就是为什么以合理的方式安排它们是有意义的。例如,首先我们采取所有只由一条规则描述的变体,然后是所有只由两条规则描述的变体,以此类推。或者类似这样的事情。

也许我没有解释清楚,但我想再次强调,我们正在使用初始样本,在CatBoost学习算法中,初始样本被量化了一次,即假设我们有1000个预测器,我们把它们各自量化为10个段,结果我们有10000个段--进一步说,CatBoost算法随机拉出预测器,并通过边缘/量子进行分割/分裂,为了选择一个处于中间的量子,它需要建立3个不等式或创建8个叶子,其中7个叶子会说垃圾,一个叶子说有价值的信息。算法是否会建立这样的树也是不确定的,因为有爱的随机性,一个相邻的量子可以进入叶子。而且只让它成为一棵树。在我的方法中,一个不平等就足够了--2片叶子。即使所有的预测因子都被使用,并且每个预测因子都有1片有用的叶子,在创建模型时,组合的数量也会少很多。但重要的是,噪音也会减少,因为不会有那么多错误的样本分区来稳定需要建立一个新的树(提升原理)。

Aleksey Nikolayev# :

例如,许多其他玩家迟早会发现他们。

那么,也许人们应该以某种方式检验这一理论?据此,有一个最小的优势重复出现的频率,在增加之后,它更有可能消失,而不是继续存在?

例如,我们衡量每半年,有一个1.5年的优势 - 我们认为半年将工作,如果它已经是2.5年,没有意义,并采取它 - 概率是更多,它将停止工作。

我不擅长科学公式,你能告诉我如何进行这种计算并检查假设吗?

 
Aleksey Nikolayev#:

对于线性趋势,sens.slope()是不错的选择。

谢谢

vladavd#:

这也有问题,而且是相当多的问题。我们只有一小部分市场可用,我们不知道它的指示性和可靠性如何。第二张图片(整体情绪)完全没有用。首先,反转经常发生在 "逆向 "趋势似乎应该继续的极端点。第二,制裁只是简单地重复价格(颠倒了,少了趋势)--反转任何振荡器,你会得到一个非常相似的画面。好吧,如果指标重复了价格,这意味着它的预测并不比价格图表本身更容易,对吗?第一张图片(玻璃和开仓)和利润率的价值更有价值,但它也是如此。非常值得怀疑。

你在很多事情上迷失了方向,你太肤浅了,对信息的认知不假思索。

 
Aleksey Vyazmikin#:

也许我没有解释清楚,但我想再次强调,我们的工作对象是原始样本,在CatBoost学习算法中,它被量化了一次,即假设我们有1000个预测器,我们把它们各自量化为10个段,结果我们有10000个段--进一步说,CatBoost算法随机拉出预测器,并通过边缘/量子进行分割/分裂,为了选择一个处于中间的量子,它需要建立3个不等式或创建8个叶子,其中7个叶子会说垃圾,一个叶子说有价值的信息。算法是否会建立这样一棵树也是不确定的,因为有爱的随机性,相邻的量子可以进入一个叶子。而且只让它成为一棵树。在我的方法中,一个不平等就足够了--2片叶子。即使所有的预测因子都被使用,并且每个预测因子都有1片有用的叶子,在创建模型时,组合的数量也会少很多。但重要的是,噪音也会减少,因为不会有那么多错误的样本分区来稳定你需要建立一个新的树(提升原理)。

也许你应该在一个单一决策树的例子上描述你的方法。不过,就其本身而言,提升已经建立了一个相当复杂的结构--精炼树序列。而你还在 做别的事情)。

Aleksey Vyazmikin#:

那么也许你需要以某种方式检查这个理论?据此,有一个最小的优势复现频率,在其增加之后,其消失的可能性大于其继续存在的可能性?

例如,我们每半年测量一次,有1.5年的优势--我们认为半年后仍然可以工作,如果已经是2.5年了,就没有意义了,采取它--它将停止工作的概率更高。

我对科学公式不擅长,你能告诉我如何进行这样的计算并检查假设吗?

类似于带有半衰期的放射性公式)我不认为人类活动可以用这种简单的公式来描述)你的 "优势频率 "会发生变化,很可能是某种非常不可预测的变化。

 
Aleksey Nikolayev#:

也许你应该以一棵决策树为例来阐述你的方法。然而,提升本身已经建立了一个相当复杂的结构--树的精炼序列。而你还在 做别的事情)。

是的,我理解,要立即理解这个方法并不容易。我打算更详细地描述它。而数据在提交给CatBoost之前已经被处理过了,但我想做我自己的算法,这将考虑到分裂时 "衰减 "的变化动态,正如你所说的。

Aleksey Nikolayev#:

有点像带有半衰期的放射性公式)我不认为人类活动可以用任何这样简单的公式来描述)你的 "优势频率 "很可能以某种高度不可预测的方式改变。

可能什么都没有,但你怎么检查呢?

 
mytarmailS#:

谢谢

你在很多事情上迷失了方向,太肤浅,对这些信息不加思考。

是的,我只是用这个工具工作了好几年,根本没有真正想清楚。

你到底不同意什么?

 
Aleksey Vyazmikin#:

是的,我们这么说吧。

不,现在我们把不等式规则的执行作为一个,看一下规则被样本触发时目标(比方说二元分类)的平均值,如果最初的平均值是,比方说,样本中的0.45,而只通过反应评估后是0.51,那么我们认为预测器(其图/量)的预测能力为0.06,即6%。

我们收集了很多这样的预测器,这些预测器已经是独立的二进制预测器,并使用它们来建立一个模型。

将所有这样的量子与所有(无论有无预测能力)的量子结合起来,的确不是一件快事,但如果用一个基础预测器来做,在此基础上确定一个有预测能力的量子,也许不是不合理的。

但是,即使在理论上,这种再培训也会比较少,因为可能的组合比全样本中的少。

尚待理解的是,为什么这种量子模式可以工作7年,然后突然停止......

我是否正确理解了你在做什么?:


1)我们得到1棵树。
2)每个节点最多可以给出10个分支(在图片中我们发现更少,就说10个分支),每个分支由1个量子产生(一个量子是一块预测器的10%:要么是百分数,要么是10%的振幅,取决于使用哪种量化方法)。
3) 在第一次分裂后,我们找到3个量子,这些量子随后导致了一个成功的叶子
4) 随后的分裂又找到了一些好的分裂/量子,导致了成功的叶子
5) 我们在成功的叶子前记住了成功的量子
6) 建立一个新的树,它只使用我们选择的量子作为预测器

用我们量化第一棵树的方法来做,用我们的脚本量化预测器,我们从100个预测器中得到1000个,它们已经是二进制的0或1。如果预测器的值在这个范围内,它=1,如果不在,它=0。
由于我们只选择成功的路径/量子,所有被选中的量子的值都=1。如果所有预测因子=1,那么新的树就不能学习。答案已经知道了。

还是没有必要再建一棵新树?如果预测器的值落在选定的量子范围内,我们会立即这样做吗?

 
vladavd#:

是的,我只是用这个工具工作了多年,所以我根本没有真正想过这个问题。

不同意什么,确切地说?

究竟用哪种工具?

 
mytarmailS#:

用什么样的工具?

那么,照片里有什么呢?玻璃和制裁。