交易中的机器学习:理论、模型、实践和算法交易 - 页 3131

 
Aleksey Vyazmikin #:

你说得部分正确,但我不理解把所有东西都换来换去的哲学--如果没有不可挽回的漂移,比如周期性,这当然可行。

首先,我想对不同类型的漂移进行分类,然后逐一进行处理--如果知道了原因,我们就可以想办法消除它。如果不能消除,那就进行检测(探测)。

随机化可以消除试验和对照之间的偏差,然后再评估预测因子的影响

如果在此之前不消除偏差,那么这将是一种关联关系,而不是因果关系。


 
Maxim Dmitrievsky #:
能不能把这些奇妙的内容放在一个单独的主题里?

我受够了

 
mytarmailS #:

你能给我看看这样的东西吗?

如果真的那么常见的话

有什么难的?在不同尺度之间跳跃是我们以前做过的事 没什么秘密可言我在寻找更复杂的东西,而只有一种交易的画面并不能揭示整个画面的本质。
 
Renat Akhtyamov #:

最后

嗯,有了个开始。

接下来呢?

这是研究的结束))))
 
spiderman8811 #:
这有什么难的?在不同尺度之间跳跃是我们以前做过的事情,这里没有什么秘密。我要找的是更复杂的东西,而一幅只有一笔交易的画根本无法揭示整幅画的本质。

我明白了。

写信并不难

 
mytarmailS #:

我明白了。

当然,拼写并不难。

你看过我的自由职业作品吗?))))

 
spiderman8811 #:

您看过我的自由职业作品吗?))))

在看到自由职业者简介时,可以用什么方法来评估交易的质量?

 
Maxim Dmitrievsky #:

随机化可消除试验和对照之间的偏差,然后估算预测因子的影响

如果不事先消除偏差,偏差将是关联性的,而不是因果性的。


黄金标准

在上一课中,我们了解了关联与因果关系不同的原因和方式。我们还看到了关联关系成为因果关系的必要条件。

E|Y|T = 1] - E[Y|T = 0] = E[Y - Yo|T = 1] + {E[Yo|T = 1] - E[Yo|T = 0]}.调整。

回想一下,如果没有偏差,关联就会变成因果关系。如果 E[Yo T = 0] = E[Yo T = 1],就不会有偏差。换句话说,如果接受治疗的患者和对照组患者除治疗方法外情况相同或相似,那么两者之间的联系就是因果关系。或者,用更专业的术语来说

以上是图片的翻译。

首先--我不明白你为什么要把样本分成两个子样本。

其次--显然这里有一个特殊的术语,因果关系是对结果的直接影响--也许甚至不再是一种概率模式。关联关系要么是原因的激活剂,要么是关联特征,通常是概率性的。

我不明白这个公式--用人类的语言来说明问题?

但是,这些方法(UpLift)的要点是估算出专门影响目标的因素。我知道影响程度是要评估的。比方说,在我们的案例中,我们不知道这样一个因素,我们通过一切方法--我们得到了一些测量结果作为输出。您建议我们如何处理这些数据?排除不好的指标?
我们如何利用数据的逐渐漂移?

我不排除这个可能性,也许你已经想出了绝妙的办法,但我还没有抓住思路。

 
Aleksey Vyazmikin #:

黄金标准

在上一课中,我们了解了关联与因果关系不同的原因和区别。我们还看到了关联成为因果关系的必要条件。

E|Y|T = 1] - E[Y|T = 0] = E[Y - Yo|T = 1] + {E[Yo|T = 1] - E[Yo|T = 0]}.调整。

回想一下,如果没有偏差,关联就会变成因果关系。如果 E[Yo T = 0] = E[Yo T = 1],就不会有偏差。换句话说,如果接受治疗的患者和对照组患者除治疗方法外情况相同或相似,那么两者之间的联系就是因果关系。或者,用更专业的术语来说

以上是图片的翻译。

首先--我不明白你在什么时候想把样本分成两个子样本。

其次--显然这里有一个特殊的术语,因果关系是对结果的直接影响--也许甚至不再是一种概率模式。关联关系要么是原因的激活因素,要么是关联特征,通常具有概率意义。

我不明白这个公式--你能用人类的语言给我讲讲它的要点吗?

但是,这些方法(UpLift)的重点是估算对目标产生唯一影响的因素。我知道影响程度是要评估的。比方说,在我们的案例中,我们不知道这样一个因素,我们通过一切方法--我们得到了一些测量结果作为输出。您建议我们如何处理这些数据?
在数据逐渐漂移的情况下如何使用?

我没有排除,也许你已经想出了一些巧妙的办法,但我还没有抓住思路。

如果您不明白其中的任何符号,可以向 chatgpt 寻求公式解码。

Y|T = 1 测试组结果(有三元组)

Y|T = 0 - 对照组(无对照组)

Y--类标签,Y0,Y1--不含三聚氰胺和含三聚氰胺的类标签。

T - 模型中引入或未引入的三元组(包括预测因子)(1;0)

E - 期望值

在任何一点进行拆分,因为您要通过测试和三元组进行分割

如果不进行混合,就会得到有偏差的 ATE+ 偏差估计值

ATE 是暴露的平均治疗效果

困了,我可能在某些地方把字母搞混了,但逻辑应该是清楚的

 

顺便说一句,谷歌的吟游诗人比 Gpt 更合我的胃口。它可以谷歌,而且是免费的。

但它只支持美国或英国的英语和 vpn,在其他国家无法使用。

基本上,谁是 openAI,谁是谷歌。可能是不同的权重类别。