Matstat 计量经济学 Matan

 
欢迎所有数理统计、计量经济学和数学分析的大师们。
就上述科学领域的各种主题进行建设性对话的主题。
欢迎进行充分的沟通!
 

关于交易、自动交易系统和交易策略测试的论坛

从理论到实践。第二部分

Aleksey Nikolayev, 2021.05.05 22:38

粗略地说,混合会削弱依赖性,但不会完全消除。
事实上,在实际应用方面,概率依赖是该定理最重要的部分。
当我在麻省理工学院看了一个针对工程师的youtube理论家课程时,都是关于这个的。


你是指决定系数r2吗?
还是按概率依赖的其他东西?

我实时考虑r2,以估计变量x对y的 "影响强度 "
,令人惊讶的是,在一些货币系列上,它在高值时保持相当稳定

r2

 
难道概率还不够吗?如果这是概率理论...
 
Dmitry Fedoseev:
仅仅是概率还不够吗?如果是概率论...

我想澄清在这种情况下是指哪个评价标准。
如果是常规的相关关系,那么与r2他们的计算方法有差异,相应的估计也不同。
在统计学中,他们通常建议使用r2作为更可靠的方法。

r

十分钟后

rr

 
Roman:

你是指决定系数r2吗?
或者你说的概率依赖是指其他的东西?

概率(随机)依赖是理论化和Matstat中最重要的概念之一。这个概念(通过条件概率)首先被定义为随机事件,然后以条件分布的形式转移到随机变量。依赖性是指条件分布与无条件分布的不一致性,而独立性是指它们的重合性。对依赖性的一个流行解释是- 知道一个c.c.得到什么价值,就能得到另一个c.c.的价值信息。依赖性位于其两个极端状态之间--独立和刚性的功能连接。

一般意义上讲,我们总是从随机变量的联合分布开始,在此基础上构建各种具体的依赖度量。这些可以是共线性、相互熵、相关性等。

相关性、R2等只有在联合分布为多变量正态时才合理适用。在实践中,当常态性不确定时,也会应用它们(由于简单),但这时它们的作用只能由经验决定。

 
Aleksey Nikolayev:

概率(随机性)是理论研究和数学统计中最重要的概念之一。这个概念(通过条件概率)首先为随机事件定义,然后以条件分布的形式转移到随机变量。依赖性是指条件分布与无条件分布的不一致性,而独立性是指它们的重合性。对依赖性的一个流行解释是- 知道一个c.c.得到什么价值,就能得到另一个c.c.的价值信息。依赖性位于其两个极端状态之间--独立和刚性的功能连接。

一般意义上说,我们总是从随机变量的联合分布开始,在此基础上构建各种具体的依赖度量。这些可以是共线性、相互熵、相关性等。

相关性、R2等只有在联合分布为多变量正态时才合理适用。在实践中,当没有确定的常态性时,它们也被应用(由于简单),但此时它们的效用只由经验决定。

啊,这是一个棘手的分布,我总是忘记它 ))
所以所有的统计模型都需要这个标准?
由于价格序列不存在正态性,因此开始了准备数据的折磨,
,以便以某种方式使它们更接近于正态分布,而不失去原来的属性。

由此产生了如何准备这些数据的问题。
按照我的理解,标准化、cusum、派生等并不能带来高质量的结果。
所以他们开始变瘦或什么的。一般来说有哪些方法?

所以我再次得出结论,为统计模型准备定性数据是一个巨大的研究课题。
我搜索了关于这个主题的教程,但什么也没找到,bigdata、MO、neuronka到处都是,但如何为它们准备定性数据,由于某些原因,没有披露。

 

我只是不能理解以下的反常现象,为什么会发生这种情况。
我计算了一个正交模型,它应该比MNC更好。
我得到了起始系数。
然后通过中位数算法调整模型参数(系数),即对离群值的一种稳健性。
该模型定性地描述了初始系列。

蓝色--原创系列。
灰色是模型。

p1

但在其中一个历史部分,我观察到了一个分歧,这个分歧进一步收敛到上面的截图中的确切位置

p2


我看不到真相,为什么会发生这种情况?是什么促成了它?
系数在每一步都会重新计算,并且应该适合(x)和(y)
,这是一个拟合错误吗?我明白,在一个或两个甚至三个计算步骤中可能会出现错误,
,但似乎很奇怪,错误应该持续这么久。也许这不是一个装配错误?是别的东西吗?

 
Roman:

我只是不能理解以下的反常现象,为什么会发生这种情况。
我计算了一个正交模型,它应该比MNC更好。
我得到了起始系数。
然后通过中位数算法调整模型参数(系数),即对离群值的一种稳健性。
该模型定性地描述了初始系列。

蓝色--原创系列。
灰色是模型。



但在其中一个历史部分,我观察到了一个分歧,这个分歧进一步收敛到上面的截图中的确切位置


我看不到真相,为什么会发生这种情况?那么是什么促成了这种情况呢?
系数在每一步都会重新计算,并且应该适合(x)和(y)
,这是一个拟合错误吗?我明白,在一个或两个甚至三个计算步骤中可能会出现错误,
,但似乎很奇怪,错误应该持续这么久。也许这不是一个装配错误?是别的东西吗?

我只能建议找到一些实现你的模型(或类似的模型)的统计包,看看它在你的数据中是如何表现的。这可能有助于你了解问题是模型有问题还是执行错误。

 
Roman:

由于价格序列中没有正态性,准备数据的曲折任务,
,就是以某种方式近似于正态分布而不失去原有的属性。

对数增量就不能用了?
 
Aleksey Nikolayev:

我所能建议的是找到一个能实现你的模型的统计包(或与之相似的),看看它在你的数据上的表现。它可能有助于了解问题是模型有问题还是执行错误。

谢谢你的想法,我没有意识到这一点。

 
secret:
增量的对数 - 不够好?

是的,这基本上是我正在做的一个或多或少的好选择。
在另一个类似的模型上,我有时也会观察到小的分歧,如发散。
但并不像上面的截图那么长,而是相当短的时间。这让我想知道为什么会发生这样的情况。
我曾尝试过这种模式,看到了更长时间的分歧。

所以我不明白这种分歧从何而来。不是一个正确的模型或低质量的源数据。
我不明白行动的逻辑。
要么我应该把初始数据大约调整到正常,
,要么我应该铲除不同的模型。
但要尽量先写好这个模型,不是那么容易就能检查出来并扔掉的 ))

原因: