文章 "运用 R-平方 评估策略余额曲线的品质" - 页 3

 
fxsaber:

本文通过 CLinReg::LRLine 考虑了线性回归 的误差。

证明

结果

符号不正确。替代的线性回归实现(CAlglib::LRBuild + CAlglib::LRUnpack)计算正确:

我不知道,我检查过是否相等,系统 LR 平方正好等于 R^2。至于符号--这里似乎很难出错。
 
fxsaber:

我错就错在这里。对我来说,这根本不是一个显而易见的说法

所以我决定通过动画实验来证实这一点(我不能只听你的一面之词)。

看起来这是真的。

这真的很酷。这个动画 应该插入到文章中!如果你不介意的话,我来做。

 

一般来说,所有统计都是胡利瓦的领域。

不过,这篇文章在两个方面很有意思:

  • 改进 R^2:改变 R^2,使随机游走指标生成均值为 0.0 的正态分布。
  • 研究非常非难的 arcosine 定理,研究随机趋势。随机趋势与市场趋势之间的相似性。

 
Vasiliy Sokolov:
我不知道,我检查过是否相等,系统 LR 平方正好等于 R^2。至于符号,似乎很难在这里出错。

你必须多次运行这段代码,直到你能看出符号的不同。图表专门显示了一个用于自我检查的图形 - R2。R 是您的计算算法。

您可以看到,R 有时与完全正确的 R2 不同。有必要调整一下你的回归计算方法,使符号一致,因为它比检查方法快一个数量级。

也许您应该提供显示错误的源数组。这样就会一目了然了。

Vasiliy Sokolov:

这很酷。应该在文章中插入这个动画!如果您不介意的话,我会做的。

如果您不介意的话,我可以帮您完成。然后,动画代码 将很好地完成您的正常状态,因为我是在灌木丛中匆忙用手完成的。和 gifku,分别,使更多的视觉。

 
fxsaber:

计算 R^2 的净值不应按AccountEquity ( == AccountBalance + Sum(Profit[i])) 计算,而应按Sum(Profit[i] / Lots[i]) 计算(对于单字符 TS)。

如果策略的 MM 基于 SL 大小,而 SL 本身是动态的,该怎么办?
两笔相邻的交易可以有不同的手数,因此,在获得相同点数的利润时,也可以有不同的手数。
虽然每笔交易的风险相同。

 
Andrey Khatimlianskii:


两笔相邻的交易可以有不同的手数,并相应地在获取相同点数时获利。
虽然每笔交易的风险相同。

我不明白这种情况下有什么变化。

 
fxsaber:

我不明白在这种情况下有什么区别。

是啊,我真笨。除以地段的结果是一样的。

 

作者完全不了解偶然过程。文章的所有结论都与偶然性的概念无关,误导了人们。


让我来解释一下这个观点。

文章一开始就给出了一个定义:

线性回归 是一个变量y 与另一个自变量x 的线性关系,用公式y = ax+b 表示。在这个公式中,a 是乘数,b 偏差系数。


线性回归不是 用公式表示的

y = ax+b是线性方程式

而是用公式表示

y = ax+b + 误差

误差必须是正态分布的,如果不是正态分布,就会产生许多细微差别,从而极大地限制了线性回归的应用。

必须认识到,与线性方程不同,线性回归系数 不是常量,而是偶然值,这一点极为重要。如果使用标准线性回归拟合(如 R),那么对于线性回归系数,总是会指定与该系数值的偏差以及概率(在 "没有证据证明该系数 "的零假设中的概率)。再次强调:与线性方程不同,线性回归系数可能根本不存在。这就是为什么文章中讨论的 R2 系数只有在回归系数不存在的概率低于 10%时才有意义。在金融序列中,我从未见过线性回归系数显著的情况,因此,可以使用这种线性回归。

[删除]  
fxsaber:

本文通过 CLinReg::LRLine 考虑了线性回归 的误差。

证明


结果


符号不正确。另一种线性回归实现(CAlglib::LRBuild + CAlglib::LRUnpack)计算正确:



是的,有一个错误,您是对的,最佳结果是在有损集中确定的,尽管有相同 R2 的正集。


您的版本一切正常:

 
fxsaber:

找到一个名为 "线性回归 "的线性函数的标准是方差 MNC,或者说是最大化皮尔逊 RQ 的绝对值,也就是MathAbs(LR)。 最大化MathAbs(LR) 与最大化R^2 相同,因为MathAbs(LR) = MathSqrt(R^2)。

离群值的 MNC 是MathMin((Sum(X[i] - LR[i])^2))

而我们想要的则完全不同--MathMin((Sum(X[i] - LR[i])^2* (i / Length)^2))。也就是说,即使区间开始时的误差较大,对结果的影响也可能小于区间结束时的误差较小。

经典 LR 并不考虑这一点,所有误差在这里都是 "相等 "的。

请在 R 中推荐一个给误差赋予不同权重的函数。