交易中的机器学习:理论、模型、实践和算法交易 - 页 3091

 
 
Forester #:

目前在第 8 页。而这还只是介绍))))
看来,这将是夏普(Sharpe)的交叉验证比较(但他们写道,您可以使用任何其他指标)。

据我所知,有 4 个参数需要优化

summary(my_pbo)
Performance function Omega with threshold 1

      p_bo      slope       ar^2     p_loss 
 0.3714286  1.6891000 -0.0140000  0.3430000 
  • p_bo 回溯测试中过度训练的概率)应接近 0,这表明过度训练的风险较低。
  • sope 线性回归的斜率系数)应接近 1,这表示训练子集和测试子集的性能指标值之间有很强的线性关系。
  • ar^2 调整后的判定系数)应接近 1,表明线性回归的准确性良好。
  • p_loss 测试子集的性能指标值低于给定阈值的比例)应接近 0,表明测试子集的大多数性能指标值都高于给定阈值。

但应注意的是,这些值可能取决于所选的性能指标和阈值


需要多标准帕累托前后多标准优化

 
mytarmailS #:

据我所知,有 4 个参数需要优化

  • p_bo 回溯测试中过度训练的概率)应接近 0,表示过度训练的风险较低。
  • slope 线性回归斜率系数)应接近 1,表示训练子集和测试子集的性能指标值之间有很强的线性关系。
  • ar^2 调整后的判定系数)应接近 1,表明线性回归的准确性良好。
  • p_loss 测试子集的性能指标值低于给定阈值的比例)应接近 0,表明测试子集的大多数性能指标值都高于给定阈值。

但应注意的是,这些值可能取决于所选的性能指标和阈值

由于篇幅太短,我们无法理解这些参数是什么。以下是文章第 13 页的更多内容(如果软件包完全重现了文章中的方法,但可能添加/删减了其他内容)

Overfit 统计
第 2 节中引入的框架允许我们 通过以下四种互补分析描述策略回溯测试可靠性-

1. 回溯测试过拟合概率 (PBO):
被选为最优 IS 的
模型配置表现低于 N 模型配置的 OOS概率
2. 性能下降:这决定了更高的每
性能 IS 在多大程度 上会导致更低的 OOS 性能,这种情况与 Bailey 等人[1]中讨论的记忆效应有关
[1].
3. 损失概率:被选为最佳
IS模型 造成OOS 损失概率
4. 随机优势 该分析确定用于选择 IS 策略程序--
dure是否优于 N 备选 方案随机选择
一种模型配置

下文将详细讨论每个项目。

 
Forester #:

下面是文章第 13 页的更多内容(如果软件包完全重现了文章中的方法,但可能添加/删减了其他内容)。

软件包太糟糕了,多年来从未见过这样的软件包

代码糟糕透顶

文档几乎毫无用处

我不明白它是怎么进入 CRAN 的。


我还是不明白,是有一个交易系统被调查分成了几批,还是有几个 TS(在这个库中)?

 
mytarmailS #:

我还是不明白,一个交易系统是分批研究的,还是几个 TS(在这个库中)。

从一组使用不同参数/超参数获得的模型中选择最佳模型。输入是一个矩阵,其中每一列都是一个模型的预测。

也许不是。我也还没想明白
 
Forester #:

从不同参数/超参数下获得的一组模型中选出最佳模型。输入是一个矩阵,其中每一列都是一个模型的预测结果。

我已经弄明白了。

我不明白如何处理结果

我给出了一列(一个 TS)

结果

summary(my_pbo)
Performance function Omega with threshold 1

  p_bo  slope   ar^2 p_loss 
0.0000 2.2673 0.9700 0.3710 

我输入 5 列(5 个 TC)

我也得到一行。

summary(my_pbo)
Performance function Omega with threshold 1

     p_bo     slope      ar^2    p_loss 
0.3428571 1.9081000 0.0440000 0.2860000 

应该有 5 行,或者如果是最佳 TS 的结果,应该有一个最佳 TS 的索引......


我要杀了这个作者

 
Forester #:

不同参数/超参数下 获得的一组模型中选出最佳模型 输入是一个矩阵,其中每一列都是其中一个模型的预测结果。

也许不是。我也还没想明白

可以解释为从不同市场部分 (参数/超参数)获取 TS 利润回报 ????



不同市场部分 == 参数/超参数

 
mytarmailS #:

可以解释为从市场的不同部分 (参数/超参数)获取 TC 利润回报 ????

正是利润回报。

mytarmailS#:

市场的不同部分 == 参数/超参数

正如我所理解的设置:不同时期的 MA、SL 等。

 
mytarmailS #:

我还得到一行

应该有 5 行,或者如果是最好的 TC,应该有一个最好的索引......

因此,您可以得到对模型(可能也包括对预测数据和目标数据)的总体评价
一个坏的模型会产生这样的结果(只有 17%的 OOS 结果高于 0)。

好模型 - 95% 的 OOS 结果高于 0

 
Forester #:

回返者已经抵达。

你知道,有得有失,对吧?

因此,当职位空缺时,我们会考虑各州的回返者。

Forester#

我的理解是设置:不同时期的 MA、SL 等。

与其说是 TS 的不同设置,不如说是在不同的区域进行交易,我认为这可以划等号。

原因: