评估过滤器在建设ATC中的有效性 - 页 4

 
-Aleks-:

交易的减少肯定会导致策略(集)的评价指标发生变化,这就是它们能改变多少的问题。

例如,在没有过滤器的情况下,对整个基本参数范围进行优化,平均利润为10万,损失(亏损的存款)为35%,平均交易次数为500次。 应用过滤器后,平均利润为1万,损失为5%,平均交易次数为250次--利润减少了10倍,坏结果的百分比只减少了7倍,而交易次数减少了2倍--是好还是坏?哪一个是更优先的?

在统计学中,有这样一种东西,即样本的比较。

假设进行了一个实验。该主题是研究某些因素的影响。在这种情况下,它是一个过滤器的效果。

两个样本进行了比较。第一个样本是所有交易的初始结果集,第二个样本是过滤后的结果。

空白假设是过滤器没有起作用,替代假设是过滤器确实过滤掉了一些东西。

亚历克斯,我认为,错过了估计的最初步骤--绘制所有交易结果的分布图,寻找异常值,然后将其删除。否则像 "平均利润 "这样的指标就没有代表性。
 

Dennis Kirichenko:

亚历克斯,我认为,估计的最初步骤是缺失的--建立所有交易结果的分布,寻找异常值,然后去除它们。否则,"平均利润 "这样的指标就没有代表性。

你建议如何寻找这些变化?我还没有完全理解它是关于什么的,但我怀疑它是关于数据规范化的?如果只是要筛选出不符合逻辑的结果,不符合战略理论的框架,那么就可以认为已经采取了这一步骤,但如果是要排除那些非常突出的结果,那么就必须有排除的理由。

相反,我并不排除一些有吸引力的、但可以接受的变体,但我的想法是,市场是可以变化的(作为一项规则,其行为的多样性在不同的工具上是可见的)。

 
-Aleks-:

你建议如何寻找这些异常值?我不完全理解它是关于什么的,但我怀疑它是关于数据标准化的?如果只是为了筛选出不符合战略理论框架的不合逻辑的结果,那么就暗示已经采取了这一步骤,但如果是为了排除高度突出的 结果,那么就需要为其排除提供理由......

所以有一个统计程序。是的,没错--我们摆脱了人口中那些价值过大或过小的元素。
...相反,我试图不排除低吸引力,但可以接受的选择,但我的想法是,市场是波动的(通常,其行为的多样性在不同的工具上是可见的)。
是的,不稳定。但这是另一个问题。这里的想法很简单--我们需要评估过滤器是否影响策略的表现。

我认为,从方法上讲,更正确的做法不是寻找一些指标来描述优化的结果,然后用它们来玩,而是比较两个样本--之前和之后 :-)

而且样本可以由任何结果标准组成。我在上面写了关于交易的结果。但你也可以采取其他的...顺便说一下,这是一个有趣的任务...
 
Dennis Kirichenko:
所以有一个统计程序。是的,没错--摆脱人口元素,其数值过大或过小。是的,它是可变的。但这是另一个问题。这里的想法很简单--我们需要评估过滤器是否影响策略的表现。

因此,我实际上是通过对所有指标进行平均化来实现的--这样离群值就被拉平了,对吗?我对优化结果做了一个卷积(分为两个属性--但这是为了清晰--其中一个可以去掉--即其中一个选项会明显更差),并对卷积进行比较(有一些指标的最大值和最小值及其结构为离群值的百分比--而你仍然没有看文件),只是为了拉平排放的影响。此外,我通过买入和卖出分别对13个货币对进行了综合比较。 结果我比较了13*2*2=52个优化的平均结果。如果过滤器在全球范围内起作用,它应该对所有货币对都起作用,也就是说,应该有一个积极的趋势。

Dennis Kirichenko:

我认为从方法论上讲,不是寻找一些指标来描述优化结果,然后再去玩弄它们,而是比较两个样本--之前和之后 :-)

而且样本可以由任何结果指标组成。我在上面写了关于交易的结果。但你也可以采取其他的...顺便说一下,这是一个有趣的任务...

样品不是全部,而是一部分--采取什么属性来选择这部分?

如果真的有兴趣,我准备把优化的结果张贴出来进行详细的分析--例如一对没有过滤器和有过滤器的数据--可比性。



 
Так я это и делаю фактически путем усреднения всех показателей - таким образом выбросы нивелируются, разве нет? 
不,排放量已被考虑在内。而且它们可以极大地影响平均水平。这从根本上说是错误的。

然后,重要的是要看到样本分布的形状。如果它将与正常情况有很大不同,例如有几个峰值,那就不好了...就这样,总而言之......。

样本不是全部,而是其中的一部分--应该用什么属性来区分这部分?

如果真的有兴趣,我准备把优化的结果张贴出来进行详细的分析--例如,一对没有过滤器和有过滤器的数据--可比的数据。

这里的抽样调查是因为,根据定义,并没有一个完整的普通人群。简而言之,在这里,它就是它--我们只看到现象的一部分(交易历史)。

是的,你可以看一下。

亚历克斯,首先你需要2个样本(优化结果):

1)这些是没有过滤器的通过;

2)这些是有过滤器的通过(只有这里的过滤器参数不应该被优化,而是应该被固定)。
 
Dennis Kirichenko:
不,异常值被考虑在内。而且它们可以极大地影响平均水平。而这从根本上是错误的。

如果排放不是偶然的呢?

丹尼斯-基里琴科

是的,你可以看到。

亚历克斯,首先你需要2个样本(优化结果):

1)这些是没有过滤器的通过;

2)这些是有过滤器的通过(只有这里的过滤器参数不应该被优化,而是应该被固定)。

该文件包含没有过滤的优化结果和有过滤的7个过滤变量位置的优化结果--分成不同的表,所以它们的解析应该没有问题,不同的设置也会给过滤多少的问题一个答案。

挑选了最差的选项--2013-2015年的欧元兑美元M15货币对--只买。

没有过滤。

不含过滤器

有滤波器 - 滤波器的7个位置切换边界在图表上是可以区分的。

附加的文件:
 

丹尼斯-基里琴科 ,是有足够的数据还是你的兴趣已经消退?

 
-Aleks-:

丹尼斯-基里琴科 ,是有足够的数据还是你的兴趣已经消退?

我有一天会看的,对不起,我一直很忙......
 
Dennis Kirichenko:
我那天看了一下,对不起,我一直很忙......

很好,我认为这将是有趣的,有内容的!

 
让我们看看"净利润 " 一栏,第一张标准表(尽管标准可能更正确)。

我们先来计算一下描述性统计。特别是,我想知道是否有异常值。





有异常值。它涉及最亏损的交易,损失超过58,351.76。

柱状图。



我们的想法是清除排放物并进一步分析它们。但这里有不少离群索居者。而删除它们更多的是一种方法上的技巧。根据目前的形式,有异常值的分布似乎不是正常的,这意味着有一些因素比其他因素对结果的影响更大。