文章 "交易者的统计 - 烹饪宝书:假设"

 

新文章 交易者的统计 - 烹饪宝书:假设已发布:

本文讨论假设 - 数理统计的基本理念之一。各种假设需要进行检查,并利用数理统计方法的实例进行验证。使用非参数方法生成实际数据。Statistica 开发包和移植的 ALGLIB MQL5 数值分析库可用于处理数据。

所有交易者都愿意通过建立自己的交易系统,尽快或不久就能成长为分析师。他们长年累月地试图寻找市场的发展趋势并测试交易思路。可以根据不同的方法测试每一个思路, - 从策略测试员优化模式的最佳参数值搜索,转化为科学地 (有时是伪科学) 的市场研究。

在本文中,我建议研究统计假设- 一种用于研究和推理验证的统计分析工具。让我们来利用 Statistica 开发包测试不同的假设,以及使用移植的数值分析库 ALGLIB MQL5 的例子。

2. 测试假设。理论

被测试的假设称为零假设 (Н0)。一个竞争假设 (Н1) 是它的备选。它在 Н0 硬币的翻面, 即逻辑上它拒绝零假设。

试想一下,有一些交易系统的一组止损数据群落。我们将说明两个假设进行测试的基础。

Н0 – 平均止损值等于 30 点;

Н1 – 平均止损值不等于 30 点。

接受和拒绝假设的变种:

  1. Н0 为真并被接受;
  2. Н0 有错并拒绝赞成 Н1;
  3. Н0 为真但拒绝赞成 Н1;
  4. Н0 有错但被接受。

最后两个变种都与错误有关。

现在,显著级别值已经被指定。它是备选假设将被接受,而真正的假设是零假设 (第三变种) 的概率。此概率是首选最小化。

在我们的情况里,如果我们假定止损在平均不等于 30 点,即使它实际上是的时候,会发生这样的错误。

通常显著级别值 (α) 等于 0.05。这意味着,不超过百分之五的零假设测试统计值可以进入临界区。

在我们的情况里,测试统计值将在一个经典图表 (图例.1) 上进行评估。

图例.1 按正常概率规律分布的测试统计值

作者:Dennis Kirichenko

 
MetaQuotes:

已发表文章:《交易者的统计食谱--假设》:

  1. 有三种谎言:无辜的、厚颜无耻的和统计学的© 马克-吐温
  2. "Bleek悖论":我们进行多项实验,并计算每项实验的零假设概率。尽管单个实验的统计结果都是 "成功 "的,即每个实验拒绝零假设的概率 p < n,但经过元分析后,我们得到了相反的结果:p > n。
  3. 在某一特定领域应用统计学之前,有必要确定我们处理的是遍历环境。否则,它就会变成一场巧立名目的数字游戏。
 
Reshetov:
  1. "布莱克悖论":我们做了几个实验,并计算了每个实验的零假设概率。尽管单个实验的所有统计结果都是 "成功的",即每个实验拒绝零假设的概率 p < n,但经过元分析后,我们得到了相反的结果:p > n。

这是一个有趣的悖论。我在哪里可以学到更多这方面的知识?

2.在某一特定领域应用统计学之前,有必要确保我们处理的是一个遍历 环境。否则,我们就会在数字游戏中自作聪明。
请解释一下 "遍历 环境 "的含义。
 
denkir:

有趣的悖论。我在哪里可以找到更多相关信息?

请澄清你所说的遍历 环境是什么意思。

你的文章给了我双重印象。

另外。在本论坛中,询问对结果的假设性评估这一行为本身就非常重要。论坛上有很多人画出了一个马什卡,并假设情况就是这样,而不是区间内的马什卡。

减。

完全同意雷舍托夫的观点。您所说的都是指静态数列或接近于静态数列的数列,即随着时间的推移莫和方差变化很小的数列。但金融市场上没有这样的序列,而金融市场上的整个统计应用都是围绕时间序列 的静态性展开的。最有名的例子就是 ARIMA、ARCH 等。

您的随机序列的直方图如图 2 所示,从图中可以看出,该序列与静态序列的关系很弱,它是偏斜的,且尾部明显不同。这一点与你绘制的完全正态曲线的关系尤为明显。因此,你的推理完全不适用于你的例子。这个例子只是对列舍托夫思想的一个说明。

PS.统计学中最危险、最卑鄙的概念就是相关性。最好不要提及它。

 
faa1947:
......您所说的这些都是指静态数列或接近静态数列的数列,即随着时间的推移莫和方差变化很小的数列。而金融市场上不存在这样的序列,金融市场上统计学的全部应用都围绕着时间序列的静态性展开。最有名的例子就是 ARIMA、ARCH 等。

您的随机序列的直方图如图 2 所示,从图中可以看出,该序列与静态序列的关系很弱,它是偏斜的,且尾部明显不同。这一点与你绘制的完全正态曲线的关系尤为明显。因此,你的推理完全不适用于你的例子。这个例子说明了雷舍托夫的想法。

谢谢您的意见!

我将提出我的反驳意见。

静止性是时间 序列的一个特征。图 2 是一个变化序列。这篇文章并没有谈到时间 序列!虽然我同意时间是一个有用的特征.....。

据我所知,遍历性是指在研究....。

因此,我想指出重要的一点。如果系统(我们以金融时间 序列为例)不是静态的,我们仍然可以利用计量经济学 找到一个稳定的模型(如 GARCH)来描述模型的行为。我从中看到了系统的恒定性--根据模型的行为....。但条件是系统有一定的概率会 "打破 "模型...

 
denkir:

谢谢您的意见!

以下是我的反驳意见。

静止性是时间 序列的一个特征。图 2 是一个变化序列。这篇文章并没有谈到时间 序列!虽然我同意时间是一个有用的特征.....。

据我所知,遍历性是指所研究的系统具有一定的稳定性....。

因此,我想指出重要的一点。如果系统(我们以金融时间 序列为例)不是静态的,我们仍然可以利用计量经济学 找到一个稳定的模型(如 GARCH)来描述模型的行为。我从中看到了系统的恒定性--根据模型的行为....。但条件是系统有一定的概率会 "打破 "模型.....。

几年前,我在网站上发表了一篇文章,证实了一个大多数人完全无法接受的观点。也就是说。

有很多指标。每个人都认为,如果一个指标是画出来的,那么它就是一样的--毕竟,我们看到的就是这个东西。同时,大多数人不会想到,我们在现实中看到的东西可能并不存在!原因很简单。如果我们对指标进行回归,很容易发现其中一些系数的置信区间非常大,以至于根本无法谈论这样一个系数的值,而如果我们抛开这样一个有缺陷的系数,指标模式就会完全不同。当人们说:有真就有假,有假就有统计的时候,他们指的就是这种可悲的、非常不习惯的情况--没有什么是可以相信的,包括置信区间。

这就是为什么我离开参数模型,转而研究基于机器学习的模型。这里没有静态性问题,但过度训练的问题却十分突出。

 

我喜欢这篇文章。

是的,San Sanych 和 Reshetov 的评论是合理的--如果被比较的系统(或系统)改变了参数,测试结果将毫无用处。

但是,方法应用的演示本身就令人高兴。这在外汇交易中是很少见的!

作为一个完全将类似方法用于报价的人,我还想说点别的。可以事先检查环境是否均匀(在两个独立的大样本上),然后在一定程度上冷静地相信假设检验 的结果。这也可以通过同样的测试来实现。