交易者的统计 - 烹饪宝书：假设

MetaTrader 5 — 统计分析 | 13 二月 2015, 11:59

2 598

介绍

所有交易者都愿意通过建立自己的交易系统，尽快或不久就能成长为分析师。他们长年累月地试图寻找市场的发展趋势并测试交易思路。可以根据不同的方法测试每一个思路， - 从策略测试员优化模式的最佳参数值搜索，转化为科学地 (有时是伪科学) 的市场研究。

在本文中，我建议研究统计假设- 一种用于研究和推理验证的统计分析工具。让我们来利用 Statistica 开发包测试不同的假设，以及使用移植的数值分析库 ALGLIB MQL5 的例子。

1. 假设的概念

"统计假设" 的概念有若干定义。它们当中的一些涉及到有关正在研讨的对象或现象的统计特性的假设。

统计假设是有关概率规律，就一个问题的现象提出的假设。

其它定义点明了统计特性必须与一些随机变量的分布或这些分布的参数有关。

统计假设是关于统计分布参数或者随机变量分布原理的假设。

在数理统计的文献中，"假设" 的概念被解释为第二种方式。那么我们就可以区分:

参数假设 (有关分布参数值，或关于两个分布参数值的比较的假设);
非参数假设 (有关随机值分布类型的假设)。

在接下来的章节中，我们将讨论一种检验假设的方法。

2. 测试假设。理论

被测试的假设称为零假设 (Н0)。一个竞争假设 (Н1) 是它的备选。它在 Н0 硬币的翻面, 即逻辑上它拒绝零假设。

试想一下，有一些交易系统的一组止损数据群落。我们将说明两个假设进行测试的基础。

Н0 – 平均止损值等于 30 点;

Н1 – 平均止损值不等于 30 点。

接受和拒绝假设的变种:

Н0 为真并被接受;
Н0 有错并拒绝赞成 Н1;
Н0 为真但拒绝赞成 Н1;
Н0 有错但被接受。

最后两个变种都与错误有关。

现在，显著级别值已经被指定。它是备选假设将被接受，而真正的假设是零假设 (第三变种) 的概率。此概率是首选最小化。

在我们的情况里，如果我们假定止损在平均不等于 30 点，即使它实际上是的时候，会发生这样的错误。

通常显著级别值 (α) 等于 0.05。这意味着，不超过百分之五的零假设测试统计值可以进入临界区。

在我们的情况里，测试统计值将在一个经典图表 (图例.1) 上进行评估。

图例.1 按正常概率规律分布的测试统计值

图例.1. 按正常概率规律分布的测试统计值

若零假设被接受，测试统计值不应该到达红色区域。出于示例目的，让我们假设该测试统计值是正态分布。

每次测试都有自己的公式来计算测试统计值。

变种 4 意味着第二个类型 (β) 有个错误。在我们的情况里，如果我们假定止损在平均等于 30 点，不过实际不等于该点数时，会发生这样的错误。

3. 统计假设测试的例子

用于示例的源数据保存在 Data.xls 文件里。

3.1. 依赖的样本测试

想象一下以下的情形。假设有一个交易系统生成交易群落。让我们从盈利交易中以 100 单位的交易量进行取样。源数据在 "Profits" 表单里。

除去异常数值之后，利润样本的描述性统计列于表1:

盈利样本统计

表.1。盈利样本统计

样本直方图如下所示 (图例.2)。

图例.2 样本直方图

图例.2. 盈利样本直方图

平均值是 83.4 点，中位数为 83 点。

如果入场点变化了几个点，会发生什么？例如，提高入场价格的挂单可以在出现交易信号后放置。

它将如何影响结果？这个问题可以用统计假设回答。

在 Statistica 开发包里我们正式地检查，是否样本并非取自一般群落:

如果我们将入场点改变 15 点, 我们将接收到 NewProfits 样本。理想的结果图片应如下 (图例.3)。

图例.3 盈利图表和新盈利样本

图例.3. 盈利图表和 NewProfits 样本

由于样本中位数的不同，备选假设被接受的概率很高。

此图片, 无论如何, 很难获得，因为市场上没有更好的价格。在我的情况里，第二样本包括入场价格更改后的 84 笔交易。其它 15 笔交易根本没有执行。此修正样本将被命名为 NewProfitsReal。

在 "带胡须的箱子" 类型的图形里，两个样本之间没有很大不同。

图例.4 盈利和 NewProfitsReal 样本图形

图例.4. 盈利和 NewProfitsReal 样本图形

让我们用有关的样本进行一次非参数 Wilcoxon 标记等级测试。

结果在表 2:

盈利和 NewProfitsReal 样本的 Wilcoxon 测试结果

表格 2. 盈利和 NewProfitsReal 样本的 Wilcoxon 测试结果

显著级别值非常高，这有利于零假设。

这样我们就可以说，改变入场点不影响系统的产率。它是相对而言。从绝对数字来看，系统因为错过了入场点，从而利润减少。

Wilcoxon 测试可以用 MQL5 程序进行。虽然它与指定 m 值的分布中值相比，这种差异并不显著。

我们继续检查:

ALGLIB 库包括以下过程: CAlglib::WilcoxonSignedRankTest()。它给出了一个三种测试类型的结果: 双侧, 左侧和右侧。

脚本 test_profits.mq5 提供了一个计算例程。日志 "专家" 对于 NewProfitsReal 样本有如下结果:

OO      0       12:04:08.814    test_profits (EURUSD.e,H1)      p-value for the two-sided test: 0.7472
HD      0       12:04:08.814    test_profits (EURUSD.e,H1)      p-value for the left-sided test: 0.6285
CM      0       12:04:08.814    test_profits (EURUSD.e,H1)      p-value for the right-sided test: 0.3736

左侧测试的形式:

此处我们检查备选，因为 NewProfitsReal 样本的中值可以大于或等于 83。错误拒绝 H0 的概率是 0.63。所以 H0 被接受。

右侧测试如下所示:

在测试中我们检查备选，即 NewProfitsReal 样本的中值可以小于或等于 83。错误拒绝 H0 的概率是 0.37。所以 H0 被接受。

3.2. 测试独立样本

假设我们要检查不同经纪公司处理交易订单的速度有多迅速，以及经纪公司之间有关的交易指令执行时间是否有差异。

这样，有两个源数据的样品用于分析。每个样品最初包含 50 个观测点。在删除异常情况之后, 48 观测点保留在第一个样本里 (经纪公司 А), 以及在第二个 (经纪公司 B) 里有 49 个观测点。数据可在 "ExecutionTime" 表单里找到。

我们继续检查:

让我们图片上表示一个样本指数 (图例.5)。根据图形，中位数的值不同，虽然并不显著。

图例.5 经纪公司 A 和 B 的数据样本图形

图例.5. 经纪公司 A 和 B 的数据样本图形

因为我们不知道每个样本所属的分布，我们将参照非参数测试进行比较。

例如，让我们实施 Mann — Whitney U-测试 (表 3)。它被认为最翔实。

Mann — Whitney U-经纪公司 A 和 B 的数据样本测试结果

表 3. Mann — Whitney U-经纪公司 A 和 B 的数据样本测试结果

结论: 检测结果不同，因此有关样本平等的零假设拒绝赞成 Н1。

Mann — Whitney U-测试可以用 MQL5 程序进行。在 ALGLIB 库里有 CAlglib:: MannWhitneyUTest() 过程。它给出了一个三种测试类型的结果: 双侧, 左侧和右侧。

脚本 test_time_execution.mq5 提供了一个计算例程。日志 "专家" 里有以下结果可以用于样本比较:

MR      0       12:55:08.577    test_time_execution (EURUSD.e,H1)       p-value for the two sided test: 0.0001
QF      0       12:55:08.577    test_time_execution (EURUSD.e,H1)       p-value for the left-sided test: 1.0000
PF      0       12:55:08.577    test_time_execution (EURUSD.e,H1)       p-value for the right-sided test: 0.0001

左侧测试的形式:

零假设是经纪公司 A 的数据样本可以大于或等于经纪公司 B 的数据样本。备选是其被拒。错误拒绝 H0 的概率是 1.0。所以 H0 被接受。

右侧测试如下所示:

零假设是经纪公司 A 的数据样本可以小于或等于经纪公司 B 的数据样本。备选是其被拒。

错误拒绝 H0 的概率是 0.0。所以 H0 拒绝赞成 Н1。

3.3. 关联测试

想象一个策略组合。目标是降低组合里的策略数量。

选择标准如下: 如果两个策略同样比较止损, 则策略之一将被从组合里删除。让我们取两个带止损的不同系统作为两个样本。假设: 系统入场反应方式相同，但离场反应不同。

我们将使用 Spearman 的等级-顺序关联测试。此处有三个样本在数据文件 "Correlation" 表单里。

检查是否关联系数等于零:

比较 Stops1-Stops2 样本对将给出以下结果 (表 4)。

对于 Stops1 和 Stops2 样本的 Spearman 等级-顺序关联测试

表 4. 对于 Stops1 和 Stops2 样本的 Spearman 等级-顺序关联测试

在此情况下，关于样本元素之间缺乏关联的零假设不能拒绝赞成备选。所以它被接受。

图例.6 中的图形显示出数据不能形成任何明显配置。相反，数据分散在整个平面图。

图例.6 Stops1 和 Stops2 样本的散布图

图例.6. Stops1 和 Stops2 样本的散布图

Stops1-Stops3 样本之间的关系检查结果显示在表 5:

对于 Stops1 和 Stops3 样本的 Spearman 等级-顺序关联测试结果

表 5. 对于 Stops1 和 Stops3 样本的 Spearman 等级-顺序关联测试结果

在此情况下, 零假设被拒因为错误概率太低。

因此，有关存在关系的备选被接受。关系如下所示 (图例.7)。

图例.7 Stops1 和 Stops3 样本的散布图

图例.7. Stops1 和 Stops3 样本的散布图

确认结果的 MQL5 代码。test_correlation.mq5 包含一个计算例程。

ALGLIB 库包括过程 CAlglib::SpearmanRankCorrelationSignificance(), 它实现了 Spearman 等级-顺序关联性系数显著性测试。

日志包括以下记录:

OO      0       12:57:43.545    test_correlation (EURUSD.e,H1)  ---===Samples Stops1 and Stops2===---
GO      0       12:57:43.545    test_correlation (EURUSD.e,H1)  p-value for the two-sided test: 0.9840
KK      0       12:57:43.545    test_correlation (EURUSD.e,H1)  p-value for the left-sided test: 0.4920
JJ      0       12:57:43.545    test_correlation (EURUSD.e,H1)  p-value for the right-sided test: 0.5080
DM      0       12:57:43.545    test_correlation (EURUSD.e,H1)  
HJ      0       12:57:43.545    test_correlation (EURUSD.e,H1)  ---===Samples Stops1 and Stops3===---
NS      0       12:57:43.545    test_correlation (EURUSD.e,H1)  p-value for the two-sided test: 0.0002
RO      0       12:57:43.545    test_correlation (EURUSD.e,H1)  p-value for the left-sided test: 0.9999
FG      0       12:57:43.545    test_correlation (EURUSD.e,H1)  p-value for the right-sided test: 0.0001

左侧测试的形式:

在此测试中，变量之间存在非负关联 (即, 关联系数为零或负) 的零假设被验证。

左侧测试表明 Stops1-Stops2 样本对的零假设被接受。左侧测试表明 Stops1-Stops3 样本对的零假设也被接受。一个逻辑问题会问 "为什么 Stops1-Stops2 样本之间没连接, 而 Stops1-Stops3 之间则有？" 其原因是检查结果 "大于或等于零"。在第一种情况下, "等于零" 对于 H0 很重要, 且在第二情况下, 则是 "大于零"。

右侧测试如下所示:

此处，是不是负关联的零假设被测试。

对于样本对 Stops1-Stops2, 右侧测试显示零假设被接受。对于样本对 Stops1-Stops3 右侧测试显示零假设被拒。

最后一个注释。测试显示，样本 Stops1-Stops3 之间有正相关概率。这种关联的强度是平均水平。因此它将由交易者决定是否拒绝策略 1 或 3。

结论

在本文中，我尝试用实例表明，量化变量可以用数理统计进行评估。我希望新晋开发员能发现这篇文章对他们未来的交易系统非常有用。我也希望有关使用数理统计方法的文章系列能够继续。

库文件 ALGLIB 需要单独下载。

本文由MetaQuotes Ltd译自俄文
原文地址： https://www.mql5.com/ru/articles/1240

附加的文件 |

下载ZIP

test_correlation.mq5 (5.55 KB)

test_profits.mq5 (3.59 KB)

test_time_execution.mq5 (3.84 KB)

data.zip (12.04 KB)

注意: MetaQuotes Ltd.将保留所有关于这些材料的权利。全部或部分复制或者转载这些材料将被禁止。

本文由网站的一位用户撰写，反映了他们的个人观点。MetaQuotes Ltd 不对所提供信息的准确性负责，也不对因使用所述解决方案、策略或建议而产生的任何后果负责。

Denis Kirichenko

Complicated projects involving statistical & econometric analysis methodology are of special interest.

Nothing makes me glad but a well-written Requirements Specification. It accounts for, at a minimum, 60-80% of its future successful realization. I'm asking my customers to state their trade ideas clearly and explicitly. As for me I'm always ready to discuss and realize your ideas.

该作者的其他文章

最近评论 | 前往讨论 (6)

Denis Kirichenko | 2 12月 2014 在 14:18

Reshetov:

"布莱克悖论"：我们做了几个实验，并计算了每个实验的零假设概率。尽管单个实验的所有统计结果都是 "成功的"，即每个实验拒绝零假设的概率 p < n，但经过元分析后，我们得到了相反的结果：p > n。

这是一个有趣的悖论。我在哪里可以学到更多这方面的知识？

2.在某一特定领域应用统计学之前，有必要确保我们处理的是一个遍历环境。否则，我们就会在数字游戏中自作聪明。

请解释一下 "遍历环境 "的含义。

СанСаныч Фоменко | 2 12月 2014 在 14:37

denkir:

有趣的悖论。我在哪里可以找到更多相关信息？

请澄清你所说的遍历环境是什么意思。

你的文章给了我双重印象。

另外。在本论坛中，询问对结果的假设性评估这一行为本身就非常重要。论坛上有很多人画出了一个马什卡，并假设情况就是这样，而不是区间内的马什卡。

减。

完全同意雷舍托夫的观点。您所说的都是指静态数列或接近于静态数列的数列，即随着时间的推移莫和方差变化很小的数列。但金融市场上没有这样的序列，而金融市场上的整个统计应用都是围绕时间序列的静态性展开的。最有名的例子就是 ARIMA、ARCH 等。

您的随机序列的直方图如图 2 所示，从图中可以看出，该序列与静态序列的关系很弱，它是偏斜的，且尾部明显不同。这一点与你绘制的完全正态曲线的关系尤为明显。因此，你的推理完全不适用于你的例子。这个例子只是对列舍托夫思想的一个说明。

PS.统计学中最危险、最卑鄙的概念就是相关性。最好不要提及它。

Denis Kirichenko | 2 12月 2014 在 14:53

faa1947:
......您所说的这些都是指静态数列或接近静态数列的数列，即随着时间的推移莫和方差变化很小的数列。而金融市场上不存在这样的序列，金融市场上统计学的全部应用都围绕着时间序列的静态性展开。最有名的例子就是 ARIMA、ARCH 等。

您的随机序列的直方图如图 2 所示，从图中可以看出，该序列与静态序列的关系很弱，它是偏斜的，且尾部明显不同。这一点与你绘制的完全正态曲线的关系尤为明显。因此，你的推理完全不适用于你的例子。这个例子说明了雷舍托夫的想法。

谢谢您的意见！

我将提出我的反驳意见。

静止性是时间序列的一个特征。图 2 是一个变化序列。这篇文章并没有谈到时间序列！虽然我同意时间是一个有用的特征.....。

据我所知，遍历性是指在研究....。

因此，我想指出重要的一点。如果系统（我们以金融时间序列为例）不是静态的，我们仍然可以利用计量经济学找到一个稳定的模型（如 GARCH）来描述模型的行为。我从中看到了系统的恒定性--根据模型的行为....。但条件是系统有一定的概率会 "打破 "模型...

СанСаныч Фоменко | 2 12月 2014 在 15:26

denkir:

谢谢您的意见！

以下是我的反驳意见。

静止性是时间序列的一个特征。图 2 是一个变化序列。这篇文章并没有谈到时间序列！虽然我同意时间是一个有用的特征.....。

据我所知，遍历性是指所研究的系统具有一定的稳定性....。

因此，我想指出重要的一点。如果系统（我们以金融时间序列为例）不是静态的，我们仍然可以利用计量经济学找到一个稳定的模型（如 GARCH）来描述模型的行为。我从中看到了系统的恒定性--根据模型的行为....。但条件是系统有一定的概率会 "打破 "模型.....。

几年前，我在网站上发表了一篇文章，证实了一个大多数人完全无法接受的观点。也就是说。

有很多指标。每个人都认为，如果一个指标是画出来的，那么它就是一样的--毕竟，我们看到的就是这个东西。同时，大多数人不会想到，我们在现实中看到的东西可能并不存在！原因很简单。如果我们对指标进行回归，很容易发现其中一些系数的置信区间非常大，以至于根本无法谈论这样一个系数的值，而如果我们抛开这样一个有缺陷的系数，指标模式就会完全不同。当人们说：有真就有假，有假就有统计的时候，他们指的就是这种可悲的、非常不习惯的情况--没有什么是可以相信的，包括置信区间。

这就是为什么我离开参数模型，转而研究基于机器学习的模型。这里没有静态性问题，但过度训练的问题却十分突出。

Alexey Burnakov | 4 9月 2015 在 11:37

我喜欢这篇文章。

是的，San Sanych 和 Reshetov 的评论是合理的--如果被比较的系统（或系统）改变了参数，测试结果将毫无用处。

但是，方法应用的演示本身就令人高兴。这在外汇交易中是很少见的！

作为一个完全将类似方法用于报价的人，我还想说点别的。可以事先检查环境是否均匀（在两个独立的大样本上），然后在一定程度上冷静地相信假设检验的结果。这也可以通过同样的测试来实现。

以莫斯科交易所衍生产品市场为例的交易定价原则

本文介绍了莫斯科交易所衍生产品市场的交易定价和结算理论的特性。这是一篇综合性的文章，面向那些想在衍生品市场中获取他们第一次交易经验的初学者，以及那些正在考虑通过中央交换平台进行交易的经验丰富的外汇交易者。

液态图表

您是否希望在小时图表里看到本小时内第二和第十五分钟开盘的柱线？每分钟开盘价都在变化的重绘图表看上去会像什么样？依据这样的图表进行交易有何优势？您将在本文当中找到这些答案。

让开发者为交易者进行服务?

算法交易变得越来越流行并需求旺盛，这自然导致了对于精致算法以及不同寻常任务的需求。从某种程度上说，这些复杂的应用程序都已经在代码库或市场中提供。尽管交易者只需几次简单的点击就可以访问这些应用, 但是这些应用也许不能完全满足所有的需要。为此, 交易者可以在 MQL5 的自由职业者板块分派订单，并寻找开发者来为他们编写期望的应用。

MQL5 向导: 根据计算价位下单, 止损和止盈。标准库扩展

本文描述 MQL5 标准库扩展, 可以使用 MQL5 向导接收来自包含模块的价格, 创建 EA, 下单, 止损和止盈。这种方法不会对模块的应用数量有任何额外的限制，亦不会在联合工作中导致冲突。