文章 "克服机器学习的局限性(第二部分):缺乏可重复性"

 

新文章 克服机器学习的局限性(第二部分):缺乏可重复性已发布:

本文探讨了即便使用相同的策略和金融标的,不同经纪商的交易结果为何仍会存在显著差异,原因在于定价的分散化以及数据差异。本文有助于MQL5开发者理解为何他们的产品在MQL5市场上的评价褒贬不一,并敦促开发者针对特定经纪商调整方法,以确保结果透明且可重复。如果这一做法能被广泛地采用,将有望成为我们社区重要的特定领域最佳实践。

为了便于讨论,我随机选取了用于独立交易的两家经纪商。根据我们的社区准则,禁止推广经纪商,因此将他们的名字隐去,以“经纪商A”和“经纪商B”取而代之。

我使用MetaTrader 5的Python库,从这两家经纪商处获取了四年的欧元兑美元每日历史数据。复核后,我注意到时间戳并不一致:一家经纪商的数据可追溯到2019年9月,而另一家仅到2020年8月。尽管如此,两家经纪商都返回了1460行每日数据,精准地满足了我们的要求。

鉴于经纪商的分散性,他们的运营时区可能不同,这在意料之中。然而,但容易被忽视的是,夏令时转换、公共假期安排以及其他细微差异,都会导致时间戳无法完全对齐。

然后,我们计算了两家经纪商的10日欧元兑美元收益率,同一交易品种的数据特征存在显著差异。经纪商A的10日欧元兑美元平均收益率为0.000267,而经纪商B的平均10日收益率为-0.000352。这就意味着,对于同一标的资产,两者的预期收益率竟然相差了2.3倍之多。

更糟糕的是,经纪商A的预期收益率似乎比经纪商B的预期收益率风险高出21%。从两家经纪商之间的收益率方差也增长了相同的比例(即21%),可以看出这一点。 


作者:Gamuchirai Zororo Ndawana