文章 "用于一组指标信号的朴素贝叶斯分类器" - 页 2

 
Rashid Umarov:

然后是另一篇文章的主题--如何自动找到相互独立的指标?

然后,我们几乎有了一个简单的 KnowHow,可以从任何指标集合中创建机器人。此外,您还可以通过MQL5 向导 为基本算法添加追踪、管理等功能。

是的,有这样一个主题。我不是科学家,但真正的科学家已经研究过这个问题--您可以在互联网上找到相关文章。我没有现成的材料,可能需要很多时间来阐述。同时,mql5.com 上已经有关于这一主题的出版物,如这篇这篇

 
Stanislav Korotky:

不过,mql5.com 上已经有关于这个主题的出版物,如这篇这篇

感谢您提供的链接和提醒,但不是这样的--这不是一种流行的机械方法。

 
Rashid Umarov:

谢谢你的链接和提醒,但不是这样的--不是大众力学。

我的理解是否正确,所提供的链接难以理解和实用,现在只需要一辆现成的 "工作车",而不需要所有 Excel 和 R 的东西?这是我在为未来的潜在作者澄清。;-)

 
Stanislav Korotky:

我的理解是否正确,即给出的参考文献难以理解和实际应用,而你现在只想要一辆现成的 "工作车",不需要任何 Excel 和 R?这是我在为未来的潜在作者澄清。;-)

当然--每个人都知道如何使用智能手机,尽管没有人知道无线电工程的基础知识和其他复杂的科学知识。

 

天真贝叶斯分类器要求一组特征(在我们的例子中是指标)具有很强的独立性--总体上的独立性(而不仅仅是成对或不相关)。我遇到过这样一种说法,即对于一组普通的、有意义的指标来说,这种独立性是无法获得的。

 
Alexey Nikolaev:

天真贝叶斯分类器要求一组特征(在我们的例子中是指标)具有很强的独立性,即总体上的独立性(不仅是成对或不相关)。

我们可以将理论计算结果与基于多个指标的测试 策略的实际结果 进行比较。 我认为一个策略中的 3 个指标是上限,不能再多了。

 

很有可能,你是对的。从理论上讲,可以有更多的独立指标(甚至与我们计算的条形图数量相等),只是它们的意义不大。但是,我们完全有可能从它们中组合出一些正常指标(或接近正常指标的指标)。
有关考虑大致如下。假设我们有 n 个条形图。让我们定义每条均价 p(i),例如 p(i)=(开盘价(i)+ 收盘价(i))/2。当然,随机变量 p(1)、......、p(n) 的集合是因变量。但众所周知,一系列价格接近于被视为一系列独立的增量。因此,n 个随机变量的集合 d(1)=p(2)-p(1), d(2)=p(3)-p(2),...d(n-1)=p(n)-p(n-1), p(n) 将接近独立。现在,如果我们集合中的任何一个参数只包含在其中一个函数的表达式中,那么这组函数就是独立的。简单地说:函数 I1(d1,d2) 和 I2(d3,p4) 的四条杠的集合是独立的,但 I1(d1,d2,d3) 和 I2(d3,p4) 并不独立,因为有 d3。
例如,两个不同的 MA 总是相互依赖的。但是,如果将两个均方根在时间上向后移动第一个均方根的周期,那么第一个均方根的系统和它们的差值将是独立的。

 
显然,我举的独立集合的例子是错误的。正确的集合应该是价格集合和价格与 MA 的差值集合。
 
Rashid Umarov:

我试着用自己的语言简单地叙述一下:

1.假设有三种策略:

  • Strat_A 策略基于指标 A,交易获胜概率 P(Win|A) =0.63
  • 基于指标 B 的 Strat_B 策略,交易获胜概率 P(Win|B) =0.58
  • 基于指标 C 的 Strat_C 策略,交易获胜概率 P(Win|C) =0.57

2.所有三个指标 A、B 和 C 互不相关,即它们发出的入市信号互不相关。

需要计算 Start_ABC 策略的理论获胜交易百分比,在该策略中,只有当三个指标同时显示同方向入市时才会入市。

那么 P(Win|ABC) = P(Win|A)* P(Win|B)* P(Win|C) /[ P(Win|A)* P(Win|B)* P(Win|C) - (1 - P(Win|A))*(1 - P(Win|B))*(1 - P(Win|C)))]


谢谢!原来 P(Win|ABC) 总是大于每个分层。

拉希德-乌马罗夫

那么另一篇文章的主题就是如何自动找到相互独立的指标?

然后,我们几乎已经准备好了关于如何从任何指标集合中创建机器人的简单 "KnowHow"。接下来,您可以通过MQL5 向导 为基本算法添加追踪、mani-management 等功能。

取一个任意窗口 (N) 并随时间拉伸,为每个时刻建立一个相关矩阵。然后将所有矩阵相加,得到平均值。平均矩阵中相应单元格的值越接近零,说明在时间间隔 N 的长度上指标之间的独立性越强。

在 R 中,这可能只需要一行就能完成,因为很明显,这样的任务是统计研究中的首要任务之一。

 
fxsaber:

谢谢!那么事实证明,P(Win|ABC) 总是大于每个分层的单独概率。

只有当所有策略都是相互独立的,并且给出的概率大于 0.5 时,P(Win|ABC)才是最大的。