萨维茨基-戈利滤波器与普通移动平均线的主要区别在于,它不会滞后于价格。
在非平稳时间序列上在线使用该滤波器是错误的,因为最后的值可能会被重新绘制,但它非常适合在现有数据上标记交易。
为什么不使用 ZZ?
没错,我找到了一个小解释。
这种标记有其特殊性:
- 并非所有标记的交易都有利可图,因为价格在越过色带后的进一步变化并不总是朝着相反的方向发展。因此,可能会有虚假标记为买入或卖出的例子。
- 理论上,这一缺点可以通过标记是同质和非随机的这一事实来弥补,因此,错误标记的例子可以被视为训练 或整个交易系统中的错误,这可能会减少输出时的再训练。
分布的偏度(或斜度)是描述数据分布相对于其平均值的不对称程度的一种特征。偏度表示分布偏离对称分布(如正态分布)的程度。偏度用偏度系数(偏斜度)来衡量。Кластеризация по скосу ,可以识别具有相似分布特征的数据组,从而帮助您识别这些模式。例如,正偏度可能表明在某些时期(如危机期间)价格会出现罕见的大幅飙升,而负偏度可能表明在某些时期价格变化较为平稳。
也许我只是肤浅地看问题,但按斜度聚类难道不是对未来的窥探吗?
我认为市场聚类应该根据实时特征来进行:时间、滑动等。
- catmodel EURGBP_H1 0.onnx — основная модель, которая дает сигналы на покупку и продажу
- catmodel_m EURGBP_H1 0.onnx — дополнительная модель, которая разрешает или запрещает торговлю
读到这里,我不明白原点在哪里。

新文章 基于机器学习构建均值回归策略已发布:
在开始聚类前,我们需要明确其必要性。想象一张价格图表:包含趋势、震荡、高波动/低波动期、各类形态等特征。也就是说,价格图表并非一成不变,不存在完全相同的模式。甚至可以说,不同时间段可能存在截然不同的模式,且这些模式会随时间消失或演变。
聚类让您能够根据某些特征把原始时间序列划分成若干“状态”,每个状态都描述了相似的观测结果。这样能让构建交易系统的任务变得更简单,因为训练将在更同质、更相似的数据上进行。至少,您可以如此设想。自然而然地,交易系统不再在整个历史周期上运行,而只在由不同时间点组成、且这些时间点的值落在给定聚类内的选定片段上运行。
聚类之后,只需对被选中的样本进行标注(即赋予唯一类别标签),即可构建最终模型。如果一个聚类包含的是相似观测值的同质数据,那么它的标注应该会更同质,进而更具可预测性。您可以取多个数据聚类,分别对它们进行标注,然后在每个聚类的数据上训练机器学习模型,并在训练集和测试集上进行测试。如果找到一个能让模型很好地学习(即泛化并预测新数据)的聚类,那么就认为构建交易系统的任务已经基本完成。
作者:dmitrievsky