交易中的机器学习:理论、模型、实践和算法交易 - 页 3248

 
fxsaber #:

因此,有必要将这些指标统一起来。即使不同间隔的增量可以作为指标,否则相关性也会很奇怪。

我自己会在 1d 阵列中移动一个窗口,通过任何 "相似性 "迹象查看样本数量。更准确地说,甚至不是数量,而是这些地方的总 "利润"(按模式进入,在 n 小时内退出)。


只有动画上找到的样本数量令人困惑:几百个。四年中只有 365*5/7*24~6000 个样本。在 6000 个样本中找到 500 个样本,要么是非常粗略的模式(或相似性的标志),要么是一些偏离规模的模式。

在循环中,每个样本与其他样本的相关性都是通过已计算出的矩阵来填充的,因此需要大量的数据。

 
Maxim Dmitrievsky #:

在循环中,每个例子与其他例子的相关性都是由已经计算出的矩阵填入的,因此有大量的

25K 个相关性。如果能看到相关性从 -1 到 +1 的分布情况,那将会非常有趣。

 
Maxim Dmitrievsky #:

我会尽量加快速度。

我想我们可以运用筛子原理。

  1. 我们为一个模式计算了 25K 个相关性。例如,MathAbs(corr) > 0.9 的有 500 个。我们把它们考虑在内,然后扔掉。
  2. 现在,模式数量减少了 500 个,所需的相关性计算数量也减少了 500 个。
也就是说,每一步我们都会删除相似的地方。
 
fxsaber #:

我想你可以运用筛子原理。

  1. 我们为一种模式计算了 25K 个相关性。例如,MathAbs(corr) > 0.9 的有 500 个。我们把它们考虑在内,然后扔掉。
  2. 现在,模式数量减少了 500 个,所需的相关性计算数量也减少了 500 个。
也就是说,我们每一步都会剔除相似的地方。

对于每个模式,我们都可以从原始数据集的相关矩阵中通过已知指数进行简单选择,因此速度很快。屏幕上最右边一行显示的是每种模式的实例数量。其他数据(如未来价格)会被填入并进行统计。你可以用另一种方法,没错。

 
fxsaber #:

模式进入,n 小时后退出。

像这样退出?
 
fxsaber #:
输出是什么?

固定 TP

 
Maxim Dmitrievsky #:

固定的

采矿时?

 
fxsaber #:

采矿时?

我可以从统计数据中看到,比方说未来的 10 个条形图,我将输出每个发现的模式实例在未来的所有曲线(就像预测一样)。

然后求出所有曲线的平均值。

像这样的模式,平均卖出多少点就可以看出。

 
Maxim Dmitrievsky #:

保存模式参考,在测试仪中查找当前值与参考值的相关性,根据所选逻辑打开交易

我明白了,为什么会有很多样本。如果将相关性绘制在 1d 阵列上,就会得到类似下面的结果。


在上蓝线上方,相关性超高。你可以看到它在顶部平滑变化。


这意味着我们在测试仪中看到了 0.9 - 很好,我们打开了。在下一个条形图中,0.91,然后是 0.92,....,0.95,0.94,....,0.9。这种超高连续值的长度就是形态本身的长度。这纯粹是数学规律。


也许,这就是大量交易分层的原因。

关于交易、自动交易系统和测试交易策略的论坛。

交易中的机器学习:理论、模型、实践和算法交易。

Maxim Dmitrievsky, 2023.09.21 15:07

如果信号持续,并且交易量相同,机器人会同时打开几笔交易。


因此,可能在挖掘时,在一系列连续样本中只考虑第一个样本是有意义的。

 
fxsaber #:

我知道为什么会有这么多样本了。如果在 1d 阵列上绘制相关性曲线,就会得到与此极其相似的结果。


在上蓝线上方,相关性超高。你可以看到它在顶点处平滑变化。


这意味着我们在测试器中看到了 0.9 - 很好,我们打开了。在下一个条形图中,0.91,然后是 0.92,....,0.95,0.94,....,0.9。这种超高连续值的长度就是形态本身的长度。纯粹是数学问题。


也许,这就是大量交易分层的原因。


这就是为什么在挖掘时只考虑一系列连续样本中的第一个样本的原因。

是的,确实如此