交易中的机器学习：理论、模型、实践和算法交易 - 页 3226

fxsaber #:

也许我们应该尝试通过近似来解决生成新数据的问题？

利用一个窗口，尝试用不同的精度来描述其中的数字序列，而这种方法可以保存全局的价格运动动态，包括每日波动。

而且，以近似系数的形式保存历史数据就足够了。

 
Maxim Dmitrievsky #:

您的 TC 并不是在寻找可能存在的所有模式。这就是为什么您必须匹配它

然后我们就面临 "鸡和蛋 "的问题：

  • 如果从工作 TC 得到数据，MO 就会保留模式。
  • 在原始 tsvr 上，MO 必须找到工作 TC。

否则，通过另一种方法，但它将在 ticks 和稍后的时间里做多 )

所有这些开发人员都远离交易。与其用 Average，不如用 Median。

 
Aleksey Vyazmikin #:

听起来不错。当我看到有关 IDC 研究主题的文章时，我几乎立即开始怀疑他们的方法，如果是在全天候的假设下寻找规律性的话。

 
Maxim Dmitrievsky #:

长度为1000 ticks 的依赖关系

再加上5000 个刻度。

对于刻度，这样的窗口选择很奇怪。与时间戳绑定是合乎逻辑的，而不是与刻度指数绑定。

Maxim Dmitrievsky #:

https://disk.yandex.ru/d/6F8FdUGthpnk3A

.

 
mytarmailS #:
你并不是要找到一组参数，而是要找到某种接近的参数集群。

看看样本区间（蓝线之间）的曲线有多大差异。

这表明您得到的参数集很远，而不是很近。如果以噪声目标函数为例，则会得到不同山丘附近的结果。

很明显，如果不中断 GA，而是等到完成，就会发现一个峰值。而所有 20 次最佳通过都将从这里开始--样本曲线将几乎相同。这没有任何用处。

 
fxsaber #:

如果不中断 GA，而是等到 GA 结束，就会发现一个峰值。所有 20 个最佳通过点都将从这里出发--采样曲线将几乎相同。

我在没有中断 GA 的情况下，在同一个 VDC 上验证了这一说法。

很明显，在这 20 个样本中，有一些是不相同的。相反，这表明常规 GA 没有完成它的工作。更确切地说，它中断了自己的工作，将来自不同峰值的结果放在了前 20 名中。

 
fxsaber #:

我可以告诉你，并不是对所有的预测因素，时间分割都会带来有意义的概率偏差，至少对我来说是这样。因此，我倾向于认为时间是一个重要因素，但如果其他更重要的因素处于活跃期，它们也会影响结果。

我还认为，在窗口中，您可以简单地为价格设置一个不同的量化网格，并设置大量的区间（以便更准确地保留结构），然后对这样一个 "压缩信号 "进行测试--它已经存在偏差了。或者，您也可以在两个区间之间的参考范围内使用少量区间和随机噪声。

您甚至可以固定网格，只存储第一个参考点的偏移量。这样占用的空间就很小，转换速度也会很快。
 
Maxim Dmitrievsky #:

最重要的是，还有5 千米 的长度

https://disk.yandex.ru/d/1ypCrzYKk82XdA


看来优化图可以显示搜索过程有多难。我们开始吧。


 
Aleksey Vyazmikin #:

好吧，我可以说，并不是所有的预测因素，时间分割都会在概率上产生有意义的偏差，至少对我来说是这样。因此，我倾向于认为时间是一个重要因素，但其他更重要的因素如果处于活跃阶段，也会影响结果。

我还认为，在窗口中，你可以简单地为价格设置一个不同的量化网格，并设置大量的区间（以便更准确地保留结构），然后对这样一个 "压缩信号 "进行测试--它已经存在偏差了。或者，您也可以在两个区间之间的参考范围内使用少量区间和随机噪声。

您甚至可以固定网格，只存储第一个参考点的偏移量。这样占用的空间就很小，转换速度也会很快。

遗憾的是，这些假设都需要实现和测试。

@Maxim Dmitrievsky 正在尝试他的变体，而我正在尝试我的变体。
