交易中的机器学习:理论、模型、实践和算法交易 - 页 2643

 
mytarmailS #:

我想知道在 python 中需要多少行.....

以 µl 为单位,大概需要数千))))

差不多,多一点
可能是过拟合的问题,在新数据上会显示不同的曲线
 
Maxim Dmitrievsky #:
差不多,再多一点。
这可能是拟合过度的问题,新数据会显示出不同的曲线。
第三幅图是新数据。
 
Maxim Dmitrievsky #:
有意思,我稍后再想想,今天是血腥玛丽日,很难思考。
或者训练模型 1,让它为模型 2 输出有用的功能。

我的想象力是无限的。
 
Maxim Dmitrievsky #:
还记得很久以前我们成功预测集群的情景吗? 还记得我们是如何锁定目标的吗?
 
mytarmailS #:
还记得很久以前我们成功预测聚类的情景吗? 还记得我们是如何锁定目标的吗?
我通过一棵树或一个多类森林来预测聚类数。我还曾经用聚类来标记目标。
 

嗯,是的,我对标记目标感兴趣,但不是预测下一根蜡烛上的聚类,而是假设我们有当前小时(5m tf),并预测下一个小时的聚类是什么,你做过吗? 你还记得吗?

 
mytarmailS #:

嗯,是的,我对标记目标感兴趣,但不是预测下一根蜡烛上的簇,而是假设我们有当前小时(5m tf)并预测下一个小时的簇,你做过吗? 你还记得吗?

我想我是在下一根蜡烛上做的,但如果连续得到多根蜡烛的簇,就可以在遥远的未来做。

源代码在我搬到新电脑时丢失了,旧电脑出了故障,我没有把它保存在云端。

我记得如果通过增量聚类来标记,结果在新数据上非常稳定,但标记本身却很糟糕

啊,我在 Google colab 上有个东西,如果你需要,我可以调出来。
 
Maxim Dmitrievsky #

哦,我有一些谷歌合作实验室留下的东西,如果你需要,我可以调出来。
不用了,我自己写吧 No, I'm good.我自己写
 
Aleksey Nikolayev #:

如果你想添加连续时间,它已经是马尔可夫链的广义化--半马尔可夫模型(过程)。

我还不能承诺提供帮助,但我可以尽可能参与这个话题的公开讨论。

什么意义上的 "连续时间"--关键在于我们有以信号形式进入市场的事件(时间尺度),并且有在信号出现时存在或不存在的 "模式"。因此,会有一些时刻,时间轴上有一个点,但没有模式。我认为,要考虑到形态的影响,形态出现的时间间隔(没有 n 个不连续的时间段)也很重要。

还有这样一种情况,因为在整个历史间隔中,模式的数量可能比信号出现时的数量要多,那么也许就应该考虑到这一点,即有多少百分比的模式伴随着信号出现,因为如果百分比很小,那么与信号的联系要么是随机的,要么就是信号被基本条件过滤得太厉害了。然而,这里存在一个离散性问题--一个形态可以连续存在 n 个条形图。我认为应该有离散性,也许对于同一个 ZZ 来说,如果信号和形态是相同的,那么额外的统计数据就没有意义,如果不是,它就会有用。

感谢您愿意提供帮助,尽管数量有限!我还没有开始编写代码--我想完成另一个项目,但思考这个问题对未来的实验很有帮助。

 

让我们发表一些研究成果,提出一些想法。

原因: