交易中的机器学习:理论、模型、实践和算法交易 - 页 1782

[删除]  
瓦列里-亚斯特雷姆斯基

你在分享什么? 还有,关于增量,有什么不适合你?它们本质上是经过时间调整的速度。但没有平均数,我是没有办法做到的。但如果你开始考虑平均数,你很快就会陷入迷宫。总得有一个工作的中间地带。在最后一次打勾时,条子是不够的,再多一点就是野了。

2个或更多具有不同滞后期的先验指标,用于不同数量的群组

由于这对增量之间没有功能上的依赖,所以云被愚蠢地分成了两半,等等。我们需要比增量更严格的东西。 也许他们应该以某种方式被改造。

例子


 
Maxim Dmitrievsky:

不同滞后期的2个或更多的增量,在不同数量的集群上的增量

由于这对增量之间没有功能上的依赖,所以云只是被分成了两半,等等。我们需要比增量更严格的东西。也许他们应该以某种方式被改造。

例子


我不明白这对增量的问题。在最后两小节还是其他方面?

我对速度和平均数的方向也还是有想法的。很好,系统应该在不同的TF上,在不同的TF的互动上进行训练,而且应该有tickwise的废话。也就是说,当TS做出任何决定时,也应该有tickwise的行为。

不同的TFs只是加权下来的迹象,远离了当前的状态。Semko在那里有他自己的系统,但我更喜欢TF,那里既有统一性,也有对极值的一些考虑。

我想到了。我们将订单下到价格云层,因此,99%的时间里,缩减将是负数。但我们怎么能估计我们没有搞错呢?使用最近的极值,如果最近的极值是负的,我们可以在没有损失的情况下关闭。

 

我们可以通过最近的几根柱子和120根柱子的历史来衡量。以一个月为单位,就是10年。似乎够了。

2、14、30、120、480马赫的速度,找到高点 和转折点

相邻笔画之间的扩散,找到最大值和结点

与马沙的价格差异最大,但这些通常是价格的真正极端。

平均趋势时间,强调最大和最小值

趋势的平均差异,Ala Donchian。

而且有可能将趋势划分为通量和它们的持续时间

该单位的趋势的平均时间。低层TFs在高层的趋势。

趋势的平均时间。

而且,似乎不同的参数会根据其他参数而变得重要。而这种联系并不明显。这是第一个想到的将低级TF与高级TF连接起来的东西,但很明显,这还远远不够。而我在这些链接中还找不到任何逻辑。

[删除]  
Valeriy Yastremskiy:

我不明白那几个增量的事。在最后两小节还是其他方面?

2个具有不同滞后期的时间序列。你可以把所有你想要的东西都归类,但这样你又会陷入对主题领域的误解,以及它被归类的内容和原因。我没有在互联网上看到任何成功的例子。顺便说一下,我想分配群组而不是季节性成分,结果忘了,开始塞进MO...那么,这将是一项不同的研究。
 
mytarmailS:

好吧,时间是波动性的代表,在时间上是有季节性的,有主动的交易时间,也有被动的交易时间。

我同意,我没有考虑到这一点。

mytarmailS:

是的,你可以保存它,但为了教授模型,有必要在环境中加载这个矩阵,这将是它的结束))或者更早,在形成带有谓词的矩阵的阶段。

试试CatBoost。无论如何,我可以训练它,我们将看到结果。

mytarmailS:

哇,一个演出并不小,不知道你有多少个牌子?

在这个样本中,有566人。

mytarmailS:

什么是遗传树?


1) 简单 )

2)如何是好?你是如何调整ZZ的预测指标的呢?

3)好了,你有一个烛台作为开场或类似的东西,它已经扭曲了,因为他们应该是由小丑,这里立即有很多混乱,标志建立如何,如何做目标,等等(不必要的痛苦),如果你为自己改变的东西,你应该永远为别人留下原始的东西)

R中的脚本,它使用遗传算法 建立了一棵树,选择分裂。我并不真正精通它--博士的工作。


2.我使用基于ZZ的预测器,显然,如果它们和目标是在同一个ZZ上计算的,那么它们的效率会更高。

3.我不知道它在酒吧开始时的OHLC,所以我就是这样写下来的--就像现实生活中发生的那样。

一句话,我应该重做还是没有意义?

 
阿列克谢-维亚兹米 金。

一句话,我应该重做还是没有意义?

斤斤计较是没有用的,问题是数据的大小,我甚至无法创建特征,你甚至无法进行训练......

把样本定为5万,让它小,让它不严重,让它更有可能过度训练,......., ...任务是制作一个用于生产的机器人,只要共同努力,减少错误,然后获得的知识可以转移到任何工具和市场,50K是相当足够的,看看有什么迹象表明东西是重要的。

阿列克谢-维亚兹米 金。

3.在酒吧的开始,我不知道它的OHLC,所以我把它写下来--就像在现实生活中发生的那样。

如果你不知道OHLC,你就不需要写它。 为什么要转移整个OHLC? 没有人这样做,你只需要把ZZ转移一步,就像对未来的训练转移一步一样,就这样了。我想问你,如果你读过弗拉基米尔-佩雷文科关于鹿鼎记的任何文章,请读一读,当我们已经建立了处理数据的最佳方式,每个人都习惯了,有人试图做同样的事情,但用不同的方式,这是一种无意义的,令人讨厌的,并导致许多错误的人试图与这个作者的数据工作。


如果在这一切之后,你仍然想做一些事情,我有以下要求

1)数据50-60k不等,最好是一个文件,只要同意最后一个蜡烛的n就可以了。

2)数据,最好没有胶水,这样不仅可以考虑最新的价格,还可以考虑支持和阻力,这在胶水中是不可能的。

3)目标应该已经包含在数据中了

4)数据格式为日期、时间、o、h、l、c、目标。


或者我应该创建一个数据集?

 
马克西姆-德米特里耶夫斯基
两个具有不同滞后期的时间序列。你可以把所有你想要的东西都归类,但这样你又会陷入对主题领域和被归类的内容及原因的误解中。我没有在互联网上看到任何成功的例子。顺便说一下,我想分配群组而不是季节性成分,结果忘了,开始塞进MO...那么,这将是一项不同的研究。

它发生了,逻辑对废话没有耐心 )))) ....到目前为止,理解方面存在问题。所有这些都是在相当短的数据上进行平均化、细化和GA的学习。我也没有看到任何关于系列特征分离的工作。一方面,对不同TFs的系列分析应该是相同的。应该有进入较低TF的标准。比如,如果在较低的TF上确定了具有足够扩散性和速度的趋势,那么就有可能逆着较高的TF的趋势向它们移动。但是这就是逻辑。我们应该以某种方式对这些特征进行分组,并研究系列的不同行为。 如果从相反的角度来解决。

在核电站,我们看的是19个参数。 他们有一个3到7个参数的表格,当这个区域是红色的,棒子应该被移除。那里也没有一个参数,而且它们没有相互关联。我们的情况当然不同,但时间尺度太大,而且蜱虫和月度行为之间没有联系,或不一定有联系。一般来说,我们应该看一下参数之间的关系,以及这种关系存在多长时间。

但它仍然很复杂。

[删除]  
瓦列里-亚斯特雷姆斯基

它发生了,逻辑对废话没有耐心 )))) ....到目前为止,理解方面存在问题。所有这些都是在相当短的数据上进行平均化、细化和GA的学习。我也没有看到任何关于系列特征分离的工作。一方面,对不同TFs的系列分析应该是相同的。应该有进入较低TF的标准。比如,如果在较低的TF上确定了具有足够扩散性和速度的趋势,那么就有可能逆着较高的TF的趋势向它们移动。但是这就是逻辑。我们应该以某种方式对这些特征进行分组,并研究系列的不同行为。 如果从相反的角度来解决。

在核电站,我们看的是19个参数。 他们有一个3到7个参数的表格,当这个区域是红色的,棒子应该被移除。那里也没有一个参数,而且它们没有相互关联。我们的情况当然不同,但时间尺度太大,而且蜱虫和月度行为之间没有联系,或不一定有联系。一般来说,我们应该看一下参数之间的关系,以及这种关系存在多长时间。

但这有点难。

我走过带着核弹头的轰炸机时,不会不说笑话 :)
 
马克西姆-德米特里耶夫斯基
我走过带着核弹头的轰炸机时,不会不说笑话 :)

在这个荒凉的)))),没有他们,你能做什么?核废料是一切的开始,概率计算器与平均数,反馈和贝叶斯,信心标准是什么)))。显然,同样的参数要先进行手动选择。他们有太多的人了。

一般来说,这个想法是看一系列的120条,在不同的变体中拉出一些狗屎。在当前状态下进行测量和训练是不可取的。

[删除]  
瓦列里-亚斯特雷姆斯基

在这个荒凉的)))),没有他们,你能做什么?核废料是一切的开始,概率计算器与平均数,反馈和贝叶斯,信心标准是什么)))。显然,同样的参数要先进行手动选择。也有很多这样的人。

一般来说,这个想法是看一系列的120条,并以不同的变体从其中拉出一些狗屎。在当前状态下进行测量和训练是不可取的。

目前的状态是什么? 如果是关于集群,你只需要对新的数据进行扫荡统计。如果它们是相同的,你可以建立CA。