交易中的机器学习:理论、模型、实践和算法交易 - 页 2569 1...256225632564256525662567256825692570257125722573257425752576...3399 新评论 Aleksey Nikolayev 2022.02.05 08:44 #25681 mytarmailS#: 谁知道是否有趋势决定论的测试... 你需要知道这是否真的是一种趋势或随机的波动... 也许是同一个赫斯特? 对不同类型的趋势进行开箱测试R best!!!! 对于线性趋势,sens.slope()是不错的选择。 vladavd 2022.02.05 08:53 #25682 mytarmailS#: 金融数学和IR有什么好理解的,你需要知道市场的机制和它的参与者在大多数情况下,群众必然会输,因为它的反面角色是一个 "主要角色"。1)你需要看到零售买家和卖家的不平衡,例如,如果有许多卖家,那么 "大玩家"(买家)就在交易的另一边。比如说现在在犹太人身上,很多卖家2)也有逆向交易的时刻,这是做市商人们总是看到,价格的走势与人群相反(反相关)。当人群在购买并相信增长时,价格会下降,反之亦然......这就是整个市场...p.s. 而且我肯定会看视频的。 这也有问题,而且问题不小。我们只掌握了市场上的一小部分,不知道其代表性和可靠性如何。第二张图片(一般情绪)根本没有用。首先,反转经常发生在 "逆向 "趋势似乎应该继续的极端点。第二,制裁只是简单地重复价格(颠倒了,少了趋势)--反转任何振荡器,你会得到一个非常相似的画面。好吧,如果指标重复了价格,这意味着它的预测并不比价格图表本身更容易,对吗?第一张图片(玻璃和开仓)和利润率的价值更有价值,但它也是如此。非常值得怀疑。 Aleksey Vyazmikin 2022.02.05 09:05 #25683 Aleksey Nikolayev#: 具体如何编码(从组合学的角度来看)并无太大区别。重点是一样的--每条线都有哪些规则被执行,哪些不被执行的特点。它总是2^N的变体,其中N是规则的数量。之后,这些规则中的每一条都将被纳入最终的2^(2^N)个变体的集合。很明显,不可能只是正式地尝试这么多的变体。这就是为什么以合理的方式安排它们是有意义的。例如,首先我们采取所有只由一条规则描述的变体,然后是所有只由两条规则描述的变体,以此类推。或者类似这样的事情。 也许我没有解释清楚,但我想再次强调,我们正在使用初始样本,在CatBoost学习算法中,初始样本被量化了一次,即假设我们有1000个预测器,我们把它们各自量化为10个段,结果我们有10000个段--进一步说,CatBoost算法随机拉出预测器,并通过边缘/量子进行分割/分裂,为了选择一个处于中间的量子,它需要建立3个不等式或创建8个叶子,其中7个叶子会说垃圾,一个叶子说有价值的信息。算法是否会建立这样的树也是不确定的,因为有爱的随机性,一个相邻的量子可以进入叶子。而且只让它成为一棵树。在我的方法中,一个不平等就足够了--2片叶子。即使所有的预测因子都被使用,并且每个预测因子都有1片有用的叶子,在创建模型时,组合的数量也会少很多。但重要的是,噪音也会减少,因为不会有那么多错误的样本分区来稳定需要建立一个新的树(提升原理)。 Aleksey Nikolayev# :例如,许多其他玩家迟早会发现他们。 那么,也许人们应该以某种方式检验这一理论?据此,有一个最小的优势重复出现的频率,在增加之后,它更有可能消失,而不是继续存在? 例如,我们衡量每半年,有一个1.5年的优势 - 我们认为半年将工作,如果它已经是2.5年,没有意义,并采取它 - 概率是更多,它将停止工作。 我不擅长科学公式,你能告诉我如何进行这种计算并检查假设吗? mytarmailS 2022.02.05 09:29 #25684 Aleksey Nikolayev#: 对于线性趋势,sens.slope()是不错的选择。 谢谢 vladavd#: 这也有问题,而且是相当多的问题。我们只有一小部分市场可用,我们不知道它的指示性和可靠性如何。第二张图片(整体情绪)完全没有用。首先,反转经常发生在 "逆向 "趋势似乎应该继续的极端点。第二,制裁只是简单地重复价格(颠倒了,少了趋势)--反转任何振荡器,你会得到一个非常相似的画面。好吧,如果指标重复了价格,这意味着它的预测并不比价格图表本身更容易,对吗?第一张图片(玻璃和开仓)和利润率的价值更有价值,但它也是如此。非常值得怀疑。 你在很多事情上迷失了方向,你太肤浅了,对信息的认知不假思索。 Aleksey Nikolayev 2022.02.05 09:33 #25685 Aleksey Vyazmikin#: 也许我没有解释清楚,但我想再次强调,我们的工作对象是原始样本,在CatBoost学习算法中,它被量化了一次,即假设我们有1000个预测器,我们把它们各自量化为10个段,结果我们有10000个段--进一步说,CatBoost算法随机拉出预测器,并通过边缘/量子进行分割/分裂,为了选择一个处于中间的量子,它需要建立3个不等式或创建8个叶子,其中7个叶子会说垃圾,一个叶子说有价值的信息。算法是否会建立这样一棵树也是不确定的,因为有爱的随机性,相邻的量子可以进入一个叶子。而且只让它成为一棵树。在我的方法中,一个不平等就足够了--2片叶子。即使所有的预测因子都被使用,并且每个预测因子都有1片有用的叶子,在创建模型时,组合的数量也会少很多。但重要的是,噪音也会减少,因为不会有那么多错误的样本分区来稳定你需要建立一个新的树(提升原理)。 也许你应该在一个单一决策树的例子上描述你的方法。不过,就其本身而言,提升已经建立了一个相当复杂的结构--精炼树序列。而你还在 用它 做别的事情)。 Aleksey Vyazmikin#: 那么也许你需要以某种方式检查这个理论?据此,有一个最小的优势复现频率,在其增加之后,其消失的可能性大于其继续存在的可能性?例如,我们每半年测量一次,有1.5年的优势--我们认为半年后仍然可以工作,如果已经是2.5年了,就没有意义了,采取它--它将停止工作的概率更高。我对科学公式不擅长,你能告诉我如何进行这样的计算并检查假设吗? 类似于带有半衰期的放射性公式)我不认为人类活动可以用这种简单的公式来描述)你的 "优势频率 "会发生变化,很可能是某种非常不可预测的变化。 Aleksey Vyazmikin 2022.02.05 09:50 #25686 Aleksey Nikolayev#: 也许你应该以一棵决策树为例来阐述你的方法。然而,提升本身已经建立了一个相当复杂的结构--树的精炼序列。而你还在 用它 做别的事情)。 是的,我理解,要立即理解这个方法并不容易。我打算更详细地描述它。而数据在提交给CatBoost之前已经被处理过了,但我想做我自己的算法,这将考虑到分裂时 "衰减 "的变化动态,正如你所说的。 Aleksey Nikolayev#: 有点像带有半衰期的放射性公式)我不认为人类活动可以用任何这样简单的公式来描述)你的 "优势频率 "很可能以某种高度不可预测的方式改变。 可能什么都没有,但你怎么检查呢? vladavd 2022.02.05 09:53 #25687 mytarmailS#: 谢谢你在很多事情上迷失了方向,太肤浅,对这些信息不加思考。 是的,我只是用这个工具工作了好几年,根本没有真正想清楚。 你到底不同意什么? Aleksei Kuznetsov 2022.02.05 09:54 #25688 Aleksey Vyazmikin#: 是的,我们这么说吧。不,现在我们把不等式规则的执行作为一个,看一下规则被样本触发时目标(比方说二元分类)的平均值,如果最初的平均值是,比方说,样本中的0.45,而只通过反应评估后是0.51,那么我们认为预测器(其图/量)的预测能力为0.06,即6%。我们收集了很多这样的预测器,这些预测器已经是独立的二进制预测器,并使用它们来建立一个模型。将所有这样的量子与所有(无论有无预测能力)的量子结合起来,的确不是一件快事,但如果用一个基础预测器来做,在此基础上确定一个有预测能力的量子,也许不是不合理的。但是,即使在理论上,这种再培训也会比较少,因为可能的组合比全样本中的少。尚待理解的是,为什么这种量子模式可以工作7年,然后突然停止...... 我是否正确理解了你在做什么?: 1)我们得到1棵树。 2)每个节点最多可以给出10个分支(在图片中我们发现更少,就说10个分支),每个分支由1个量子产生(一个量子是一块预测器的10%:要么是百分数,要么是10%的振幅,取决于使用哪种量化方法)。 3) 在第一次分裂后,我们找到3个量子,这些量子随后导致了一个成功的叶子 4) 随后的分裂又找到了一些好的分裂/量子,导致了成功的叶子 5) 我们在成功的叶子前记住了成功的量子 6) 建立一个新的树,它只使用我们选择的量子作为预测器 用我们量化第一棵树的方法来做,用我们的脚本量化预测器,我们从100个预测器中得到1000个,它们已经是二进制的0或1。如果预测器的值在这个范围内,它=1,如果不在,它=0。 由于我们只选择成功的路径/量子,所有被选中的量子的值都=1。如果所有预测因子=1,那么新的树就不能学习。答案已经知道了。还是没有必要再建一棵新树?如果预测器的值落在选定的量子范围内,我们会立即这样做吗? mytarmailS 2022.02.05 10:08 #25689 vladavd#: 是的,我只是用这个工具工作了多年,所以我根本没有真正想过这个问题。不同意什么,确切地说? 究竟用哪种工具? vladavd 2022.02.05 10:10 #25690 mytarmailS#: 用什么样的工具? 那么,照片里有什么呢?玻璃和制裁。 1...256225632564256525662567256825692570257125722573257425752576...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
谁知道是否有趋势决定论的测试...
对不同类型的趋势进行开箱测试
R best!!!!
对于线性趋势,sens.slope()是不错的选择。
金融数学和IR有什么好理解的,你需要知道市场的机制和它的参与者
在大多数情况下,群众必然会输,因为它的反面角色是一个 "主要角色"。
1)你需要看到零售买家和卖家的不平衡,例如,如果有许多卖家,那么 "大玩家"(买家)就在交易的另一边。
比如说现在在犹太人身上,很多卖家
2)也有逆向交易的时刻,这是做市商
人们总是看到,价格的走势与人群相反(反相关)。
当人群在购买并相信增长时,价格会下降,反之亦然......
这就是整个市场...
p.s. 而且我肯定会看视频的。
这也有问题,而且问题不小。我们只掌握了市场上的一小部分,不知道其代表性和可靠性如何。第二张图片(一般情绪)根本没有用。首先,反转经常发生在 "逆向 "趋势似乎应该继续的极端点。第二,制裁只是简单地重复价格(颠倒了,少了趋势)--反转任何振荡器,你会得到一个非常相似的画面。好吧,如果指标重复了价格,这意味着它的预测并不比价格图表本身更容易,对吗?第一张图片(玻璃和开仓)和利润率的价值更有价值,但它也是如此。非常值得怀疑。
具体如何编码(从组合学的角度来看)并无太大区别。重点是一样的--每条线都有哪些规则被执行,哪些不被执行的特点。它总是2^N的变体,其中N是规则的数量。之后,这些规则中的每一条都将被纳入最终的2^(2^N)个变体的集合。很明显,不可能只是正式地尝试这么多的变体。这就是为什么以合理的方式安排它们是有意义的。例如,首先我们采取所有只由一条规则描述的变体,然后是所有只由两条规则描述的变体,以此类推。或者类似这样的事情。
也许我没有解释清楚,但我想再次强调,我们正在使用初始样本,在CatBoost学习算法中,初始样本被量化了一次,即假设我们有1000个预测器,我们把它们各自量化为10个段,结果我们有10000个段--进一步说,CatBoost算法随机拉出预测器,并通过边缘/量子进行分割/分裂,为了选择一个处于中间的量子,它需要建立3个不等式或创建8个叶子,其中7个叶子会说垃圾,一个叶子说有价值的信息。算法是否会建立这样的树也是不确定的,因为有爱的随机性,一个相邻的量子可以进入叶子。而且只让它成为一棵树。在我的方法中,一个不平等就足够了--2片叶子。即使所有的预测因子都被使用,并且每个预测因子都有1片有用的叶子,在创建模型时,组合的数量也会少很多。但重要的是,噪音也会减少,因为不会有那么多错误的样本分区来稳定需要建立一个新的树(提升原理)。
例如,许多其他玩家迟早会发现他们。
那么,也许人们应该以某种方式检验这一理论?据此,有一个最小的优势重复出现的频率,在增加之后,它更有可能消失,而不是继续存在?
例如,我们衡量每半年,有一个1.5年的优势 - 我们认为半年将工作,如果它已经是2.5年,没有意义,并采取它 - 概率是更多,它将停止工作。
我不擅长科学公式,你能告诉我如何进行这种计算并检查假设吗?
对于线性趋势,sens.slope()是不错的选择。
谢谢
这也有问题,而且是相当多的问题。我们只有一小部分市场可用,我们不知道它的指示性和可靠性如何。第二张图片(整体情绪)完全没有用。首先,反转经常发生在 "逆向 "趋势似乎应该继续的极端点。第二,制裁只是简单地重复价格(颠倒了,少了趋势)--反转任何振荡器,你会得到一个非常相似的画面。好吧,如果指标重复了价格,这意味着它的预测并不比价格图表本身更容易,对吗?第一张图片(玻璃和开仓)和利润率的价值更有价值,但它也是如此。非常值得怀疑。
你在很多事情上迷失了方向,你太肤浅了,对信息的认知不假思索。
也许我没有解释清楚,但我想再次强调,我们的工作对象是原始样本,在CatBoost学习算法中,它被量化了一次,即假设我们有1000个预测器,我们把它们各自量化为10个段,结果我们有10000个段--进一步说,CatBoost算法随机拉出预测器,并通过边缘/量子进行分割/分裂,为了选择一个处于中间的量子,它需要建立3个不等式或创建8个叶子,其中7个叶子会说垃圾,一个叶子说有价值的信息。算法是否会建立这样一棵树也是不确定的,因为有爱的随机性,相邻的量子可以进入一个叶子。而且只让它成为一棵树。在我的方法中,一个不平等就足够了--2片叶子。即使所有的预测因子都被使用,并且每个预测因子都有1片有用的叶子,在创建模型时,组合的数量也会少很多。但重要的是,噪音也会减少,因为不会有那么多错误的样本分区来稳定你需要建立一个新的树(提升原理)。
也许你应该在一个单一决策树的例子上描述你的方法。不过,就其本身而言,提升已经建立了一个相当复杂的结构--精炼树序列。而你还在 用它 做别的事情)。
那么也许你需要以某种方式检查这个理论?据此,有一个最小的优势复现频率,在其增加之后,其消失的可能性大于其继续存在的可能性?
例如,我们每半年测量一次,有1.5年的优势--我们认为半年后仍然可以工作,如果已经是2.5年了,就没有意义了,采取它--它将停止工作的概率更高。
我对科学公式不擅长,你能告诉我如何进行这样的计算并检查假设吗?
类似于带有半衰期的放射性公式)我不认为人类活动可以用这种简单的公式来描述)你的 "优势频率 "会发生变化,很可能是某种非常不可预测的变化。
也许你应该以一棵决策树为例来阐述你的方法。然而,提升本身已经建立了一个相当复杂的结构--树的精炼序列。而你还在 用它 做别的事情)。
是的,我理解,要立即理解这个方法并不容易。我打算更详细地描述它。而数据在提交给CatBoost之前已经被处理过了,但我想做我自己的算法,这将考虑到分裂时 "衰减 "的变化动态,正如你所说的。
有点像带有半衰期的放射性公式)我不认为人类活动可以用任何这样简单的公式来描述)你的 "优势频率 "很可能以某种高度不可预测的方式改变。
可能什么都没有,但你怎么检查呢?
谢谢
你在很多事情上迷失了方向,太肤浅,对这些信息不加思考。
是的,我只是用这个工具工作了好几年,根本没有真正想清楚。
你到底不同意什么?
是的,我们这么说吧。
不,现在我们把不等式规则的执行作为一个,看一下规则被样本触发时目标(比方说二元分类)的平均值,如果最初的平均值是,比方说,样本中的0.45,而只通过反应评估后是0.51,那么我们认为预测器(其图/量)的预测能力为0.06,即6%。
我们收集了很多这样的预测器,这些预测器已经是独立的二进制预测器,并使用它们来建立一个模型。
将所有这样的量子与所有(无论有无预测能力)的量子结合起来,的确不是一件快事,但如果用一个基础预测器来做,在此基础上确定一个有预测能力的量子,也许不是不合理的。
但是,即使在理论上,这种再培训也会比较少,因为可能的组合比全样本中的少。
尚待理解的是,为什么这种量子模式可以工作7年,然后突然停止......
1)我们得到1棵树。
2)每个节点最多可以给出10个分支(在图片中我们发现更少,就说10个分支),每个分支由1个量子产生(一个量子是一块预测器的10%:要么是百分数,要么是10%的振幅,取决于使用哪种量化方法)。
3) 在第一次分裂后,我们找到3个量子,这些量子随后导致了一个成功的叶子
4) 随后的分裂又找到了一些好的分裂/量子,导致了成功的叶子
5) 我们在成功的叶子前记住了成功的量子
6) 建立一个新的树,它只使用我们选择的量子作为预测器
用我们量化第一棵树的方法来做,用我们的脚本量化预测器,我们从100个预测器中得到1000个,它们已经是二进制的0或1。如果预测器的值在这个范围内,它=1,如果不在,它=0。
由于我们只选择成功的路径/量子,所有被选中的量子的值都=1。如果所有预测因子=1,那么新的树就不能学习。答案已经知道了。
还是没有必要再建一棵新树?如果预测器的值落在选定的量子范围内,我们会立即这样做吗?
是的,我只是用这个工具工作了多年,所以我根本没有真正想过这个问题。
不同意什么,确切地说?
究竟用哪种工具?
用什么样的工具?
那么,照片里有什么呢?玻璃和制裁。