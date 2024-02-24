交易中的机器学习：理论、模型、实践和算法交易 - 页 2569 1...256225632564256525662567256825692570257125722573257425752576...3399 新评论 Aleksey Nikolayev 2022.02.05 08:44 #25681 mytarmailS#: 谁知道是否有趋势决定论的测试... 你需要知道这是否真的是一种趋势或随机的波动... 也许是同一个赫斯特？ 对不同类型的趋势进行开箱测试R best!!!! 对于线性趋势，sens.slope()是不错的选择。 vladavd 2022.02.05 08:53 #25682 mytarmailS#: 金融数学和IR有什么好理解的，你需要知道市场的机制和它的参与者在大多数情况下，群众必然会输，因为它的反面角色是一个 "主要角色"。1）你需要看到零售买家和卖家的不平衡，例如，如果有许多卖家，那么 "大玩家"（买家）就在交易的另一边。比如说现在在犹太人身上，很多卖家2）也有逆向交易的时刻，这是做市商人们总是看到，价格的走势与人群相反（反相关）。当人群在购买并相信增长时，价格会下降，反之亦然......这就是整个市场...p.s. 而且我肯定会看视频的。 这也有问题，而且问题不小。我们只掌握了市场上的一小部分，不知道其代表性和可靠性如何。第二张图片（一般情绪）根本没有用。首先，反转经常发生在 "逆向 "趋势似乎应该继续的极端点。第二，制裁只是简单地重复价格（颠倒了，少了趋势）--反转任何振荡器，你会得到一个非常相似的画面。好吧，如果指标重复了价格，这意味着它的预测并不比价格图表本身更容易，对吗？第一张图片（玻璃和开仓）和利润率的价值更有价值，但它也是如此。非常值得怀疑。 Aleksey Vyazmikin 2022.02.05 09:05 #25683 Aleksey Nikolayev#: 具体如何编码（从组合学的角度来看）并无太大区别。重点是一样的--每条线都有哪些规则被执行，哪些不被执行的特点。它总是2^N的变体，其中N是规则的数量。之后，这些规则中的每一条都将被纳入最终的2^(2^N)个变体的集合。很明显，不可能只是正式地尝试这么多的变体。这就是为什么以合理的方式安排它们是有意义的。例如，首先我们采取所有只由一条规则描述的变体，然后是所有只由两条规则描述的变体，以此类推。或者类似这样的事情。 也许我没有解释清楚，但我想再次强调，我们正在使用初始样本，在CatBoost学习算法中，初始样本被量化了一次，即假设我们有1000个预测器，我们把它们各自量化为10个段，结果我们有10000个段--进一步说，CatBoost算法随机拉出预测器，并通过边缘/量子进行分割/分裂，为了选择一个处于中间的量子，它需要建立3个不等式或创建8个叶子，其中7个叶子会说垃圾，一个叶子说有价值的信息。算法是否会建立这样的树也是不确定的，因为有爱的随机性，一个相邻的量子可以进入叶子。而且只让它成为一棵树。在我的方法中，一个不平等就足够了--2片叶子。即使所有的预测因子都被使用，并且每个预测因子都有1片有用的叶子，在创建模型时，组合的数量也会少很多。但重要的是，噪音也会减少，因为不会有那么多错误的样本分区来稳定需要建立一个新的树（提升原理）。 Aleksey Nikolayev# :例如，许多其他玩家迟早会发现他们。 那么，也许人们应该以某种方式检验这一理论？据此，有一个最小的优势重复出现的频率，在增加之后，它更有可能消失，而不是继续存在？ 例如，我们衡量每半年，有一个1.5年的优势 - 我们认为半年将工作，如果它已经是2.5年，没有意义，并采取它 - 概率是更多，它将停止工作。 我不擅长科学公式，你能告诉我如何进行这种计算并检查假设吗？ mytarmailS 2022.02.05 09:29 #25684 Aleksey Nikolayev#: 对于线性趋势，sens.slope()是不错的选择。 谢谢 vladavd#: 这也有问题，而且是相当多的问题。我们只有一小部分市场可用，我们不知道它的指示性和可靠性如何。第二张图片（整体情绪）完全没有用。首先，反转经常发生在 "逆向 "趋势似乎应该继续的极端点。第二，制裁只是简单地重复价格（颠倒了，少了趋势）--反转任何振荡器，你会得到一个非常相似的画面。好吧，如果指标重复了价格，这意味着它的预测并不比价格图表本身更容易，对吗？第一张图片（玻璃和开仓）和利润率的价值更有价值，但它也是如此。非常值得怀疑。 你在很多事情上迷失了方向，你太肤浅了，对信息的认知不假思索。 Aleksey Nikolayev 2022.02.05 09:33 #25685 Aleksey Vyazmikin#: 也许我没有解释清楚，但我想再次强调，我们的工作对象是原始样本，在CatBoost学习算法中，它被量化了一次，即假设我们有1000个预测器，我们把它们各自量化为10个段，结果我们有10000个段--进一步说，CatBoost算法随机拉出预测器，并通过边缘/量子进行分割/分裂，为了选择一个处于中间的量子，它需要建立3个不等式或创建8个叶子，其中7个叶子会说垃圾，一个叶子说有价值的信息。算法是否会建立这样一棵树也是不确定的，因为有爱的随机性，相邻的量子可以进入一个叶子。而且只让它成为一棵树。在我的方法中，一个不平等就足够了--2片叶子。即使所有的预测因子都被使用，并且每个预测因子都有1片有用的叶子，在创建模型时，组合的数量也会少很多。但重要的是，噪音也会减少，因为不会有那么多错误的样本分区来稳定你需要建立一个新的树（提升原理）。 也许你应该在一个单一决策树的例子上描述你的方法。不过，就其本身而言，提升已经建立了一个相当复杂的结构--精炼树序列。而你还在 用它 做别的事情）。 Aleksey Vyazmikin#: 那么也许你需要以某种方式检查这个理论？据此，有一个最小的优势复现频率，在其增加之后，其消失的可能性大于其继续存在的可能性？例如，我们每半年测量一次，有1.5年的优势--我们认为半年后仍然可以工作，如果已经是2.5年了，就没有意义了，采取它--它将停止工作的概率更高。我对科学公式不擅长，你能告诉我如何进行这样的计算并检查假设吗？ 类似于带有半衰期的放射性公式）我不认为人类活动可以用这种简单的公式来描述）你的 "优势频率 "会发生变化，很可能是某种非常不可预测的变化。 Aleksey Vyazmikin 2022.02.05 09:50 #25686 Aleksey Nikolayev#: 也许你应该以一棵决策树为例来阐述你的方法。然而，提升本身已经建立了一个相当复杂的结构--树的精炼序列。而你还在 用它 做别的事情）。 是的，我理解，要立即理解这个方法并不容易。我打算更详细地描述它。而数据在提交给CatBoost之前已经被处理过了，但我想做我自己的算法，这将考虑到分裂时 "衰减 "的变化动态，正如你所说的。 Aleksey Nikolayev#: 有点像带有半衰期的放射性公式）我不认为人类活动可以用任何这样简单的公式来描述）你的 "优势频率 "很可能以某种高度不可预测的方式改变。 可能什么都没有，但你怎么检查呢？ vladavd 2022.02.05 09:53 #25687 mytarmailS#: 谢谢你在很多事情上迷失了方向，太肤浅，对这些信息不加思考。 是的，我只是用这个工具工作了好几年，根本没有真正想清楚。 你到底不同意什么？ Aleksei Kuznetsov 2022.02.05 09:54 #25688 Aleksey Vyazmikin#: 是的，我们这么说吧。不，现在我们把不等式规则的执行作为一个，看一下规则被样本触发时目标（比方说二元分类）的平均值，如果最初的平均值是，比方说，样本中的0.45，而只通过反应评估后是0.51，那么我们认为预测器（其图/量）的预测能力为0.06，即6%。我们收集了很多这样的预测器，这些预测器已经是独立的二进制预测器，并使用它们来建立一个模型。将所有这样的量子与所有（无论有无预测能力）的量子结合起来，的确不是一件快事，但如果用一个基础预测器来做，在此基础上确定一个有预测能力的量子，也许不是不合理的。但是，即使在理论上，这种再培训也会比较少，因为可能的组合比全样本中的少。尚待理解的是，为什么这种量子模式可以工作7年，然后突然停止...... 我是否正确理解了你在做什么？: 1）我们得到1棵树。 2）每个节点最多可以给出10个分支（在图片中我们发现更少，就说10个分支），每个分支由1个量子产生（一个量子是一块预测器的10%：要么是百分数，要么是10%的振幅，取决于使用哪种量化方法）。 3) 在第一次分裂后，我们找到3个量子，这些量子随后导致了一个成功的叶子 4) 随后的分裂又找到了一些好的分裂/量子，导致了成功的叶子 5) 我们在成功的叶子前记住了成功的量子 6) 建立一个新的树，它只使用我们选择的量子作为预测器 用我们量化第一棵树的方法来做，用我们的脚本量化预测器，我们从100个预测器中得到1000个，它们已经是二进制的0或1。如果预测器的值在这个范围内，它=1，如果不在，它=0。 由于我们只选择成功的路径/量子，所有被选中的量子的值都=1。如果所有预测因子=1，那么新的树就不能学习。答案已经知道了。还是没有必要再建一棵新树？如果预测器的值落在选定的量子范围内，我们会立即这样做吗？ mytarmailS 2022.02.05 10:08 #25689 vladavd#: 是的，我只是用这个工具工作了多年，所以我根本没有真正想过这个问题。不同意什么，确切地说？ 究竟用哪种工具？ vladavd 2022.02.05 10:10 #25690 mytarmailS#: 用什么样的工具？ 那么，照片里有什么呢？玻璃和制裁。 1...256225632564256525662567256825692570257125722573257425752576...3399 新评论 您错过了交易机会： 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符（不带空格） 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号，请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置，否则您将无法登录。 忘记您的登录名/密码？ 使用 Google 登录
谁知道是否有趋势决定论的测试...
对不同类型的趋势进行开箱测试
对于线性趋势，sens.slope()是不错的选择。
金融数学和IR有什么好理解的，你需要知道市场的机制和它的参与者
在大多数情况下，群众必然会输，因为它的反面角色是一个 "主要角色"。
1）你需要看到零售买家和卖家的不平衡，例如，如果有许多卖家，那么 "大玩家"（买家）就在交易的另一边。
比如说现在在犹太人身上，很多卖家
2）也有逆向交易的时刻，这是做市商
人们总是看到，价格的走势与人群相反（反相关）。
当人群在购买并相信增长时，价格会下降，反之亦然......
这就是整个市场...
这也有问题，而且问题不小。我们只掌握了市场上的一小部分，不知道其代表性和可靠性如何。第二张图片（一般情绪）根本没有用。首先，反转经常发生在 "逆向 "趋势似乎应该继续的极端点。第二，制裁只是简单地重复价格（颠倒了，少了趋势）--反转任何振荡器，你会得到一个非常相似的画面。好吧，如果指标重复了价格，这意味着它的预测并不比价格图表本身更容易，对吗？第一张图片（玻璃和开仓）和利润率的价值更有价值，但它也是如此。非常值得怀疑。
具体如何编码（从组合学的角度来看）并无太大区别。重点是一样的--每条线都有哪些规则被执行，哪些不被执行的特点。它总是2^N的变体，其中N是规则的数量。之后，这些规则中的每一条都将被纳入最终的2^(2^N)个变体的集合。很明显，不可能只是正式地尝试这么多的变体。这就是为什么以合理的方式安排它们是有意义的。例如，首先我们采取所有只由一条规则描述的变体，然后是所有只由两条规则描述的变体，以此类推。或者类似这样的事情。
也许我没有解释清楚，但我想再次强调，我们正在使用初始样本，在CatBoost学习算法中，初始样本被量化了一次，即假设我们有1000个预测器，我们把它们各自量化为10个段，结果我们有10000个段--进一步说，CatBoost算法随机拉出预测器，并通过边缘/量子进行分割/分裂，为了选择一个处于中间的量子，它需要建立3个不等式或创建8个叶子，其中7个叶子会说垃圾，一个叶子说有价值的信息。算法是否会建立这样的树也是不确定的，因为有爱的随机性，一个相邻的量子可以进入叶子。而且只让它成为一棵树。在我的方法中，一个不平等就足够了--2片叶子。即使所有的预测因子都被使用，并且每个预测因子都有1片有用的叶子，在创建模型时，组合的数量也会少很多。但重要的是，噪音也会减少，因为不会有那么多错误的样本分区来稳定需要建立一个新的树（提升原理）。
例如，许多其他玩家迟早会发现他们。
那么，也许人们应该以某种方式检验这一理论？据此，有一个最小的优势重复出现的频率，在增加之后，它更有可能消失，而不是继续存在？
例如，我们衡量每半年，有一个1.5年的优势 - 我们认为半年将工作，如果它已经是2.5年，没有意义，并采取它 - 概率是更多，它将停止工作。
我不擅长科学公式，你能告诉我如何进行这种计算并检查假设吗？
也许我没有解释清楚，但我想再次强调，我们的工作对象是原始样本，在CatBoost学习算法中，它被量化了一次，即假设我们有1000个预测器，我们把它们各自量化为10个段，结果我们有10000个段--进一步说，CatBoost算法随机拉出预测器，并通过边缘/量子进行分割/分裂，为了选择一个处于中间的量子，它需要建立3个不等式或创建8个叶子，其中7个叶子会说垃圾，一个叶子说有价值的信息。算法是否会建立这样一棵树也是不确定的，因为有爱的随机性，相邻的量子可以进入一个叶子。而且只让它成为一棵树。在我的方法中，一个不平等就足够了--2片叶子。即使所有的预测因子都被使用，并且每个预测因子都有1片有用的叶子，在创建模型时，组合的数量也会少很多。但重要的是，噪音也会减少，因为不会有那么多错误的样本分区来稳定你需要建立一个新的树（提升原理）。
也许你应该在一个单一决策树的例子上描述你的方法。不过，就其本身而言，提升已经建立了一个相当复杂的结构--精炼树序列。而你还在 用它 做别的事情）。
那么也许你需要以某种方式检查这个理论？据此，有一个最小的优势复现频率，在其增加之后，其消失的可能性大于其继续存在的可能性？
例如，我们每半年测量一次，有1.5年的优势--我们认为半年后仍然可以工作，如果已经是2.5年了，就没有意义了，采取它--它将停止工作的概率更高。
我对科学公式不擅长，你能告诉我如何进行这样的计算并检查假设吗？
类似于带有半衰期的放射性公式）我不认为人类活动可以用这种简单的公式来描述）你的 "优势频率 "会发生变化，很可能是某种非常不可预测的变化。
也许你应该以一棵决策树为例来阐述你的方法。然而，提升本身已经建立了一个相当复杂的结构--树的精炼序列。而你还在 用它 做别的事情）。
是的，我理解，要立即理解这个方法并不容易。我打算更详细地描述它。而数据在提交给CatBoost之前已经被处理过了，但我想做我自己的算法，这将考虑到分裂时 "衰减 "的变化动态，正如你所说的。
有点像带有半衰期的放射性公式）我不认为人类活动可以用任何这样简单的公式来描述）你的 "优势频率 "很可能以某种高度不可预测的方式改变。
可能什么都没有，但你怎么检查呢？
是的，我们这么说吧。
不，现在我们把不等式规则的执行作为一个，看一下规则被样本触发时目标（比方说二元分类）的平均值，如果最初的平均值是，比方说，样本中的0.45，而只通过反应评估后是0.51，那么我们认为预测器（其图/量）的预测能力为0.06，即6%。
我们收集了很多这样的预测器，这些预测器已经是独立的二进制预测器，并使用它们来建立一个模型。
将所有这样的量子与所有（无论有无预测能力）的量子结合起来，的确不是一件快事，但如果用一个基础预测器来做，在此基础上确定一个有预测能力的量子，也许不是不合理的。
但是，即使在理论上，这种再培训也会比较少，因为可能的组合比全样本中的少。
尚待理解的是，为什么这种量子模式可以工作7年，然后突然停止......
1）我们得到1棵树。
2）每个节点最多可以给出10个分支（在图片中我们发现更少，就说10个分支），每个分支由1个量子产生（一个量子是一块预测器的10%：要么是百分数，要么是10%的振幅，取决于使用哪种量化方法）。
3) 在第一次分裂后，我们找到3个量子，这些量子随后导致了一个成功的叶子
4) 随后的分裂又找到了一些好的分裂/量子，导致了成功的叶子
5) 我们在成功的叶子前记住了成功的量子
6) 建立一个新的树，它只使用我们选择的量子作为预测器
用我们量化第一棵树的方法来做，用我们的脚本量化预测器，我们从100个预测器中得到1000个，它们已经是二进制的0或1。如果预测器的值在这个范围内，它=1，如果不在，它=0。
由于我们只选择成功的路径/量子，所有被选中的量子的值都=1。如果所有预测因子=1，那么新的树就不能学习。答案已经知道了。
还是没有必要再建一棵新树？如果预测器的值落在选定的量子范围内，我们会立即这样做吗？
那么，照片里有什么呢？玻璃和制裁。