交易中的机器学习:理论、模型、实践和算法交易 - 页 2878 1...287128722873287428752876287728782879288028812882288328842885...3399 新评论 Aleksey Nikolayev 2022.12.30 21:08 #28771 Maxim Dmitrievsky #:很明显,我们可以尝试使用哈希函数。但我想问的是,选择任意长度的矢量,或者说选择它们的长度:),以及从哪些数据中选择矢量的原则 是什么。可能有很多变体第一种方法更容易接受,但你需要在逻辑中加入一些东西 这是一个非常重要的问题,我一直在思考这个问题)让我们来谈谈所用历史记录的长度。你需要在相关性和计算长度之间找到一个合理的折中。越短,相关性越强,但越长,计算就越精确。有时,一个好的折衷方案在原则上是无法实现的。 Aleksey Nikolayev 2022.12.30 21:10 #28772 Maxim Dmitrievsky #:干得好,在改变窗口长度的背景下,我自己也发现了一些有趣的东西。如果您还有其他问题,请勾画出来,我将在新年后向您请教。 好的,祝大家新年快乐!) Maxim Dmitrievsky 2022.12.30 21:10 #28773 Aleksey Nikolayev #:祝大家新年快乐) 同样:) Forester 2022.12.30 21:29 #28774 我不太清楚你从 GPT 对话中得到了什么。他有时会答非所问。下面是一个例子 В идеале, алгоритм должен получать на вход всю доступную историю, которая очевидно со временем растёт. Он сам должен определять на какие куски её нарезать и что с ними делать. *是的,理想情况下,算法应该能够处理任何数量的特征 你问的是改变行 的长度,他回答的是改变列的长度。 实际上,可以通过重新训练模型来改变历史记录的长度。例如,在 1 天、3 天、7 天、1 个月、2 个月......上进行训练。在 1 年、2 年、3 年......无论哪种长度的历史记录都能很好地预测结果--使用它。 sibirqk 2022.12.31 06:04 #28775 Aleksey Nikolayev #:这是一个非常重要的问题,我一直在思考这个问题)让我们来谈谈所用历史记录的长度。计算的相关性和长度之间应该有一个合理的折衷。越短,相关性越强,但越长,计算就越精确。有时,一个好的折衷方案在原则上是无法实现的。 我很久以前也想过这个问题,我认为这是建立工作 TS 的最重要时刻之一。就我自己而言,我使用这种方法--在已知的大历史上粗略分析金融资产的一些特征,找到变化趋势的坐标--趋势、波动率等,然后从最后一个变化点开始计算,假设这一总体特征将保持一段时间。 Aleksey Nikolayev 2022.12.31 08:28 #28776 elibrarius 行的长度,他回答的是改变列的长度。 实际上,可以通过重新训练模型来改变历史记录的长度。例如,在 1 天、3 天、7 天、1 个月、2 个月......上进行训练。在 1 年、2 年、3 年......无论哪种长度的历史记录都能很好地预测结果--使用该长度。 列的问题还没有讨论过--还很遥远。造成混淆的原因是,我们没有说标志就是价格(柱状图、renko 等)。也就是说,我们讨论的是同质属性向量的任意长度。如果除了属性向量的任意长度外,我们还想要任意类型的属性,这显然已经是矫枉过正了。 mytarmailS 2022.12.31 09:05 #28777 Aleksey Nikolayev #:问题是,SB 很擅长让人觉得有规则可循--唯一的问题是,不同的网站会有不同的规则。因此,仔细想想,这并不是一个任意特征数量的问题,而是一个特征不变性的问题。https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf СанСаныч Фоменко 2022.12.31 10:29 #28778 Aleksey Nikolayev #:这是一个非常重要的问题,我一直在思考这个问题)让我们来谈谈所用历史记录的长度。计算的相关性和长度之间应该有一个合理的折衷。越短,相关性越强,但越长,计算就越精确。有时,一个好的折衷方案在原则上是无法实现的。 你需要一个标准,而唯一的标准就是模型拟合误差。 下面是一张图片 这是一个包含 2000 个条形图、43 个变量的样本。我们可以看到,增加超过 100 棵树的数量是没有意义的。我改变了样本量。结果是图片在 1500 条以上没有变化。这意味着,我的老师的预测因子中的模式数量约为 100 个,它们都可以在 1500 条历史数据中找到。而且这些模式是重复出现的。 Aleksey Nikolayev 2022.12.31 11:15 #28779 mytarmailS #:那么仔细想想,这就不是一个任意特征数量的问题,而是一个特征不变性的问题。https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf 如果把它比作图片识别,那么大致上就是为每个点找到该点所在物体(blob)的边界。 问题是,图片的质量极差,而且图片上的实际内容也不太清楚。 在这种情况下,选择一个小的物体是不现实的,而选择一个大的物体则是模棱两可的。 Aleksey Nikolayev 2022.12.31 11:22 #28780 СанСаныч Фоменко #:你需要一个标准,而唯一的标准就是模型拟合误差。下面是一张图片这是一个包含 2000 个条形图、43 个变量的样本。我们可以看到,增加超过 100 棵树的数量是没有意义的。我改变了样本大小。结果是,超过 1500 个条形图就没有变化了。这意味着,我的教师预测因子中的模式数量约为 100 个,而这些模式都可以在 1500 条历史数据中找到。而且这些模式是重复出现的。 1500 条是医院的平均温度。会有断点,当一半的历史截然不同时,最好不要计算和交易任何东西。 1...287128722873287428752876287728782879288028812882288328842885...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
很明显,我们可以尝试使用哈希函数。但我想问的是,选择任意长度的矢量,或者说选择它们的长度:),以及从哪些数据中选择矢量的原则 是什么。
可能有很多变体
第一种方法更容易接受,但你需要在逻辑中加入一些东西
这是一个非常重要的问题,我一直在思考这个问题)让我们来谈谈所用历史记录的长度。你需要在相关性和计算长度之间找到一个合理的折中。越短,相关性越强,但越长,计算就越精确。有时,一个好的折衷方案在原则上是无法实现的。
干得好,在改变窗口长度的背景下,我自己也发现了一些有趣的东西。
如果您还有其他问题,请勾画出来,我将在新年后向您请教。
好的,祝大家新年快乐!)
祝大家新年快乐)
同样:)
我不太清楚你从 GPT 对话中得到了什么。
他有时会答非所问。下面是一个例子
В идеале, алгоритм должен получать на вход всю доступную историю, которая очевидно со временем растёт. Он сам должен определять на какие куски её нарезать и что с ними делать.
*是的,理想情况下,算法应该能够处理任何数量的特征
你问的是改变行 的长度,他回答的是改变列的长度。
实际上,可以通过重新训练模型来改变历史记录的长度。例如,在 1 天、3 天、7 天、1 个月、2 个月......上进行训练。在 1 年、2 年、3 年......无论哪种长度的历史记录都能很好地预测结果--使用它。这是一个非常重要的问题,我一直在思考这个问题)让我们来谈谈所用历史记录的长度。计算的相关性和长度之间应该有一个合理的折衷。越短,相关性越强,但越长,计算就越精确。有时,一个好的折衷方案在原则上是无法实现的。
我很久以前也想过这个问题,我认为这是建立工作 TS 的最重要时刻之一。就我自己而言,我使用这种方法--在已知的大历史上粗略分析金融资产的一些特征,找到变化趋势的坐标--趋势、波动率等,然后从最后一个变化点开始计算,假设这一总体特征将保持一段时间。
实际上,可以通过重新训练模型来改变历史记录的长度。例如,在 1 天、3 天、7 天、1 个月、2 个月......上进行训练。在 1 年、2 年、3 年......无论哪种长度的历史记录都能很好地预测结果--使用该长度。
列的问题还没有讨论过--还很遥远。造成混淆的原因是,我们没有说标志就是价格(柱状图、renko 等)。也就是说,我们讨论的是同质属性向量的任意长度。如果除了属性向量的任意长度外,我们还想要任意类型的属性,这显然已经是矫枉过正了。
问题是,SB 很擅长让人觉得有规则可循--唯一的问题是,不同的网站会有不同的规则。
因此,仔细想想,这并不是一个任意特征数量的问题,而是一个特征不变性的问题。
https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf这是一个非常重要的问题,我一直在思考这个问题)让我们来谈谈所用历史记录的长度。计算的相关性和长度之间应该有一个合理的折衷。越短,相关性越强,但越长,计算就越精确。有时,一个好的折衷方案在原则上是无法实现的。
你需要一个标准,而唯一的标准就是模型拟合误差。
下面是一张图片
这是一个包含 2000 个条形图、43 个变量的样本。我们可以看到,增加超过 100 棵树的数量是没有意义的。我改变了样本量。结果是图片在 1500 条以上没有变化。这意味着,我的老师的预测因子中的模式数量约为 100 个,它们都可以在 1500 条历史数据中找到。而且这些模式是重复出现的。
那么仔细想想,这就不是一个任意特征数量的问题,而是一个特征不变性的问题。
https://homes.esat.kuleuven.be/~tuytelaa/tutorial-ECCV06.pdf如果把它比作图片识别,那么大致上就是为每个点找到该点所在物体(blob)的边界。
问题是,图片的质量极差,而且图片上的实际内容也不太清楚。
在这种情况下,选择一个小的物体是不现实的,而选择一个大的物体则是模棱两可的。
你需要一个标准,而唯一的标准就是模型拟合误差。
下面是一张图片
这是一个包含 2000 个条形图、43 个变量的样本。我们可以看到,增加超过 100 棵树的数量是没有意义的。我改变了样本大小。结果是,超过 1500 个条形图就没有变化了。这意味着,我的教师预测因子中的模式数量约为 100 个,而这些模式都可以在 1500 条历史数据中找到。而且这些模式是重复出现的。
1500 条是医院的平均温度。会有断点,当一半的历史截然不同时,最好不要计算和交易任何东西。