交易中的机器学习:理论、模型、实践和算法交易 - 页 3282 1...327532763277327832793280328132823283328432853286328732883289...3399 新评论 СанСаныч Фоменко 2023.10.04 15:29 #32811 Aleksey Vyazmikin #:我从 2010 年到 2023 年抽取了一个样本(4.7 万行),按时间顺序分成 3 部分,并决定看看如果我们交换这些部分会发生什么。子样本的大小为:训练 - 60%,测试 - 20%,考试 - 20%。我做了这些组合(-1)--这是标准顺序--时间顺序。每个子样本都有自己的颜色。对每组样本使用不同的 Seed 训练了 101 个模型,结果如下所有指标都是标准的,可以看出,很难确定模型的平均利润(AVR 利润),以及在未参与训练的最后一个样本上利润超过 3000 点的模型的百分比。也许应该减少训练样本中 -1 和 0 变体的相对成功率?总的来说,Recall 似乎对此有所反应。您认为,在我们的情况下,这种组合的结果是否应该具有可比性?还是说数据已经无法挽回地过时了? 另一个自己动手做的... 有交叉验证,一切都经过咀嚼和咀嚼......,广泛使用.... Aleksey Vyazmikin 2023.10.04 15:42 #32812 СанСаныч Фоменко #:另一个自制的...交叉验证,事事咀嚼......,广泛应用..... 这就是问题所在,交叉验证在这里可能无法有效发挥作用。 那么这种自我设计又有什么意义呢?马克西姆按时间顺序翻转样本--假设结果是相同的--我的实验表明了这一谬误。或者说,一切都是个别的,验证可能会发现整个样本中存在随机的模式或现象。 Maxim Dmitrievsky 2023.10.04 16:09 #32813 Aleksey Vyazmikin #:这就是问题所在,交叉验证在这里可能无法有效发挥作用。自我交易又在哪里呢?马克西姆按时间顺序翻转样本--假设结果是相同的--我的实验显示了这一谬误。或者说,一切都是个别的,验证可能会揭示整个样本的随机模式或发生情况。 不要把箭头移到马克西姆身上,尤其是当他没有做甚至没有想过任何建议的事情时。 Aleksey Vyazmikin 2023.10.04 16:12 #32814 Maxim Dmitrievsky #:你不应该和马克西姆翻脸,尤其是他并没有做你建议的任何事情。 他没做是什么意思?你不是已经在用最近的历史训练模型了吗? Maxim Dmitrievsky 2023.10.04 16:15 #32815 fxsaber #:当没有矩阵可以处理它时。在一个 10M 的字符串中找到长度为 30K 的相似字符串需要 3 秒钟。 这并不是计算所有可能的相关模式,而是将源数据与其他数据进行比较。你不需要矩阵,只需要一个向量。 Maxim Dmitrievsky 2023.10.04 16:16 #32816 Aleksey Vyazmikin #:什么叫我没有?你不是已经根据最近的历史对模型进行了训练吗? 我不记得是谁先发现的了某个书呆子对我来说无所谓 Aleksey Vyazmikin 2023.10.04 16:17 #32817 Maxim Dmitrievsky #:我不记得是谁先挑起的。这对我来说并不重要。 你的情况和我的有什么不同? Maxim Dmitrievsky 2023.10.04 16:19 #32818 Aleksey Vyazmikin #:你的情况与我的有何不同? 因为我不喜欢与文盲诡辩家和心理学家交流 ) 这种人不会产生有用的内容 Aleksey Vyazmikin 2023.10.04 16:29 #32819 Maxim Dmitrievsky #:因为我不喜欢与文盲诡辩家和心理学家交谈 )这种人不会产生有用的内容 你的 "爱 "会以某种神奇的方式影响数据吗? fxsaber 2023.10.04 16:39 #32820 Maxim Dmitrievsky #:这并不是在计算所有可能的相关模式,而是将源数据与其他数据进行比较。这里不需要矩阵,一个向量就足够了。 这是逐行计算矩阵的核心。 1...327532763277327832793280328132823283328432853286328732883289...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
我从 2010 年到 2023 年抽取了一个样本(4.7 万行),按时间顺序分成 3 部分,并决定看看如果我们交换这些部分会发生什么。
子样本的大小为:训练 - 60%,测试 - 20%,考试 - 20%。
我做了这些组合(-1)--这是标准顺序--时间顺序。每个子样本都有自己的颜色。
对每组样本使用不同的 Seed 训练了 101 个模型,结果如下
所有指标都是标准的,可以看出,很难确定模型的平均利润(AVR 利润),以及在未参与训练的最后一个样本上利润超过 3000 点的模型的百分比。
也许应该减少训练样本中 -1 和 0 变体的相对成功率?总的来说,Recall 似乎对此有所反应。
您认为,在我们的情况下,这种组合的结果是否应该具有可比性?还是说数据已经无法挽回地过时了?
另一个自己动手做的...
有交叉验证,一切都经过咀嚼和咀嚼......,广泛使用....
另一个自制的...
交叉验证,事事咀嚼......,广泛应用.....
这就是问题所在,交叉验证在这里可能无法有效发挥作用。
那么这种自我设计又有什么意义呢?马克西姆按时间顺序翻转样本--假设结果是相同的--我的实验表明了这一谬误。或者说,一切都是个别的,验证可能会发现整个样本中存在随机的模式或现象。
这就是问题所在,交叉验证在这里可能无法有效发挥作用。
自我交易又在哪里呢?马克西姆按时间顺序翻转样本--假设结果是相同的--我的实验显示了这一谬误。或者说,一切都是个别的,验证可能会揭示整个样本的随机模式或发生情况。
不要把箭头移到马克西姆身上,尤其是当他没有做甚至没有想过任何建议的事情时。
你不应该和马克西姆翻脸,尤其是他并没有做你建议的任何事情。
他没做是什么意思?你不是已经在用最近的历史训练模型了吗?
当没有矩阵可以处理它时。
在一个 10M 的字符串中找到长度为 30K 的相似字符串需要 3 秒钟。
这并不是计算所有可能的相关模式,而是将源数据与其他数据进行比较。你不需要矩阵,只需要一个向量。
什么叫我没有?你不是已经根据最近的历史对模型进行了训练吗?
我不记得是谁先发现的了某个书呆子对我来说无所谓
我不记得是谁先挑起的。这对我来说并不重要。
你的情况和我的有什么不同?
你的情况与我的有何不同?
因为我不喜欢与文盲诡辩家和心理学家交流 )
这种人不会产生有用的内容
因为我不喜欢与文盲诡辩家和心理学家交谈 )
这种人不会产生有用的内容
你的 "爱 "会以某种神奇的方式影响数据吗?
这并不是在计算所有可能的相关模式,而是将源数据与其他数据进行比较。这里不需要矩阵,一个向量就足够了。
这是逐行计算矩阵的核心。