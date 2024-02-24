交易中的机器学习：理论、模型、实践和算法交易 - 页 3190 1...318331843185318631873188318931903191319231933194319531963197...3399 新评论 Aleksey Vyazmikin 2023.08.20 08:20 #31891 Aleksey Nikolayev #:以某种方式将其与利润联系起来，至少是近似地联系起来，并将实际利润与随机利润样本进行比较。检验是否存在误差的标准是样本的平均利润等于零。检查实际利润相对于样本的正相关性--三西格玛法则。我不准备详谈您的任务，因为我自己的任务也很繁重。 当我们讨论为进一步分类而对数据进行预处理时，利润与之有什么关系？ Aleksey Nikolayev#: 你们的量子是为提取利润而设计的吗？有没有这方面的计划？将其极端简化，哪怕是近似但快速地计算一个样本，然后检查真实结果是否属于这个样本的尾部。你愿意要求人们深入研究你的思维模式，却又完全不愿意深入研究蒙特卡洛这样简单而广为人知的想法，实在令人厌烦。我想我已经受够了。 每个人都有权管理自己的时间。 但很显然，你并没有理解你提出建议的问题。 谢谢你的帮助。 Aleksei Kuznetsov 2023.08.20 08:23 #31892 Aleksey Vyazmikin #:我明白。我还有一个建议，为了使森林构建过程更易于管理，把选定量子段的一个具体子样作为每棵树的根，怎么样？深度应该是 2-3 分，这样叶片上可分类的例子就不会少于 1%。我认为这样的模型会更加稳定。 也就是说，如果您选择 10 个量子/拆分，然后在这些拆分的实例上训练 10 棵树？ 关于 OOS 的稳定性--实验会证明这一点。当改变数据窗口的大小（2 个月和 4 个月），甚至将数据窗口移动 2%（在周二而不是周六进行训练）时，我的稳定性就会受到破坏。树的结果是不同的。 Aleksey Vyazmikin#: 我对我发布 gifs 的样本进行了实验，样本中已有 47% 的单位，数据汇总于表中。... 结果表明，这些量子片段的质量（实用性）比原始 片段差（少）10 倍。 当我与 fxsaber 交流时，我认为这种劣化（倍）是由于他的算法造成的。但他的数据并没有如此大的差异。很明显，这是因为他的标注中并不是所有条形图都排成一行（或行排成一行），而是有很大的间隙。如果你的条形图很接近，那么它们的过去和未来就很相似，也就是说，20 个 1 类的例子可以排成一行。通过随机化，您可以使它们的平均值为 0101010....，并将整个系列的 20 个 "1 "变为 20 个 "0"。因为它们很接近，可以算作一个例子。如果对您来说不是这样，那么对我来说就是这样（我是连续评估所有条形图的，所以才会 有这样的想法）。 一般来说，我认为 10 次的差异如此之大，可以不进行 10000 次测试。前 10 次测试的差异太明显了（都比较差），不能认为再做 10000 次测试就能把结果提高到与原来的相等。如果是 3 次较差，3 次较好，4 次大致相同，那么是的--继续积累统计数据。 如果数据是序列化的，问题是历史上某个地方的 20 个 1 的序列会找到 20 个具有相似过去的 0 的序列。这就是市场随机化。 UPD 因此，我认为市场数据的蒙特卡洛形式 01010101 对市场数据不起作用（如果数据是序列化的）。这就好比把一个长方形和一个正方形分割成相等的正方形，然后再试图确定正方形属于哪个主图））。 [删除] 2023.08.20 09:09 #31893 Aleksey Vyazmikin #:我写严格序列只是为了举例说明。我还写道，解决这个问题可以提高模型的稳定性。但解决方法可以不同。即使没有解决上述问题--选择正确的量子表也能提高学习效果，这是我在几十个样本上测试过的。然后，我展示了如何快速进行训练预处理，从不连贯数据中清除样本。你可以从图片上看到，用这种方法甚至可以在新数据上获得有利的模型。最后，这种方法是可行的，而开发这种方法正是我的目标。因此，说它不可行就是否认现实。我不认为价格是纯粹的 SB，其本质至少不能被部分拆解。如果它是纯粹的 SB，那么整个主题就是一个错误。 我认为我们应该召开一次机械师会议。显然，会议应在阿联酋的某个地方举行，并提供自助餐。然后在正式和非正式的气氛中讨论一切。否则，通过论坛进行讨论很不方便。日程安排如下：一天会议，一天大家喝酒，第二天大家吵架，互相扯胸脯，然后又是会议，如此循环往复。不断循环）赞助商和主要发言人将是赛博，然后是阿列克谢-尼古拉耶夫，然后是其他人：) Aleksey Nikolayev 2023.08.20 10:23 #31894 Aleksey Vyazmikin #:利润与为进一步分类而预处理数据有什么关系？ 你那无数张资产负债表不断陡峭的 gif 有什么意义？也许你只是不明白问题的答案？ Aleksey Nikolayev 2023.08.20 10:26 #31895 Maxim Dmitrievsky #: 我认为我们应该召开一次机器大会。会议必须包括自助餐，并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则，通过论坛进行讨论很不方便。 会议日程是这样的：一天会议，一天大家喝酒，第二天大家打架，互相扯胸，然后再开一次会议，如此循环往复。随时进行） 赞助商和主要发言人将是赛博，然后是阿列克谢-尼古拉耶夫，然后是其他人：) 用赛伯的钱来熟悉他的战略，这个想法似乎很好，而且考虑得很周全。我甚至不知道会出什么问题 🤔 [删除] 2023.08.20 10:27 #31896 Aleksey Nikolayev #:用 Saber 的钱来熟悉他的策略的想法似乎很棒，而且经过深思熟虑。我甚至不知道会出什么问题 🤔😀 忘了补充 - 主要赞助商是最成功的。但每个人都需要参与进来。我认为可以找人赞助他的演讲。会议的重点可能不是讨论具体策略，而是一般方法、理念、工具等。 Aleksey Vyazmikin 2023.08.20 12:35 #31897 Forester #:也就是说，如果选择 10 个量子/片段，然后使用这些片段中的示例训练 10 棵树？这看起来很简单。 关于 OOS 的稳定性--实验会证明这一点。当改变数据窗口的大小（2 个月和 4 个月），甚至将数据窗口移动 2%（在周二而不是周六进行训练）时，我的稳定性就会受到破坏。结果显示，树是不同的。 是的，就是这样--当然，这种方法可以变得更复杂，但如果你想的话。 现在，如果我没记错的话，树中的预测因子只命中了一半的范围，而没有寻找最佳的分割点？ 至于这个想法是否成功--我完全同意，但卧石之下也不会有流水。 林务员#: 当我与 fxsaber 谈论使用他的算法进行混合时，我想到了这种恶化（倍）。他的数据没有这么大的差异。很明显，这是因为他的标注中并不是所有条形图都排成一行（或行排成一行），而是有很大的间隙。如果你的条形图很接近，那么它们的过去和未来就很相似，也就是说，20 个 1 类的例子可以排成一行。通过随机化，您可以使它们的平均值为 0101010....，并将整个系列的 20 个 "1 "变为 20 个 "0"。因为它们很接近，可以算作一个例子。如果对您来说不是这样，那么对我来说就是这样（我对所有条形图进行连续评估，所以才有了这个想法）。 一般来说，我认为 10 次的差异如此之大，可以不进行 10000 次测试。前 10 次测试的差异太明显了（都比较差），不能认为再做 10000 次测试就能把结果提高到与原来的相等。如果是 3 次较差，3 次较好，4 次大致相等，那么是的--继续积累统计数据。 如果数据是序列化的，问题是历史上某个地方的 20 个 1 的序列会找到 20 个具有相似过去的 0 的序列。这就是市场随机化。 UPD 因此，我认为市场数据的蒙特卡洛形式 01010101 对市场数据不起作用（如果数据是序列化的）。这就好比把一个长方形和一个正方形分割成相等的正方形，然后再试图确定正方形属于哪个主要形状））。 不幸的是，我在处理数据时犯了一个错误（当时我正在为这些测试快速重新设计脚本，有一个细微差别没有考虑到），结果表格是这样的 结论是，数据可以随机落入量子表的范围，并通过可用的稳定性测试。使用的是默认设置/标准--现在我将尝试收紧它们，看看结果如何。 不过，我以前写过，大约只有 30% 的量子截止值在其他两个样本上显示出其效率，所以结果总体上是在意料之中的。只是它的奇怪之处让我不得不仔细检查一切。如何改进选择结果是一个挑战。 不过，量化的目的是选择一个有概率偏移的组。尽管在新数据的作用下，组本身会转向另一个目标，但通过拆分，还是有可能在其中找到一片稳定的叶子。 在我做实验的样本中，我认为平均每天只有一个信号，因此条形图之间相距甚远。 我认为更有趣的是查看我上面建议的实验结果--它应该能显示随机生成的目标反应落入采样量子段的频率。正如阿列克谢-尼古拉耶夫（Aleksey Nikolayev）在他的抽象概念中建议的那样，这将是固定间隔的 "胸部"。 您可以发送您的样本，我将选择量子片段，您可以在这些数据上实验创建修改过的森林，或者我可以给您我的样本。 Aleksey Vyazmikin 2023.08.20 12:38 #31898 Maxim Dmitrievsky #: 我认为我们应该召开一次机器大会。会议必须包括自助餐，并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则，通过论坛进行讨论很不方便。 会议日程是这样的：一天会议，一天大家喝酒，第二天大家打架，互相扯胸，然后再开一次会议，如此循环往复。随时进行） 赞助商和主要发言人将是赛博，然后是阿列克谢-尼古拉耶夫，然后是其他人：) Fourchette - 听起来不错，但需要暴力 - 我自己还没有注意到。我为自己不被理解而感到难过，但这本身并不会引起如此强烈的攻击性。 [删除] 2023.08.20 12:39 #31899 Aleksey Vyazmikin #:Furshet - 听起来还不错，但对暴力的需求 - 我还没注意到。不被理解让我感到难过，但这本身并不会引起如此强烈的攻击性。 暴力只是双方自愿的，当争论结束后，所有文明人 Aleksandr Slavskii 2023.08.20 12:52 #31900 Maxim Dmitrievsky #: 我认为我们应该召开一次机器大会。会议必须包括自助餐，并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则，通过论坛进行讨论很不方便。 会议日程会是这样的：一天会议，一天大家喝酒，第二天大家打架，互相扯对方的胸脯，然后又是会议，如此循环往复。随时进行） 赞助商和主要发言人将是赛博，然后是阿列克谢-尼古拉耶夫，然后是其他人:) 我想阅读有关机器学习的内容，而幽默大师们正在这里磨练他们的技巧。 我希望能在其他地方看到幽默笑话和其他与主题无关的东西。 现在进入正题。 你写道，你认为市场是随机的，这句话的依据是什么？ 你有什么确凿的理由来证明市场价格变动的随机性吗？ 1...318331843185318631873188318931903191319231933194319531963197...3399 新评论 您错过了交易机会： 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符（不带空格） 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号，请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置，否则您将无法登录。 忘记您的登录名/密码？ 使用 Google 登录
以某种方式将其与利润联系起来，至少是近似地联系起来，并将实际利润与随机利润样本进行比较。检验是否存在误差的标准是样本的平均利润等于零。检查实际利润相对于样本的正相关性--三西格玛法则。
我不准备详谈您的任务，因为我自己的任务也很繁重。
当我们讨论为进一步分类而对数据进行预处理时，利润与之有什么关系？
你们的量子是为提取利润而设计的吗？有没有这方面的计划？将其极端简化，哪怕是近似但快速地计算一个样本，然后检查真实结果是否属于这个样本的尾部。
你愿意要求人们深入研究你的思维模式，却又完全不愿意深入研究蒙特卡洛这样简单而广为人知的想法，实在令人厌烦。
我想我已经受够了。
每个人都有权管理自己的时间。
但很显然，你并没有理解你提出建议的问题。
谢谢你的帮助。
我明白。
我还有一个建议，为了使森林构建过程更易于管理，把选定量子段的一个具体子样作为每棵树的根，怎么样？
深度应该是 2-3 分，这样叶片上可分类的例子就不会少于 1%。
我认为这样的模型会更加稳定。
也就是说，如果您选择 10 个量子/拆分，然后在这些拆分的实例上训练 10 棵树？
关于 OOS 的稳定性--实验会证明这一点。当改变数据窗口的大小（2 个月和 4 个月），甚至将数据窗口移动 2%（在周二而不是周六进行训练）时，我的稳定性就会受到破坏。树的结果是不同的。
我对我发布 gifs 的样本进行了实验，样本中已有 47% 的单位，数据汇总于表中。...
结果表明，这些量子片段的质量（实用性）比原始 片段差（少）10 倍。
当我与 fxsaber 交流时，我认为这种劣化（倍）是由于他的算法造成的。但他的数据并没有如此大的差异。很明显，这是因为他的标注中并不是所有条形图都排成一行（或行排成一行），而是有很大的间隙。如果你的条形图很接近，那么它们的过去和未来就很相似，也就是说，20 个 1 类的例子可以排成一行。通过随机化，您可以使它们的平均值为 0101010....，并将整个系列的 20 个 "1 "变为 20 个 "0"。因为它们很接近，可以算作一个例子。如果对您来说不是这样，那么对我来说就是这样（我是连续评估所有条形图的，所以才会 有这样的想法）。
一般来说，我认为 10 次的差异如此之大，可以不进行 10000 次测试。前 10 次测试的差异太明显了（都比较差），不能认为再做 10000 次测试就能把结果提高到与原来的相等。如果是 3 次较差，3 次较好，4 次大致相同，那么是的--继续积累统计数据。
如果数据是序列化的，问题是历史上某个地方的 20 个 1 的序列会找到 20 个具有相似过去的 0 的序列。这就是市场随机化。
UPD 因此，我认为市场数据的蒙特卡洛形式 01010101 对市场数据不起作用（如果数据是序列化的）。这就好比把一个长方形和一个正方形分割成相等的正方形，然后再试图确定正方形属于哪个主图））。
我写严格序列只是为了举例说明。我还写道，解决这个问题可以提高模型的稳定性。但解决方法可以不同。
即使没有解决上述问题--选择正确的量子表也能提高学习效果，这是我在几十个样本上测试过的。
然后，我展示了如何快速进行训练预处理，从不连贯数据中清除样本。你可以从图片上看到，用这种方法甚至可以在新数据上获得有利的模型。
最后，这种方法是可行的，而开发这种方法正是我的目标。
因此，说它不可行就是否认现实。
我不认为价格是纯粹的 SB，其本质至少不能被部分拆解。如果它是纯粹的 SB，那么整个主题就是一个错误。
利润与为进一步分类而预处理数据有什么关系？
你那无数张资产负债表不断陡峭的 gif 有什么意义？也许你只是不明白问题的答案？
我认为我们应该召开一次机器大会。会议必须包括自助餐，并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则，通过论坛进行讨论很不方便。
用赛伯的钱来熟悉他的战略，这个想法似乎很好，而且考虑得很周全。我甚至不知道会出什么问题 🤔
用 Saber 的钱来熟悉他的策略的想法似乎很棒，而且经过深思熟虑。我甚至不知道会出什么问题 🤔
也就是说，如果选择 10 个量子/片段，然后使用这些片段中的示例训练 10 棵树？这看起来很简单。
关于 OOS 的稳定性--实验会证明这一点。当改变数据窗口的大小（2 个月和 4 个月），甚至将数据窗口移动 2%（在周二而不是周六进行训练）时，我的稳定性就会受到破坏。结果显示，树是不同的。
是的，就是这样--当然，这种方法可以变得更复杂，但如果你想的话。
现在，如果我没记错的话，树中的预测因子只命中了一半的范围，而没有寻找最佳的分割点？
至于这个想法是否成功--我完全同意，但卧石之下也不会有流水。
当我与 fxsaber 谈论使用他的算法进行混合时，我想到了这种恶化（倍）。他的数据没有这么大的差异。很明显，这是因为他的标注中并不是所有条形图都排成一行（或行排成一行），而是有很大的间隙。如果你的条形图很接近，那么它们的过去和未来就很相似，也就是说，20 个 1 类的例子可以排成一行。通过随机化，您可以使它们的平均值为 0101010....，并将整个系列的 20 个 "1 "变为 20 个 "0"。因为它们很接近，可以算作一个例子。如果对您来说不是这样，那么对我来说就是这样（我对所有条形图进行连续评估，所以才有了这个想法）。
一般来说，我认为 10 次的差异如此之大，可以不进行 10000 次测试。前 10 次测试的差异太明显了（都比较差），不能认为再做 10000 次测试就能把结果提高到与原来的相等。如果是 3 次较差，3 次较好，4 次大致相等，那么是的--继续积累统计数据。
如果数据是序列化的，问题是历史上某个地方的 20 个 1 的序列会找到 20 个具有相似过去的 0 的序列。这就是市场随机化。
UPD 因此，我认为市场数据的蒙特卡洛形式 01010101 对市场数据不起作用（如果数据是序列化的）。这就好比把一个长方形和一个正方形分割成相等的正方形，然后再试图确定正方形属于哪个主要形状））。
不幸的是，我在处理数据时犯了一个错误（当时我正在为这些测试快速重新设计脚本，有一个细微差别没有考虑到），结果表格是这样的
结论是，数据可以随机落入量子表的范围，并通过可用的稳定性测试。使用的是默认设置/标准--现在我将尝试收紧它们，看看结果如何。
不过，我以前写过，大约只有 30% 的量子截止值在其他两个样本上显示出其效率，所以结果总体上是在意料之中的。只是它的奇怪之处让我不得不仔细检查一切。如何改进选择结果是一个挑战。
不过，量化的目的是选择一个有概率偏移的组。尽管在新数据的作用下，组本身会转向另一个目标，但通过拆分，还是有可能在其中找到一片稳定的叶子。
在我做实验的样本中，我认为平均每天只有一个信号，因此条形图之间相距甚远。
我认为更有趣的是查看我上面建议的实验结果--它应该能显示随机生成的目标反应落入采样量子段的频率。正如阿列克谢-尼古拉耶夫（Aleksey Nikolayev）在他的抽象概念中建议的那样，这将是固定间隔的 "胸部"。
您可以发送您的样本，我将选择量子片段，您可以在这些数据上实验创建修改过的森林，或者我可以给您我的样本。
我认为我们应该召开一次机器大会。会议必须包括自助餐，并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则，通过论坛进行讨论很不方便。
Fourchette - 听起来不错，但需要暴力 - 我自己还没有注意到。我为自己不被理解而感到难过，但这本身并不会引起如此强烈的攻击性。
Furshet - 听起来还不错，但对暴力的需求 - 我还没注意到。不被理解让我感到难过，但这本身并不会引起如此强烈的攻击性。
我认为我们应该召开一次机器大会。会议必须包括自助餐，并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则，通过论坛进行讨论很不方便。
我想阅读有关机器学习的内容，而幽默大师们正在这里磨练他们的技巧。
我希望能在其他地方看到幽默笑话和其他与主题无关的东西。
现在进入正题。
你写道，你认为市场是随机的，这句话的依据是什么？
你有什么确凿的理由来证明市场价格变动的随机性吗？