交易中的机器学习:理论、模型、实践和算法交易 - 页 3190 1...318331843185318631873188318931903191319231933194319531963197...3399 新评论 Aleksey Vyazmikin 2023.08.20 08:20 #31891 Aleksey Nikolayev #:以某种方式将其与利润联系起来,至少是近似地联系起来,并将实际利润与随机利润样本进行比较。检验是否存在误差的标准是样本的平均利润等于零。检查实际利润相对于样本的正相关性--三西格玛法则。我不准备详谈您的任务,因为我自己的任务也很繁重。 当我们讨论为进一步分类而对数据进行预处理时,利润与之有什么关系? Aleksey Nikolayev#: 你们的量子是为提取利润而设计的吗?有没有这方面的计划?将其极端简化,哪怕是近似但快速地计算一个样本,然后检查真实结果是否属于这个样本的尾部。你愿意要求人们深入研究你的思维模式,却又完全不愿意深入研究蒙特卡洛这样简单而广为人知的想法,实在令人厌烦。我想我已经受够了。 每个人都有权管理自己的时间。 但很显然,你并没有理解你提出建议的问题。 谢谢你的帮助。 Forester 2023.08.20 08:23 #31892 Aleksey Vyazmikin #:我明白。我还有一个建议,为了使森林构建过程更易于管理,把选定量子段的一个具体子样作为每棵树的根,怎么样?深度应该是 2-3 分,这样叶片上可分类的例子就不会少于 1%。我认为这样的模型会更加稳定。 也就是说,如果您选择 10 个量子/拆分,然后在这些拆分的实例上训练 10 棵树? 关于 OOS 的稳定性--实验会证明这一点。当改变数据窗口的大小(2 个月和 4 个月),甚至将数据窗口移动 2%(在周二而不是周六进行训练)时,我的稳定性就会受到破坏。树的结果是不同的。 Aleksey Vyazmikin#: 我对我发布 gifs 的样本进行了实验,样本中已有 47% 的单位,数据汇总于表中。... 结果表明,这些量子片段的质量(实用性)比原始 片段差(少)10 倍。 当我与 fxsaber 交流时,我认为这种劣化(倍)是由于他的算法造成的。但他的数据并没有如此大的差异。很明显,这是因为他的标注中并不是所有条形图都排成一行(或行排成一行),而是有很大的间隙。如果你的条形图很接近,那么它们的过去和未来就很相似,也就是说,20 个 1 类的例子可以排成一行。通过随机化,您可以使它们的平均值为 0101010....,并将整个系列的 20 个 "1 "变为 20 个 "0"。因为它们很接近,可以算作一个例子。如果对您来说不是这样,那么对我来说就是这样(我是连续评估所有条形图的,所以才会 有这样的想法)。 一般来说,我认为 10 次的差异如此之大,可以不进行 10000 次测试。前 10 次测试的差异太明显了(都比较差),不能认为再做 10000 次测试就能把结果提高到与原来的相等。如果是 3 次较差,3 次较好,4 次大致相同,那么是的--继续积累统计数据。 如果数据是序列化的,问题是历史上某个地方的 20 个 1 的序列会找到 20 个具有相似过去的 0 的序列。这就是市场随机化。 UPD 因此,我认为市场数据的蒙特卡洛形式 01010101 对市场数据不起作用(如果数据是序列化的)。这就好比把一个长方形和一个正方形分割成相等的正方形,然后再试图确定正方形属于哪个主图))。 Maxim Dmitrievsky 2023.08.20 09:09 #31893 Aleksey Vyazmikin #:我写严格序列只是为了举例说明。我还写道,解决这个问题可以提高模型的稳定性。但解决方法可以不同。即使没有解决上述问题--选择正确的量子表也能提高学习效果,这是我在几十个样本上测试过的。然后,我展示了如何快速进行训练预处理,从不连贯数据中清除样本。你可以从图片上看到,用这种方法甚至可以在新数据上获得有利的模型。最后,这种方法是可行的,而开发这种方法正是我的目标。因此,说它不可行就是否认现实。我不认为价格是纯粹的 SB,其本质至少不能被部分拆解。如果它是纯粹的 SB,那么整个主题就是一个错误。 我认为我们应该召开一次机械师会议。显然,会议应在阿联酋的某个地方举行,并提供自助餐。然后在正式和非正式的气氛中讨论一切。否则,通过论坛进行讨论很不方便。日程安排如下:一天会议,一天大家喝酒,第二天大家吵架,互相扯胸脯,然后又是会议,如此循环往复。不断循环)赞助商和主要发言人将是赛博,然后是阿列克谢-尼古拉耶夫,然后是其他人:) Aleksey Nikolayev 2023.08.20 10:23 #31894 Aleksey Vyazmikin #:利润与为进一步分类而预处理数据有什么关系? 你那无数张资产负债表不断陡峭的 gif 有什么意义?也许你只是不明白问题的答案? Aleksey Nikolayev 2023.08.20 10:26 #31895 Maxim Dmitrievsky #: 我认为我们应该召开一次机器大会。会议必须包括自助餐,并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则,通过论坛进行讨论很不方便。 会议日程是这样的:一天会议,一天大家喝酒,第二天大家打架,互相扯胸,然后再开一次会议,如此循环往复。随时进行) 赞助商和主要发言人将是赛博,然后是阿列克谢-尼古拉耶夫,然后是其他人:) 用赛伯的钱来熟悉他的战略,这个想法似乎很好,而且考虑得很周全。我甚至不知道会出什么问题 🤔 Maxim Dmitrievsky 2023.08.20 10:27 #31896 Aleksey Nikolayev #:用 Saber 的钱来熟悉他的策略的想法似乎很棒,而且经过深思熟虑。我甚至不知道会出什么问题 🤔😀 忘了补充 - 主要赞助商是最成功的。但每个人都需要参与进来。我认为可以找人赞助他的演讲。会议的重点可能不是讨论具体策略,而是一般方法、理念、工具等。 Aleksey Vyazmikin 2023.08.20 12:35 #31897 Forester #:也就是说,如果选择 10 个量子/片段,然后使用这些片段中的示例训练 10 棵树?这看起来很简单。 关于 OOS 的稳定性--实验会证明这一点。当改变数据窗口的大小(2 个月和 4 个月),甚至将数据窗口移动 2%(在周二而不是周六进行训练)时,我的稳定性就会受到破坏。结果显示,树是不同的。 是的,就是这样--当然,这种方法可以变得更复杂,但如果你想的话。 现在,如果我没记错的话,树中的预测因子只命中了一半的范围,而没有寻找最佳的分割点? 至于这个想法是否成功--我完全同意,但卧石之下也不会有流水。 林务员#: 当我与 fxsaber 谈论使用他的算法进行混合时,我想到了这种恶化(倍)。他的数据没有这么大的差异。很明显,这是因为他的标注中并不是所有条形图都排成一行(或行排成一行),而是有很大的间隙。如果你的条形图很接近,那么它们的过去和未来就很相似,也就是说,20 个 1 类的例子可以排成一行。通过随机化,您可以使它们的平均值为 0101010....,并将整个系列的 20 个 "1 "变为 20 个 "0"。因为它们很接近,可以算作一个例子。如果对您来说不是这样,那么对我来说就是这样(我对所有条形图进行连续评估,所以才有了这个想法)。 一般来说,我认为 10 次的差异如此之大,可以不进行 10000 次测试。前 10 次测试的差异太明显了(都比较差),不能认为再做 10000 次测试就能把结果提高到与原来的相等。如果是 3 次较差,3 次较好,4 次大致相等,那么是的--继续积累统计数据。 如果数据是序列化的,问题是历史上某个地方的 20 个 1 的序列会找到 20 个具有相似过去的 0 的序列。这就是市场随机化。 UPD 因此,我认为市场数据的蒙特卡洛形式 01010101 对市场数据不起作用(如果数据是序列化的)。这就好比把一个长方形和一个正方形分割成相等的正方形,然后再试图确定正方形属于哪个主要形状))。 不幸的是,我在处理数据时犯了一个错误(当时我正在为这些测试快速重新设计脚本,有一个细微差别没有考虑到),结果表格是这样的 结论是,数据可以随机落入量子表的范围,并通过可用的稳定性测试。使用的是默认设置/标准--现在我将尝试收紧它们,看看结果如何。 不过,我以前写过,大约只有 30% 的量子截止值在其他两个样本上显示出其效率,所以结果总体上是在意料之中的。只是它的奇怪之处让我不得不仔细检查一切。如何改进选择结果是一个挑战。 不过,量化的目的是选择一个有概率偏移的组。尽管在新数据的作用下,组本身会转向另一个目标,但通过拆分,还是有可能在其中找到一片稳定的叶子。 在我做实验的样本中,我认为平均每天只有一个信号,因此条形图之间相距甚远。 我认为更有趣的是查看我上面建议的实验结果--它应该能显示随机生成的目标反应落入采样量子段的频率。正如阿列克谢-尼古拉耶夫(Aleksey Nikolayev)在他的抽象概念中建议的那样,这将是固定间隔的 "胸部"。 您可以发送您的样本,我将选择量子片段,您可以在这些数据上实验创建修改过的森林,或者我可以给您我的样本。 Aleksey Vyazmikin 2023.08.20 12:38 #31898 Maxim Dmitrievsky #: 我认为我们应该召开一次机器大会。会议必须包括自助餐,并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则,通过论坛进行讨论很不方便。 会议日程是这样的:一天会议,一天大家喝酒,第二天大家打架,互相扯胸,然后再开一次会议,如此循环往复。随时进行) 赞助商和主要发言人将是赛博,然后是阿列克谢-尼古拉耶夫,然后是其他人:) Fourchette - 听起来不错,但需要暴力 - 我自己还没有注意到。我为自己不被理解而感到难过,但这本身并不会引起如此强烈的攻击性。 Maxim Dmitrievsky 2023.08.20 12:39 #31899 Aleksey Vyazmikin #:Furshet - 听起来还不错,但对暴力的需求 - 我还没注意到。不被理解让我感到难过,但这本身并不会引起如此强烈的攻击性。 暴力只是双方自愿的,当争论结束后,所有文明人 Aleksandr Slavskii 2023.08.20 12:52 #31900 Maxim Dmitrievsky #: 我认为我们应该召开一次机器大会。会议必须包括自助餐,并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则,通过论坛进行讨论很不方便。 会议日程会是这样的:一天会议,一天大家喝酒,第二天大家打架,互相扯对方的胸脯,然后又是会议,如此循环往复。随时进行) 赞助商和主要发言人将是赛博,然后是阿列克谢-尼古拉耶夫,然后是其他人:) 我想阅读有关机器学习的内容,而幽默大师们正在这里磨练他们的技巧。 我希望能在其他地方看到幽默笑话和其他与主题无关的东西。 现在进入正题。 你写道,你认为市场是随机的,这句话的依据是什么? 你有什么确凿的理由来证明市场价格变动的随机性吗? 1...318331843185318631873188318931903191319231933194319531963197...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
以某种方式将其与利润联系起来,至少是近似地联系起来,并将实际利润与随机利润样本进行比较。检验是否存在误差的标准是样本的平均利润等于零。检查实际利润相对于样本的正相关性--三西格玛法则。
我不准备详谈您的任务,因为我自己的任务也很繁重。
当我们讨论为进一步分类而对数据进行预处理时,利润与之有什么关系?
你们的量子是为提取利润而设计的吗?有没有这方面的计划?将其极端简化,哪怕是近似但快速地计算一个样本,然后检查真实结果是否属于这个样本的尾部。
你愿意要求人们深入研究你的思维模式,却又完全不愿意深入研究蒙特卡洛这样简单而广为人知的想法,实在令人厌烦。
我想我已经受够了。
每个人都有权管理自己的时间。
但很显然,你并没有理解你提出建议的问题。
谢谢你的帮助。
我明白。
我还有一个建议,为了使森林构建过程更易于管理,把选定量子段的一个具体子样作为每棵树的根,怎么样?
深度应该是 2-3 分,这样叶片上可分类的例子就不会少于 1%。
我认为这样的模型会更加稳定。
也就是说,如果您选择 10 个量子/拆分,然后在这些拆分的实例上训练 10 棵树?
关于 OOS 的稳定性--实验会证明这一点。当改变数据窗口的大小(2 个月和 4 个月),甚至将数据窗口移动 2%(在周二而不是周六进行训练)时,我的稳定性就会受到破坏。树的结果是不同的。
我对我发布 gifs 的样本进行了实验,样本中已有 47% 的单位,数据汇总于表中。
...结果表明,这些量子片段的质量(实用性)比原始 片段差(少)10 倍。
当我与 fxsaber 交流时,我认为这种劣化(倍)是由于他的算法造成的。但他的数据并没有如此大的差异。很明显,这是因为他的标注中并不是所有条形图都排成一行(或行排成一行),而是有很大的间隙。如果你的条形图很接近,那么它们的过去和未来就很相似,也就是说,20 个 1 类的例子可以排成一行。通过随机化,您可以使它们的平均值为 0101010....,并将整个系列的 20 个 "1 "变为 20 个 "0"。因为它们很接近,可以算作一个例子。如果对您来说不是这样,那么对我来说就是这样(我是连续评估所有条形图的,所以才会 有这样的想法)。
一般来说,我认为 10 次的差异如此之大,可以不进行 10000 次测试。前 10 次测试的差异太明显了(都比较差),不能认为再做 10000 次测试就能把结果提高到与原来的相等。如果是 3 次较差,3 次较好,4 次大致相同,那么是的--继续积累统计数据。
如果数据是序列化的,问题是历史上某个地方的 20 个 1 的序列会找到 20 个具有相似过去的 0 的序列。这就是市场随机化。
UPD 因此,我认为市场数据的蒙特卡洛形式 01010101 对市场数据不起作用(如果数据是序列化的)。这就好比把一个长方形和一个正方形分割成相等的正方形,然后再试图确定正方形属于哪个主图))。
我写严格序列只是为了举例说明。我还写道,解决这个问题可以提高模型的稳定性。但解决方法可以不同。
即使没有解决上述问题--选择正确的量子表也能提高学习效果,这是我在几十个样本上测试过的。
然后,我展示了如何快速进行训练预处理,从不连贯数据中清除样本。你可以从图片上看到,用这种方法甚至可以在新数据上获得有利的模型。
最后,这种方法是可行的,而开发这种方法正是我的目标。
因此,说它不可行就是否认现实。
我不认为价格是纯粹的 SB,其本质至少不能被部分拆解。如果它是纯粹的 SB,那么整个主题就是一个错误。
利润与为进一步分类而预处理数据有什么关系?
你那无数张资产负债表不断陡峭的 gif 有什么意义?也许你只是不明白问题的答案?
我认为我们应该召开一次机器大会。会议必须包括自助餐,并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则,通过论坛进行讨论很不方便。
用赛伯的钱来熟悉他的战略,这个想法似乎很好,而且考虑得很周全。我甚至不知道会出什么问题 🤔
用 Saber 的钱来熟悉他的策略的想法似乎很棒,而且经过深思熟虑。我甚至不知道会出什么问题 🤔
也就是说,如果选择 10 个量子/片段,然后使用这些片段中的示例训练 10 棵树?这看起来很简单。
关于 OOS 的稳定性--实验会证明这一点。当改变数据窗口的大小(2 个月和 4 个月),甚至将数据窗口移动 2%(在周二而不是周六进行训练)时,我的稳定性就会受到破坏。结果显示,树是不同的。
是的,就是这样--当然,这种方法可以变得更复杂,但如果你想的话。
现在,如果我没记错的话,树中的预测因子只命中了一半的范围,而没有寻找最佳的分割点?
至于这个想法是否成功--我完全同意,但卧石之下也不会有流水。
当我与 fxsaber 谈论使用他的算法进行混合时,我想到了这种恶化(倍)。他的数据没有这么大的差异。很明显,这是因为他的标注中并不是所有条形图都排成一行(或行排成一行),而是有很大的间隙。如果你的条形图很接近,那么它们的过去和未来就很相似,也就是说,20 个 1 类的例子可以排成一行。通过随机化,您可以使它们的平均值为 0101010....,并将整个系列的 20 个 "1 "变为 20 个 "0"。因为它们很接近,可以算作一个例子。如果对您来说不是这样,那么对我来说就是这样(我对所有条形图进行连续评估,所以才有了这个想法)。
一般来说,我认为 10 次的差异如此之大,可以不进行 10000 次测试。前 10 次测试的差异太明显了(都比较差),不能认为再做 10000 次测试就能把结果提高到与原来的相等。如果是 3 次较差,3 次较好,4 次大致相等,那么是的--继续积累统计数据。
如果数据是序列化的,问题是历史上某个地方的 20 个 1 的序列会找到 20 个具有相似过去的 0 的序列。这就是市场随机化。
UPD 因此,我认为市场数据的蒙特卡洛形式 01010101 对市场数据不起作用(如果数据是序列化的)。这就好比把一个长方形和一个正方形分割成相等的正方形,然后再试图确定正方形属于哪个主要形状))。
不幸的是,我在处理数据时犯了一个错误(当时我正在为这些测试快速重新设计脚本,有一个细微差别没有考虑到),结果表格是这样的
结论是,数据可以随机落入量子表的范围,并通过可用的稳定性测试。使用的是默认设置/标准--现在我将尝试收紧它们,看看结果如何。
不过,我以前写过,大约只有 30% 的量子截止值在其他两个样本上显示出其效率,所以结果总体上是在意料之中的。只是它的奇怪之处让我不得不仔细检查一切。如何改进选择结果是一个挑战。
不过,量化的目的是选择一个有概率偏移的组。尽管在新数据的作用下,组本身会转向另一个目标,但通过拆分,还是有可能在其中找到一片稳定的叶子。
在我做实验的样本中,我认为平均每天只有一个信号,因此条形图之间相距甚远。
我认为更有趣的是查看我上面建议的实验结果--它应该能显示随机生成的目标反应落入采样量子段的频率。正如阿列克谢-尼古拉耶夫(Aleksey Nikolayev)在他的抽象概念中建议的那样,这将是固定间隔的 "胸部"。
您可以发送您的样本,我将选择量子片段,您可以在这些数据上实验创建修改过的森林,或者我可以给您我的样本。
我认为我们应该召开一次机器大会。会议必须包括自助餐,并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则,通过论坛进行讨论很不方便。
Fourchette - 听起来不错,但需要暴力 - 我自己还没有注意到。我为自己不被理解而感到难过,但这本身并不会引起如此强烈的攻击性。
Furshet - 听起来还不错,但对暴力的需求 - 我还没注意到。不被理解让我感到难过,但这本身并不会引起如此强烈的攻击性。
我认为我们应该召开一次机器大会。会议必须包括自助餐,并在阿联酋的某个地方举行。在正式和非正式的气氛中讨论一切。否则,通过论坛进行讨论很不方便。
我想阅读有关机器学习的内容,而幽默大师们正在这里磨练他们的技巧。
我希望能在其他地方看到幽默笑话和其他与主题无关的东西。
现在进入正题。
你写道,你认为市场是随机的,这句话的依据是什么?
你有什么确凿的理由来证明市场价格变动的随机性吗?