交易中的机器学习:理论、模型、实践和算法交易 - 页 1531 1...152415251526152715281529153015311532153315341535153615371538...3399 新评论 [删除] 2019.09.16 20:54 #15301 今天在Python上使用了humnocode,得到了这个结果 训练 测试 也许是测试仪出了问题,也许是其他原因,我明天晚上会重新检查。我是为了一篇文章而做的(我想描述我的方法),也许catbust比森林更能处理这个策略 Aleksey Vyazmikin 2019.09.16 22:39 #15302 Maxim Dmitrievsky: 今天在Python上使用了humnocode,得到了这个结果训练测试也许是测试仪出了问题,也许是其他原因,我明天晚上会重新检查。我做了一篇文章(想描述我的方法),也许catboost比forest更能处理这个策略。 因此,根据他们的命名系统样本,CatBoost 是在测试中训练的--有什么问题吗? [删除] 2019.09.16 22:56 #15303 阿列克谢-维亚兹米 金。 因此,CatBoost是根据他们的采样命名系统在测试中进行训练的--没有混淆? 我的意思是完全是新的数据,是不同的历史片段。在火车上应该是这样的,但考试却让人困惑。也许测试者在什么地方偷看了。 我在我的森林上得到0.6-0.7的误差,数据大致相同,在trayne上也是如此,而且测试结果不一定好,几乎总是比trayne差。提升中的误差是差不多的,但测试是非常好的,它不会发生。 你做得怎么样,你在叶子上有什么进展吗? Aleksey Vyazmikin 2019.09.17 08:40 #15304 马克西姆-德米特里耶夫斯基。 我的意思是完全是新的数据,是不同的历史片段。火车上应该是这样的,但测试却令人困惑。也许测试者在什么地方偷看了。 在我的森林里,在大约相同的数据下,我得到了0.6-0.7的误差,在小路上也是如此,而且测试的结果并不总是好的,几乎总是比小路差。升压有大约相同的误差,但测试是痛苦的,这种情况不会发生。 你怎么样了,你获得了叶子吗? 好吧,那我就不知道了--没有取样就很难知道什么是错的。 我的结果并没有让我非常高兴。我已经收集了相当数量的树叶,但随之而来的问题是如何最好地使它们相互配合。 问题是,它们经常相互重叠20%-50%或更多,因此,事实证明,给出相同的信号,这并不是很好。我们的想法是将它们分组,并为每组做一个激活的阈值--所以我思考了最好的方法。 到目前为止,我正在进行相互过滤的实验--我在R中对树的叶子进行了训练,但到目前为止,只对买入进行了训练。 第一张没有树的截图,第二张有树的截图。时间是今年的3月至9月。 当然,平衡曲线不是很有吸引力,但它是一种趋势策略,其本质是在平淡期不要损失超过你的收入,而市场(思)全年都是平淡的,很少有强势的波动。我可以看到,增加一棵树已经改善了相对指标,我以后也会为销售做同样的事情,如果结果是积极的,它将成为模型的一部分。 直到最后都没有解决选择叶子的问题,即使选择在5年中每一年都显示出良好效果的叶子,也可以预期20%-40%停止工作,更可悲的是无法理解是否关闭它们--特别是按季度做了测试,结果发现过去季度不赚钱的叶子与随后季度的损失(很多)相重叠。 选叶的方法本身似乎很有希望,但过程非常缓慢。 [删除] 2019.09.17 09:22 #15305 阿列克谢-维亚兹米 金。 那么,我不知道--没有样本,就很难知道哪里出了问题。 我对结果不是很满意。我已经收集了相当数量的树叶,但接下来的问题是如何让它们更好地一起工作。问题是,它们往往相互重叠20%-50%或更多,因此,结果是给出了相同的信号,这不是很好。我们的想法是将它们分组,并为每组做一个激活的阈值--所以我思考了最好的方法。 到目前为止,我正在试验相互过滤--我在R中对树的叶子进行了训练,但只用于购买。 第一张没有树的截图,第二张有树的截图。时间是今年的3月至9月。 当然,平衡曲线不是很有吸引力,但它是一种趋势策略,其本质是在平淡期不要损失超过你的收入,而市场(思)全年都是平淡的,很少有强势的波动。我可以看到,增加一棵树已经改善了相对的指标,我将在稍后为销售做同样的工作,如果结果是积极的,它将是模型的一部分。 直到最后都没有解决选择叶子的问题,即使选择在5年中每一年都表现出良好效果的叶子,也可以预期20%-40%停止工作,更可悲的是无法理解是否关闭它们--具体按季度做了测试,结果发现,过去季度不赚钱的叶子在随后的季度中重叠了损失(很多)。 选叶方法本身似乎很有前途,但这个过程极其缓慢。 我没有得到一个穆森,太糟糕了。 交易非常少,不具有代表性。而我们需要过滤掉那些亏损的,因为它们都是不必要的。 Aleksey Vyazmikin 2019.09.17 09:40 #15306 马克西姆-德米特里耶夫斯基。 是的,你不能靠这个赚快钱,这是一个耻辱。 行业非常少,没有代表性。而且你应该过滤无利可图的,它们都是一样的,你不需要它们。 是的,问题是每个叶子信号分配1手,分别是,如果很多叶子激活,那么需要更多的手 - 有71手,但非常少,如果你把钱一直保持在71手,那么总数将得到每年25% - 交易所的GO是大的,它是斯。 关于去除无利可图的--这是一把双刃剑--一方面可以增加过滤器的数量,这将减少亏损交易的数量,但同时也会减少有利可图的交易数量,正如我上面写的,许多叶子在一年中变得有利可图,所以这是一个时间问题,一个市场条件问题。这种方法的问题是,它是非常劳动密集型的,没有可能及时添加新的预测因子,而我有这种想法,并且经常出现这种想法--我现在实际上是在用今年2月的样本工作。 改善指标的另一个方法,是在获利方面下功夫--目前平仓主要是通过止损和一个条件--在极少数情况下完成。 尽管有种种弊端,但该系统近一年来没有亏损,这可能表明方向正确。 [删除] 2019.09.17 09:52 #15307 阿列克谢-维亚兹米 金。 是的,问题是每个叶子信号分配1手,分别是,如果很多叶子激活,那么需要更多的手 - 有71手,但非常少,如果你把钱一直保持在71手,那么总数将得到每年25% - 交易所的GO是很大的,它是斯。 关于去除无利可图的--这是一把双刃剑--一方面可以增加过滤器的数量,这将减少亏损交易的数量,但同时也会减少有利可图的交易数量,正如我上面写的,许多叶子在一年中变得有利可图,所以这是一个时间问题,一个市场条件的问题。这种方法的问题是,它是非常劳动密集型的,没有可能及时添加新的预测因子,而我有这种想法,并且经常出现这种想法--我现在实际上是在用今年2月的样本工作。 改善指标的另一个方法,是在获利方面下功夫--目前平仓主要是通过止损和一个条件--在极少数情况下完成。 尽管有种种缺点,但该系统近一年来没有亏损,这可能是一个正确方向的标志。 可以在第一个模型的基础上,在相同的特征上训练第二个模型。但是,它只是纠正权益类条目,也就是说,它将禁止/允许交易。至少不会有不必要的交易。 Aleksey Nikolayev 2019.09.17 10:03 #15308 马克西姆-德米特里耶夫斯基。 有可能在第一个模型的基础上训练一个具有相同特征的2号模型。但只有它才会简单地纠正股权交易的条目,即它会禁止/允许交易。至少不会有不必要的交易。 或者类似于系统列表组合的滑动重新计算的东西。 Aleksey Vyazmikin 2019.09.17 10:04 #15309 马克西姆-德米特里耶夫斯基。 有可能在第一个模型的基础上训练一个具有相同特征的2号模型。但它只会纠正股票进场,也就是说,它将禁止/允许交易。至少不会有不必要的交易。 我不太明白你建议如何改变目标--现在我已经有3个目标--买入/卖出/不交易。而且,我选择要买/卖的床单,然后给每个这样的床单寻找一个 "不交易 "的过滤器,多达3件(对有些人来说是足够的,对有些人来说是不够的 - 进行测试)。在这些对的结果之后--激活叶+过滤叶,我根据最终的信号建立了一棵树,它考虑到了所有叶子的反应和它们的相互排斥,即我得到了额外的过滤器。 这里有一棵树 我想尝试在CB上建立模型,而不是在树上,也许那里对所有使用的叶子的概括性会更好,虽然准确性增加了1%,这并不多,但结果是积极的。 [删除] 2019.09.17 10:15 #15310 阿列克谢-维亚兹米 金。 我不太明白你建议如何改变目标--现在我基本上有3个目标--买入/卖出/不交易。而且,我选择买/卖单,然后为每个这样的单子寻找一个 "不交易 "单子的过滤器,多达3件(对有些人来说是足够的,对有些人来说是不够的--我进行过测试)。在这些对的结果之后--激活叶+过滤叶,我根据最终的信号建立了一棵树,它考虑到了所有叶子的反应和它们的相互排斥,即我得到了额外的过滤器。 这里有一棵树 我想在CB上试试模型,而不是在树上,也许那里对所有用过的叶子的概括会更好。 那么,你应该从理论开始。例如,为销售和购买分别选择模型有什么意义? 一切不用于购买的东西都用于出售,反之亦然。这就是为什么我们需要一个普通的二进制分类器。此外,如果我们这样做,为什么我们需要一个单独的 "不交易 "类,因为你可以简单地通过一个更高的阈值过滤条目。不交易 "类可以被模型赋予过多的权重,由于这个原因,模型误差会减少,预测(概括)能力,一般来说,会下降。 第二个模型的意义在于,第1个模型会有第1类和第2类的错误--假阳性和假阴性。我们有兴趣清除它们。为了做到这一点,你把相同的特征输入到第二个模型的输入和第一个模型的输出,其中0 - 交易是盈利的,1 - 交易是亏损的。训练第二个分类器,只在它显示为0时进行交易,即过滤第一个模型的信号。亏损交易几乎会在托盘上消失,你必须在测试上进行测试--这就是一个。 你不仅可以在托盘上训练第二个模型,还可以捕捉OOS,然后它将在新数据上纠正交易--这就是两个。然后是测试。 你可以将样本分割成犯规,以棋盘式的顺序,通过某些块状物来教授这些模型。例如,5次犯规。第一个模型是在1,3,4次犯规的情况下一次性训练的。2,5上的第二个矫正模型。这将进一步提高概括性。 1...152415251526152715281529153015311532153315341535153615371538...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
今天在Python上使用了humnocode,得到了这个结果
训练
测试
也许是测试仪出了问题,也许是其他原因,我明天晚上会重新检查。我是为了一篇文章而做的(我想描述我的方法),也许catbust比森林更能处理这个策略
今天在Python上使用了humnocode,得到了这个结果
训练
测试
也许是测试仪出了问题,也许是其他原因,我明天晚上会重新检查。我做了一篇文章(想描述我的方法),也许catboost比forest更能处理这个策略。
因此,根据他们的命名系统样本,CatBoost 是在测试中训练的--有什么问题吗?
因此,CatBoost是根据他们的采样命名系统在测试中进行训练的--没有混淆?
我的意思是完全是新的数据,是不同的历史片段。在火车上应该是这样的,但考试却让人困惑。也许测试者在什么地方偷看了。
我在我的森林上得到0.6-0.7的误差,数据大致相同,在trayne上也是如此,而且测试结果不一定好,几乎总是比trayne差。提升中的误差是差不多的,但测试是非常好的,它不会发生。
你做得怎么样,你在叶子上有什么进展吗?我的意思是完全是新的数据,是不同的历史片段。火车上应该是这样的,但测试却令人困惑。也许测试者在什么地方偷看了。
在我的森林里,在大约相同的数据下,我得到了0.6-0.7的误差,在小路上也是如此,而且测试的结果并不总是好的,几乎总是比小路差。升压有大约相同的误差,但测试是痛苦的,这种情况不会发生。
你怎么样了,你获得了叶子吗?好吧,那我就不知道了--没有取样就很难知道什么是错的。
我的结果并没有让我非常高兴。我已经收集了相当数量的树叶,但随之而来的问题是如何最好地使它们相互配合。 问题是,它们经常相互重叠20%-50%或更多,因此,事实证明,给出相同的信号,这并不是很好。我们的想法是将它们分组,并为每组做一个激活的阈值--所以我思考了最好的方法。
到目前为止,我正在进行相互过滤的实验--我在R中对树的叶子进行了训练,但到目前为止,只对买入进行了训练。
第一张没有树的截图,第二张有树的截图。时间是今年的3月至9月。
当然,平衡曲线不是很有吸引力,但它是一种趋势策略,其本质是在平淡期不要损失超过你的收入,而市场(思)全年都是平淡的,很少有强势的波动。我可以看到,增加一棵树已经改善了相对指标,我以后也会为销售做同样的事情,如果结果是积极的,它将成为模型的一部分。
直到最后都没有解决选择叶子的问题,即使选择在5年中每一年都显示出良好效果的叶子,也可以预期20%-40%停止工作,更可悲的是无法理解是否关闭它们--特别是按季度做了测试,结果发现过去季度不赚钱的叶子与随后季度的损失(很多)相重叠。
选叶的方法本身似乎很有希望,但过程非常缓慢。
那么,我不知道--没有样本,就很难知道哪里出了问题。
我对结果不是很满意。我已经收集了相当数量的树叶,但接下来的问题是如何让它们更好地一起工作。问题是,它们往往相互重叠20%-50%或更多,因此,结果是给出了相同的信号,这不是很好。我们的想法是将它们分组,并为每组做一个激活的阈值--所以我思考了最好的方法。
到目前为止,我正在试验相互过滤--我在R中对树的叶子进行了训练,但只用于购买。
第一张没有树的截图,第二张有树的截图。时间是今年的3月至9月。
当然,平衡曲线不是很有吸引力,但它是一种趋势策略,其本质是在平淡期不要损失超过你的收入,而市场(思)全年都是平淡的,很少有强势的波动。我可以看到,增加一棵树已经改善了相对的指标,我将在稍后为销售做同样的工作,如果结果是积极的,它将是模型的一部分。
直到最后都没有解决选择叶子的问题,即使选择在5年中每一年都表现出良好效果的叶子,也可以预期20%-40%停止工作,更可悲的是无法理解是否关闭它们--具体按季度做了测试,结果发现,过去季度不赚钱的叶子在随后的季度中重叠了损失(很多)。
选叶方法本身似乎很有前途,但这个过程极其缓慢。
我没有得到一个穆森,太糟糕了。
交易非常少,不具有代表性。而我们需要过滤掉那些亏损的,因为它们都是不必要的。是的,你不能靠这个赚快钱,这是一个耻辱。
行业非常少,没有代表性。而且你应该过滤无利可图的,它们都是一样的,你不需要它们。是的,问题是每个叶子信号分配1手,分别是,如果很多叶子激活,那么需要更多的手 - 有71手,但非常少,如果你把钱一直保持在71手,那么总数将得到每年25% - 交易所的GO是大的,它是斯。
关于去除无利可图的--这是一把双刃剑--一方面可以增加过滤器的数量,这将减少亏损交易的数量,但同时也会减少有利可图的交易数量,正如我上面写的,许多叶子在一年中变得有利可图,所以这是一个时间问题,一个市场条件问题。这种方法的问题是,它是非常劳动密集型的,没有可能及时添加新的预测因子,而我有这种想法,并且经常出现这种想法--我现在实际上是在用今年2月的样本工作。
改善指标的另一个方法,是在获利方面下功夫--目前平仓主要是通过止损和一个条件--在极少数情况下完成。
尽管有种种弊端,但该系统近一年来没有亏损,这可能表明方向正确。
是的,问题是每个叶子信号分配1手,分别是,如果很多叶子激活,那么需要更多的手 - 有71手,但非常少,如果你把钱一直保持在71手,那么总数将得到每年25% - 交易所的GO是很大的,它是斯。
关于去除无利可图的--这是一把双刃剑--一方面可以增加过滤器的数量,这将减少亏损交易的数量,但同时也会减少有利可图的交易数量,正如我上面写的,许多叶子在一年中变得有利可图,所以这是一个时间问题,一个市场条件的问题。这种方法的问题是,它是非常劳动密集型的,没有可能及时添加新的预测因子,而我有这种想法,并且经常出现这种想法--我现在实际上是在用今年2月的样本工作。
改善指标的另一个方法,是在获利方面下功夫--目前平仓主要是通过止损和一个条件--在极少数情况下完成。
尽管有种种缺点,但该系统近一年来没有亏损,这可能是一个正确方向的标志。
可以在第一个模型的基础上,在相同的特征上训练第二个模型。但是,它只是纠正权益类条目,也就是说,它将禁止/允许交易。至少不会有不必要的交易。
有可能在第一个模型的基础上训练一个具有相同特征的2号模型。但只有它才会简单地纠正股权交易的条目,即它会禁止/允许交易。至少不会有不必要的交易。
或者类似于系统列表组合的滑动重新计算的东西。
有可能在第一个模型的基础上训练一个具有相同特征的2号模型。但它只会纠正股票进场,也就是说,它将禁止/允许交易。至少不会有不必要的交易。
我不太明白你建议如何改变目标--现在我已经有3个目标--买入/卖出/不交易。而且,我选择要买/卖的床单,然后给每个这样的床单寻找一个 "不交易 "的过滤器,多达3件(对有些人来说是足够的,对有些人来说是不够的 - 进行测试)。在这些对的结果之后--激活叶+过滤叶,我根据最终的信号建立了一棵树,它考虑到了所有叶子的反应和它们的相互排斥,即我得到了额外的过滤器。
这里有一棵树
我想尝试在CB上建立模型,而不是在树上,也许那里对所有使用的叶子的概括性会更好,虽然准确性增加了1%,这并不多,但结果是积极的。
我不太明白你建议如何改变目标--现在我基本上有3个目标--买入/卖出/不交易。而且,我选择买/卖单,然后为每个这样的单子寻找一个 "不交易 "单子的过滤器,多达3件(对有些人来说是足够的,对有些人来说是不够的--我进行过测试)。在这些对的结果之后--激活叶+过滤叶,我根据最终的信号建立了一棵树,它考虑到了所有叶子的反应和它们的相互排斥,即我得到了额外的过滤器。
这里有一棵树
我想在CB上试试模型,而不是在树上,也许那里对所有用过的叶子的概括会更好。
那么,你应该从理论开始。例如,为销售和购买分别选择模型有什么意义?
一切不用于购买的东西都用于出售,反之亦然。这就是为什么我们需要一个普通的二进制分类器。此外,如果我们这样做,为什么我们需要一个单独的 "不交易 "类,因为你可以简单地通过一个更高的阈值过滤条目。不交易 "类可以被模型赋予过多的权重,由于这个原因,模型误差会减少,预测(概括)能力,一般来说,会下降。
第二个模型的意义在于,第1个模型会有第1类和第2类的错误--假阳性和假阴性。我们有兴趣清除它们。为了做到这一点,你把相同的特征输入到第二个模型的输入和第一个模型的输出,其中0 - 交易是盈利的,1 - 交易是亏损的。训练第二个分类器,只在它显示为0时进行交易,即过滤第一个模型的信号。亏损交易几乎会在托盘上消失,你必须在测试上进行测试--这就是一个。
你不仅可以在托盘上训练第二个模型,还可以捕捉OOS,然后它将在新数据上纠正交易--这就是两个。然后是测试。
你可以将样本分割成犯规,以棋盘式的顺序,通过某些块状物来教授这些模型。例如,5次犯规。第一个模型是在1,3,4次犯规的情况下一次性训练的。2,5上的第二个矫正模型。这将进一步提高概括性。