交易中的机器学习:理论、模型、实践和算法交易 - 页 1778 1...177117721773177417751776177717781779178017811782178317841785...3399 新评论 mytarmailS 2020.05.10 14:57 #17771 德米特里。 而预测的能力是由什么决定的? 嗯,不是相关的... 也许通过滞后估计的交叉相关... 迪米特里。 通过愚蠢地把世界上所有的东西都塞进模型里? 为什么不呢?在训练中,交叉验证会剔除不需要的东西,或者一些统计... 你怎么知道 "什么是什么"你怎么知道 "什么是什么",直到你检查它? mytarmailS 2020.05.10 14:59 #17772 阿列克谢-维亚兹米 金。 你仍然没有说如何在上面交易--所以我不知道要编造什么样的TS。 怎么会呢,这很明显))。ZZ上涨意味着买入,下跌意味着卖出。 你会预测ZZ的方向,不是吗? Дмитрий 2020.05.10 15:00 #17773 mytarmailS: 不是靠相关的... 也许通过滞后估计的交叉相关... 为什么不呢?交叉验证将剔除你在培训中不需要的东西,或一些统计数据... 你怎么知道 "什么是什么"直到你测试它? 好吧,我想详细谈谈冗余的问题,特别是与NS有关的问题,但我很懒。 顺便说一句,正是这个问题常常成为模型预测能力差的原因。 Aleksey Vyazmikin 2020.05.10 15:03 #17774 mytarmailS: 怎么会呢,这很明显))。ZZ上涨是买,下跌是卖。 你在预测ZZ的方向,是吗? 这将变成一种抽搐,可能。 你是否尝试过用窗口对分类指标进行平均化/平滑化,以消除异常值? mytarmailS 2020.05.10 15:17 #17775 阿列克谢-维亚兹米 金。 这将变成一个抽搐,可能。 你是否尝试过用窗口对分类指标进行平均化/平滑化,以消除异常值? 在这种情况下,平均数等于滞后数。你需要提高分类的质量,平滑是不可能的。 按原样试一试吧! Dmitriy: 好吧,我想详细谈谈冗余的问题,特别是与NS有关的问题,但我很懒。 顺便说一下,这个问题往往是导致模型预测能力差的原因。 这就是为什么我认为在这个方向上,标志可以已经被AMO或工作规则所训练,那些标志应该是定性的、压缩的信息,我在前一页的小实验证明了这一点。 我仍然不明白如何预测相关关系(我不知道)。 Дмитрий 2020.05.10 15:47 #17776 mytarmailS: 而如何通过关联性来预测,我还是不明白( 预测再次.... 相关系数有助于提前确定最重要的预测因素--因变量和预测因素之间的相关度越高,该变量对模型的意义就越大。 因此,在你的例子中,有两条路可以走。第一个,你的是每次把一个预测器替换到模型中,看看预测的准确性提高了多少。那是一段很长的时间。 第二种,利用相关系数提前筛选出不重要的预测因子,使模型产生噪音。 简单地说,冗余问题就是你可以在模型中增加100+1个新的预测因子,但100个预测因子会使预测质量增加0,01%,而1个会增加10%。而且,用这100个新的预测因子使模型超载是没有意义的--过度拟合 Дмитрий 2020.05.10 15:48 #17777 mytarmailS: 顺便说一句,在大量的预测因子上,树是垃圾,随机森林 是规则。 mytarmailS 2020.05.10 16:07 #17778 德米特里。 预测再次.... 相关系数有助于提前确定最重要的预测因素--因变量和预测因素之间的相关度越高,该变量对模型的意义就越大。 因此,在你的例子中,有两条路可以走。第一个,你的是每次把一个预测器替换到模型中,看看预测的准确性提高了多少。那是一段很长的时间。 第二,使用相关系数提前筛选出不重要的预测因素,这些预测因素会给模型带来噪音。 好吧,相关性只是筛选出的选项之一,而且绝对不是最好的。你也可以使用协整、交叉相关、非线性相关等,效果会更好,但它们在层次上都低于简单的分类误差,这就是为什么我选择性状预测 误差 的标准。 迪米特里。 顺便说一句,在大量的预测因子上,树是垃圾,随机森林是规则。 我部分同意,但从广义上讲,森林是相同的规则,唯一的区别是复杂性。 在R中,有一个包可以将200棵树的森林压缩成一到三条规则,通过去除所有不必要的和多余的规则,分类质量的损失是0.5-2%,这是一个信息的压缩,我们应该努力提高可解释性。 Aleksey Vyazmikin 2020.05.10 17:41 #17779 mytarmailS: 在这种情况下,平均化等于滞后。你需要提高分类的质量,平滑是不可能的。 按原样试一试吧! 这不是一个选项。单位里有太多的干扰。 当然,你可以将激活阈值转移到0.65 - 买入,0.35 - 卖出。 mytarmailS 2020.05.10 18:12 #17780 阿列克谢-维亚兹米 金。 这不是一个选项。公寓里有太多的囤积物。 当然,你可以将激活阈值转移到0.65 - 买入,0.35 - 卖出。 给我看一个有交易的图表 1...177117721773177417751776177717781779178017811782178317841785...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
而预测的能力是由什么决定的?
嗯,不是相关的...
也许通过滞后估计的交叉相关...
通过愚蠢地把世界上所有的东西都塞进模型里?
为什么不呢?在训练中,交叉验证会剔除不需要的东西,或者一些统计...
你怎么知道 "什么是什么"你怎么知道 "什么是什么",直到你检查它?
你仍然没有说如何在上面交易--所以我不知道要编造什么样的TS。
怎么会呢,这很明显))。ZZ上涨意味着买入,下跌意味着卖出。
你会预测ZZ的方向,不是吗?
不是靠相关的...
也许通过滞后估计的交叉相关...
为什么不呢?交叉验证将剔除你在培训中不需要的东西,或一些统计数据...
你怎么知道 "什么是什么"直到你测试它?
好吧,我想详细谈谈冗余的问题,特别是与NS有关的问题,但我很懒。
顺便说一句,正是这个问题常常成为模型预测能力差的原因。
怎么会呢,这很明显))。ZZ上涨是买,下跌是卖。
你在预测ZZ的方向,是吗?
这将变成一种抽搐,可能。
你是否尝试过用窗口对分类指标进行平均化/平滑化,以消除异常值?
这将变成一个抽搐,可能。
你是否尝试过用窗口对分类指标进行平均化/平滑化,以消除异常值?
在这种情况下,平均数等于滞后数。你需要提高分类的质量,平滑是不可能的。
按原样试一试吧!
好吧,我想详细谈谈冗余的问题,特别是与NS有关的问题,但我很懒。
顺便说一下,这个问题往往是导致模型预测能力差的原因。
这就是为什么我认为在这个方向上,标志可以已经被AMO或工作规则所训练,那些标志应该是定性的、压缩的信息,我在前一页的小实验证明了这一点。
我仍然不明白如何预测相关关系(我不知道)。
而如何通过关联性来预测,我还是不明白(
预测再次....
相关系数有助于提前确定最重要的预测因素--因变量和预测因素之间的相关度越高,该变量对模型的意义就越大。
因此,在你的例子中,有两条路可以走。第一个,你的是每次把一个预测器替换到模型中,看看预测的准确性提高了多少。那是一段很长的时间。
第二种,利用相关系数提前筛选出不重要的预测因子,使模型产生噪音。
简单地说,冗余问题就是你可以在模型中增加100+1个新的预测因子,但100个预测因子会使预测质量增加0,01%,而1个会增加10%。而且,用这100个新的预测因子使模型超载是没有意义的--过度拟合
顺便说一句,在大量的预测因子上,树是垃圾,随机森林 是规则。
预测再次....
相关系数有助于提前确定最重要的预测因素--因变量和预测因素之间的相关度越高,该变量对模型的意义就越大。
因此,在你的例子中,有两条路可以走。第一个,你的是每次把一个预测器替换到模型中,看看预测的准确性提高了多少。那是一段很长的时间。
第二,使用相关系数提前筛选出不重要的预测因素,这些预测因素会给模型带来噪音。
好吧,相关性只是筛选出的选项之一,而且绝对不是最好的。你也可以使用协整、交叉相关、非线性相关等,效果会更好,但它们在层次上都低于简单的分类误差,这就是为什么我选择性状预测 误差 的标准。
顺便说一句,在大量的预测因子上,树是垃圾,随机森林是规则。
我部分同意,但从广义上讲,森林是相同的规则,唯一的区别是复杂性。
在R中,有一个包可以将200棵树的森林压缩成一到三条规则,通过去除所有不必要的和多余的规则,分类质量的损失是0.5-2%,这是一个信息的压缩,我们应该努力提高可解释性。
在这种情况下,平均化等于滞后。你需要提高分类的质量,平滑是不可能的。
按原样试一试吧!
这不是一个选项。单位里有太多的干扰。
当然,你可以将激活阈值转移到0.65 - 买入,0.35 - 卖出。
这不是一个选项。公寓里有太多的囤积物。
当然,你可以将激活阈值转移到0.65 - 买入,0.35 - 卖出。
给我看一个有交易的图表