交易中的机器学习:理论、模型、实践和算法交易 - 页 1193 1...118611871188118911901191119211931194119511961197119811991200...3399 新评论 Igor Makanu 2018.12.10 10:12 #11921 马克西姆-德米特里耶夫斯基。在mql5上也是如此...但这里有一个很好的测试器和一个基地:)问题就在这里,我自己也在旋转,有时间的时候厌倦了阅读所有的东西。 如果目的是在市场上销售产品,那么一切都在MQL中,如果目的是个人使用或在本论坛以外的地方分发,那么问题就在于能否获得.dll和链接到MT的可能性。 Maxim Dmitrievsky 2018.12.10 10:16 #11922 伊戈尔-马卡努。这就是问题所在,我自己也在旋转,有时间的时候我已经厌倦了阅读所有的东西。 我必须定义目标--大声的想法)))),如果目的是市场上的产品,唉,那就全靠MQL了,如果目的是个人使用或在这个论坛之外的分发,那任务就归结为能够得到.dll和链接到MT的能力。我将把它作为一个优秀的MQL机器人使用,其他的都是垃圾。如果你为市场写作,那么推广在那里更重要,而不是贸易业绩,加上愚蠢的 买家会让你大跌眼镜(有经验)。我有经验,你可以从代码库中提取几乎任何指标或专家顾问并在市场上出售......或者像格里巴乔夫那样投入200个,每天都有新的指标,但这不是武士的方式。 你必须让你的妻子或雇来的奴隶在电脑上与客户沟通,但你不会浪费你的时间 :) Igor Makanu 2018.12.10 10:28 #11923 马克西姆-德米特里耶夫斯基。目标是在MO上有一个了不起的机器人,其他的都是废话。如果你为市场写作,在那里推广比交易业绩更重要,另外愚蠢的 买家会让你大跌眼镜(我有过经验)。我没有任何代码基础的指标或专家顾问,他们会在市场上出售......或者你可以像格里巴乔夫那样放200个,每天一个新的,但这不是武士的方式。 如果你要这样做,你最好派你的妻子或雇佣的奴隶与买家沟通,因为你不会在这上面浪费时间 :)我已经预见到了,所以我不认为有必要 "喘气",并认为值得放在市场上的东西 - 我不能提供产品支持,因为这将需要很长的时间,和东西存储在那里,希望有窥视谁愿意给30美元,因为良心上不允许)))。 ZS:通过一个简单的指标对订单进行网格化...它可以永远工作,永远(向上或向下),并且永远被用户所需要))))。 Maxim Dmitrievsky 2018.12.10 10:33 #11924 伊戈尔-马卡努。我已经预见到了,所以我认为没有必要 "喘气",把有价值的东西放在市场上--我将无法支持产品,因为这将需要很长的时间,而且东西存放在那里,希望找到愿意捐赠30美元的窥视者,我不允许)))。 ZS:通过一个简单的指标对订单进行网格化...它将始终工作(向上或向下),并始终被用户所需求 ))))马丁斯,网格是的......各种类型的极客,这是永恒的:) Aleksey Vyazmikin 2018.12.10 12:22 #11925 我想到了一个想法--通过MO来确定过度训练。我一直在挖掘catbust,在那里你可以得到一个概率的预测--我把0到9的概率分散成组--为了便于感知和进一步分析--看了分布,标准差,峰度,不对称性,包括按目标和错误分布的细分,每组的答案正确率。现在我将拉出不同的标准指标来评估模型,如AUC F1和其他,在那里你可以看到学习的动态,但到目前为止我不知道如何更好地描述它。 图中有两个模型--分布组*正确分类组。蓝色模型在考试样本上的表现更好。 你还能想到哪些预测因素来评估该模型? Maxim Dmitrievsky 2018.12.10 12:32 #11926 阿列克谢-维亚兹米 金。我想到了一个想法-- 通过MO来确定过度训练 。我一直在挖掘catbust,在那里你可以得到一个概率的预测--我把0到9的概率分散成组--为了便于感知和进一步分析--看了分布,标准差,峰度,不对称性,包括按目标和错误分布的细分,每组的答案正确率。现在我将拉出不同的标准指标来评估模型,如AUC F1和其他,在那里你可以看到学习的动态,但到目前为止我不知道如何更好地描述它。 图中有两个模型--分布组*正确分类组。蓝色模型在考试样本上的表现更好。 你还能想到哪些预测因素来评估该模型?酷,这实际上是每个人都在做的事情。 衡量标准是用来估计模型的,而不是预测指标,标准指标通常是足够的,但你可以自己编造。 通常情况下,森林中的误差越大,数值的扩散(分散)就越小,即只是0.5左右的白噪声,从这个意义上说,蓝线比红线更糟糕。 Aleksey Vyazmikin 2018.12.10 14:12 #11927 马克西姆-德米特里耶夫斯基。很好,这实际上是每个人都在做的事情。 衡量标准是用来估计模型的,而不是预测器,标准的通常就足够了,但你可以自己编造。 通常,森林中的误差越大,数值的传播(分散)就越小,即只是0.5左右的白噪声,在这个意义上,蓝线比红线更糟糕。哈,所以是要找到一个估计的标准,而不是用不同的计算公式来估计!所有这些带有公式的方法都是对模型的静止性进行评估,但并不能说明其继续进一步工作的能力,这正是我想实现的,所以我生成预测器,以便能够通过MO从一组不同的指标中找到一个模式。 关于散点--你的说法非常奇怪,也许它只考虑到了寻找数值的事实,而没有考虑到它们的分类价值和正确答案的百分比。在X轴上从0到5的图形是一簇零和它们的正确分类的乘积,从5对面是单位的乘积。 下面是这些模型的图表,但显示了目标 "1 "的分布情况 正如你所看到的,红色模型的分布比例偏移超过5,这意味着 "1 "没有机会被正确分类,而有机会的则比蓝色模型少--分别为23%和28%。 而这就是分类的保真度的变化方式 当然,也可以使用这样的扁平化模型,但需要将分类划分从0.5转移到0.7,例如,但留给处理的材料不多,但另一方面,这样的扁平化模型可以合并... Maxim Dmitrievsky 2018.12.10 14:18 #11928 阿列克谢-维亚兹米 金。哈,所以是要找到一个估计的标准,而不是用不同的计算公式来估计!所有这些公式方法都评估了模型的固定性,但并没有告诉我们它持续工作的能力,这正是我想要实现的,这也是我生成预测器的原因,这样我就可以通过MO的方式从一组不同的指标中找到一个模式。 关于散点--你的说法非常奇怪,也许它只考虑到了寻找数值的事实,而没有考虑到它们的分类价值和正确答案的百分比。在X轴上从0到5的图形是一簇零和它们的正确分类的乘积,从5对面是单位的乘积。 下面是这些模型的图表,但显示了目标 "1 "的分布情况 正如你所看到的,红色模型的分布比例偏移超过5,这意味着 "1 "没有机会被正确分类,而有机会的则比蓝色模型少--分别为23%和28%。 而这里是分类的保真度的变化情况 当然,我们也可以使用这样的扁平化模型,但有必要将分类的划分从0.5转移到0.7,例如,但留给处理的材料不多,但另一方面,这样的扁平化模型可以合并...事实上,它是有偏见的,只是说有利于某些类别,它可能是在一个趋势市场,即一个学习样本(大约)。 如果你采取蓝色的,你有急剧下降的概率,也就是说,如果在理想情况下,信号的概率应该是1,那么你有它0.6-0.7的最大值,也就是说,两个类在0.5左右旋转,对一个或另一个类有小的偏差,事实上,有噪音而不是信号,或者模型被强烈规范化 在测试样本上保持错误工作的能力......如果你设法在跟踪上接近错误,那么作为一个规则,模型是好的。 Aleksey Vyazmikin 2018.12.10 14:34 #11929 马克西姆-德米特里耶夫斯基。事实上,它是有偏见的,只是说有利于某些类别,它可能是在一个趋势市场,即一个训练样本(大致如此)。我们在相同的条件下对模型进行比较,下面是相同的模型在其他数据目标单位下的分类1--35%与39%的对比。 分类保真度 而由于所有数值的集群更接近中心,我们得到的乘积是 马克西姆-德米特里耶夫斯基。如果你采取蓝色,你会得到概率的急剧下降,也就是说,如果在理想情况下,信号的概率应该是1,那么你有它0.6-0.7的最大值,即两个类围绕着0.5,对一个或另一个类的小偏差,事实上有噪音,但没有信号。 有能力在错误的测试样本上继续工作......如果你设法接近托盘上的错误,那么作为一项规则,该模型是好的。 为什么这个概率必须是 "1"--而是过于自信,相反,我认为在正确的(理想的)模型中,必须有0.1和0.3以及0.7和0.9之间的两个驼峰--因为这将表明稳定性和充分性,但这样的模型在事实上还没有被观察到。 关于估计系数值的近似--是的,我同意--我将查看delta,并对动态进行一些测量--在catbust,你可以看到当树木被添加到模型中时,数值是如何变化的。 Maxim Dmitrievsky 2018.12.10 14:42 #11930 阿列克谢-维亚兹米 金。我们在相同的条件下对模型进行比较,下面是相同的模型在其他数据目标单位下的分类1--35%与39%的对比。 分类的保真度 而由于所有数值的累积更接近于中心,我们得到的乘积是 为什么这个概率应该是 "1"--而是自满,事实上我认为一个适当的(理想的)模型应该在0.2和0.4以及0.7和0.9之间有两个驼峰--这将表明稳定性和充分性,但我在现实中还没有看到这种模型。 关于估计系数值的近似--是的,我同意--我会看一下delta,并对动态进行一些测量--在catbust,你可以看到当树木被添加到模型中时,指标如何变化。事件的概率越高,信号就越准确,这甚至有点来自于定义:)2、在嘈杂的数据上不会有驼峰,至少因为会有瞬态,但模型至少应该在适当的程度上捕捉到极端值,否则永远无法确定输入的情况 1...118611871188118911901191119211931194119511961197119811991200...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
在mql5上也是如此...但这里有一个很好的测试器和一个基地:)
问题就在这里,我自己也在旋转,有时间的时候厌倦了阅读所有的东西。
如果目的是在市场上销售产品,那么一切都在MQL中,如果目的是个人使用或在本论坛以外的地方分发,那么问题就在于能否获得.dll和链接到MT的可能性。
这就是问题所在,我自己也在旋转,有时间的时候我已经厌倦了阅读所有的东西。
我必须定义目标--大声的想法)))),如果目的是市场上的产品,唉,那就全靠MQL了,如果目的是个人使用或在这个论坛之外的分发,那任务就归结为能够得到.dll和链接到MT的能力。
我将把它作为一个优秀的MQL机器人使用,其他的都是垃圾。如果你为市场写作,那么推广在那里更重要,而不是贸易业绩,加上愚蠢的 买家会让你大跌眼镜(有经验)。我有经验,你可以从代码库中提取几乎任何指标或专家顾问并在市场上出售......或者像格里巴乔夫那样投入200个,每天都有新的指标,但这不是武士的方式。
你必须让你的妻子或雇来的奴隶在电脑上与客户沟通,但你不会浪费你的时间 :)目标是在MO上有一个了不起的机器人,其他的都是废话。如果你为市场写作,在那里推广比交易业绩更重要,另外愚蠢的 买家会让你大跌眼镜(我有过经验)。我没有任何代码基础的指标或专家顾问,他们会在市场上出售......或者你可以像格里巴乔夫那样放200个,每天一个新的,但这不是武士的方式。
如果你要这样做,你最好派你的妻子或雇佣的奴隶与买家沟通,因为你不会在这上面浪费时间 :)我已经预见到了,所以我不认为有必要 "喘气",并认为值得放在市场上的东西 - 我不能提供产品支持,因为这将需要很长的时间,和东西存储在那里,希望有窥视谁愿意给30美元,因为良心上不允许)))。
ZS:通过一个简单的指标对订单进行网格化...它可以永远工作,永远(向上或向下),并且永远被用户所需要))))。
我已经预见到了,所以我认为没有必要 "喘气",把有价值的东西放在市场上--我将无法支持产品,因为这将需要很长的时间,而且东西存放在那里,希望找到愿意捐赠30美元的窥视者,我不允许)))。
ZS:通过一个简单的指标对订单进行网格化...它将始终工作(向上或向下),并始终被用户所需求 ))))
马丁斯,网格是的......各种类型的极客,这是永恒的:)
我想到了一个想法--通过MO来确定过度训练。我一直在挖掘catbust,在那里你可以得到一个概率的预测--我把0到9的概率分散成组--为了便于感知和进一步分析--看了分布,标准差,峰度,不对称性,包括按目标和错误分布的细分,每组的答案正确率。现在我将拉出不同的标准指标来评估模型,如AUC F1和其他,在那里你可以看到学习的动态,但到目前为止我不知道如何更好地描述它。
图中有两个模型--分布组*正确分类组。蓝色模型在考试样本上的表现更好。
你还能想到哪些预测因素来评估该模型?
我想到了一个想法-- 通过MO来确定过度训练 。我一直在挖掘catbust,在那里你可以得到一个概率的预测--我把0到9的概率分散成组--为了便于感知和进一步分析--看了分布,标准差,峰度,不对称性,包括按目标和错误分布的细分,每组的答案正确率。现在我将拉出不同的标准指标来评估模型,如AUC F1和其他,在那里你可以看到学习的动态,但到目前为止我不知道如何更好地描述它。
图中有两个模型--分布组*正确分类组。蓝色模型在考试样本上的表现更好。
你还能想到哪些预测因素来评估该模型?
酷,这实际上是每个人都在做的事情。
衡量标准是用来估计模型的,而不是预测指标,标准指标通常是足够的,但你可以自己编造。
通常情况下,森林中的误差越大,数值的扩散(分散)就越小,即只是0.5左右的白噪声,从这个意义上说,蓝线比红线更糟糕。很好,这实际上是每个人都在做的事情。
衡量标准是用来估计模型的,而不是预测器,标准的通常就足够了,但你可以自己编造。
通常,森林中的误差越大,数值的传播(分散)就越小,即只是0.5左右的白噪声,在这个意义上,蓝线比红线更糟糕。哈,所以是要找到一个估计的标准,而不是用不同的计算公式来估计!所有这些带有公式的方法都是对模型的静止性进行评估,但并不能说明其继续进一步工作的能力,这正是我想实现的,所以我生成预测器,以便能够通过MO从一组不同的指标中找到一个模式。
关于散点--你的说法非常奇怪,也许它只考虑到了寻找数值的事实,而没有考虑到它们的分类价值和正确答案的百分比。在X轴上从0到5的图形是一簇零和它们的正确分类的乘积,从5对面是单位的乘积。
下面是这些模型的图表,但显示了目标 "1 "的分布情况
正如你所看到的,红色模型的分布比例偏移超过5,这意味着 "1 "没有机会被正确分类,而有机会的则比蓝色模型少--分别为23%和28%。
而这就是分类的保真度的变化方式
当然,也可以使用这样的扁平化模型,但需要将分类划分从0.5转移到0.7,例如,但留给处理的材料不多,但另一方面,这样的扁平化模型可以合并...
哈,所以是要找到一个估计的标准,而不是用不同的计算公式来估计!所有这些公式方法都评估了模型的固定性,但并没有告诉我们它持续工作的能力,这正是我想要实现的,这也是我生成预测器的原因,这样我就可以通过MO的方式从一组不同的指标中找到一个模式。
关于散点--你的说法非常奇怪,也许它只考虑到了寻找数值的事实,而没有考虑到它们的分类价值和正确答案的百分比。在X轴上从0到5的图形是一簇零和它们的正确分类的乘积,从5对面是单位的乘积。
下面是这些模型的图表,但显示了目标 "1 "的分布情况
正如你所看到的,红色模型的分布比例偏移超过5,这意味着 "1 "没有机会被正确分类,而有机会的则比蓝色模型少--分别为23%和28%。
而这里是分类的保真度的变化情况
当然,我们也可以使用这样的扁平化模型,但有必要将分类的划分从0.5转移到0.7,例如,但留给处理的材料不多,但另一方面,这样的扁平化模型可以合并...
事实上,它是有偏见的,只是说有利于某些类别,它可能是在一个趋势市场,即一个学习样本(大约)。
如果你采取蓝色的,你有急剧下降的概率,也就是说,如果在理想情况下,信号的概率应该是1,那么你有它0.6-0.7的最大值,也就是说,两个类在0.5左右旋转,对一个或另一个类有小的偏差,事实上,有噪音而不是信号,或者模型被强烈规范化
在测试样本上保持错误工作的能力......如果你设法在跟踪上接近错误,那么作为一个规则,模型是好的。
事实上,它是有偏见的,只是说有利于某些类别,它可能是在一个趋势市场,即一个训练样本(大致如此)。
我们在相同的条件下对模型进行比较,下面是相同的模型在其他数据目标单位下的分类1--35%与39%的对比。
分类保真度
而由于所有数值的集群更接近中心,我们得到的乘积是
如果你采取蓝色,你会得到概率的急剧下降,也就是说,如果在理想情况下,信号的概率应该是1,那么你有它0.6-0.7的最大值,即两个类围绕着0.5,对一个或另一个类的小偏差,事实上有噪音,但没有信号。
有能力在错误的测试样本上继续工作......如果你设法接近托盘上的错误,那么作为一项规则,该模型是好的。
为什么这个概率必须是 "1"--而是过于自信,相反,我认为在正确的(理想的)模型中,必须有0.1和0.3以及0.7和0.9之间的两个驼峰--因为这将表明稳定性和充分性,但这样的模型在事实上还没有被观察到。
关于估计系数值的近似--是的,我同意--我将查看delta,并对动态进行一些测量--在catbust,你可以看到当树木被添加到模型中时,数值是如何变化的。我们在相同的条件下对模型进行比较,下面是相同的模型在其他数据目标单位下的分类1--35%与39%的对比。
分类的保真度
而由于所有数值的累积更接近于中心,我们得到的乘积是
为什么这个概率应该是 "1"--而是自满,事实上我认为一个适当的(理想的)模型应该在0.2和0.4以及0.7和0.9之间有两个驼峰--这将表明稳定性和充分性,但我在现实中还没有看到这种模型。
关于估计系数值的近似--是的,我同意--我会看一下delta,并对动态进行一些测量--在catbust,你可以看到当树木被添加到模型中时,指标如何变化。事件的概率越高,信号就越准确,这甚至有点来自于定义:)2、在嘈杂的数据上不会有驼峰,至少因为会有瞬态,但模型至少应该在适当的程度上捕捉到极端值,否则永远无法确定输入的情况