交易中的机器学习:理论、模型、实践和算法交易 - 页 1193

 
马克西姆-德米特里耶夫斯基

在mql5上也是如此...但这里有一个很好的测试器和一个基地:)

问题就在这里,我自己也在旋转,有时间的时候厌倦了阅读所有的东西。

如果目的是在市场上销售产品,那么一切都在MQL中,如果目的是个人使用或在本论坛以外的地方分发,那么问题就在于能否获得.dll和链接到MT的可能性。

 
伊戈尔-马卡努

这就是问题所在,我自己也在旋转,有时间的时候我已经厌倦了阅读所有的东西。

我必须定义目标--大声的想法)))),如果目的是市场上的产品,唉,那就全靠MQL了,如果目的是个人使用或在这个论坛之外的分发,那任务就归结为能够得到.dll和链接到MT的能力。

我将把它作为一个优秀的MQL机器人使用,其他的都是垃圾。如果你为市场写作,那么推广在那里更重要,而不是贸易业绩,加上愚蠢的 买家会让你大跌眼镜(有经验)。我有经验,你可以从代码库中提取几乎任何指标或专家顾问并在市场上出售......或者像格里巴乔夫那样投入200个,每天都有新的指标,但这不是武士的方式。

你必须让你的妻子或雇来的奴隶在电脑上与客户沟通,但你不会浪费你的时间 :)
 
马克西姆-德米特里耶夫斯基

目标是在MO上有一个了不起的机器人,其他的都是废话。如果你为市场写作,在那里推广比交易业绩更重要,另外愚蠢的 买家会让你大跌眼镜(我有过经验)。我没有任何代码基础的指标或专家顾问,他们会在市场上出售......或者你可以像格里巴乔夫那样放200个,每天一个新的,但这不是武士的方式。

如果你要这样做,你最好派你的妻子或雇佣的奴隶与买家沟通,因为你不会在这上面浪费时间 :)

我已经预见到了,所以我不认为有必要 "喘气",并认为值得放在市场上的东西 - 我不能提供产品支持,因为这将需要很长的时间,和东西存储在那里,希望有窥视谁愿意给30美元,因为良心上不允许)))。

ZS:通过一个简单的指标对订单进行网格化...它可以永远工作,永远(向上或向下),并且永远被用户所需要))))。

 
伊戈尔-马卡努

我已经预见到了,所以我认为没有必要 "喘气",把有价值的东西放在市场上--我将无法支持产品,因为这将需要很长的时间,而且东西存放在那里,希望找到愿意捐赠30美元的窥视者,我不允许)))。

ZS:通过一个简单的指标对订单进行网格化...它将始终工作(向上或向下),并始终被用户所需求 ))))

马丁斯,网格是的......各种类型的极客,这是永恒的:)

 

我想到了一个想法--通过MO来确定过度训练。我一直在挖掘catbust,在那里你可以得到一个概率的预测--我把0到9的概率分散成组--为了便于感知和进一步分析--看了分布,标准差,峰度,不对称性,包括按目标和错误分布的细分,每组的答案正确率。现在我将拉出不同的标准指标来评估模型,如AUC F1和其他,在那里你可以看到学习的动态,但到目前为止我不知道如何更好地描述它。

图中有两个模型--分布组*正确分类组。蓝色模型在考试样本上的表现更好。


你还能想到哪些预测因素来评估该模型?

 
阿列克谢-维亚兹米 金。

想到了一个想法-- 通过MO来确定过度训练 。我一直在挖掘catbust,在那里你可以得到一个概率的预测--我把0到9的概率分散成组--为了便于感知和进一步分析--看了分布,标准差,峰度,不对称性,包括按目标和错误分布的细分,每组的答案正确率。现在我将拉出不同的标准指标来评估模型,如AUC F1和其他,在那里你可以看到学习的动态,但到目前为止我不知道如何更好地描述它。

图中有两个模型--分布组*正确分类组。蓝色模型在考试样本上的表现更好。


你还能想到哪些预测因素来评估该模型?

酷,这实际上是每个人都在做的事情。

衡量标准是用来估计模型的,而不是预测指标,标准指标通常是足够的,但你可以自己编造。

通常情况下,森林中的误差越大,数值的扩散(分散)就越小,即只是0.5左右的白噪声,从这个意义上说,蓝线比红线更糟糕。
 
马克西姆-德米特里耶夫斯基

很好,这实际上是每个人都在做的事情。

衡量标准是用来估计模型的,而不是预测器,标准的通常就足够了,但你可以自己编造。

通常,森林中的误差越大,数值的传播(分散)就越小,即只是0.5左右的白噪声,在这个意义上,蓝线比红线更糟糕。

哈,所以是要找到一个估计的标准,而不是用不同的计算公式来估计!所有这些带有公式的方法都是对模型的静止性进行评估,但并不能说明其继续进一步工作的能力,这正是我想实现的,所以我生成预测器,以便能够通过MO从一组不同的指标中找到一个模式。

关于散点--你的说法非常奇怪,也许它只考虑到了寻找数值的事实,而没有考虑到它们的分类价值和正确答案的百分比。在X轴上从0到5的图形是一簇零和它们的正确分类的乘积,从5对面是单位的乘积。

下面是这些模型的图表,但显示了目标 "1 "的分布情况

正如你所看到的,红色模型的分布比例偏移超过5,这意味着 "1 "没有机会被正确分类,而有机会的则比蓝色模型少--分别为23%和28%。

而这就是分类的保真度的变化方式

当然,也可以使用这样的扁平化模型,但需要将分类划分从0.5转移到0.7,例如,但留给处理的材料不多,但另一方面,这样的扁平化模型可以合并...

 
阿列克谢-维亚兹米 金。

哈,所以是要找到一个估计的标准,而不是用不同的计算公式来估计!所有这些公式方法都评估了模型的固定性,但并没有告诉我们它持续工作的能力,这正是我想要实现的,这也是我生成预测器的原因,这样我就可以通过MO的方式从一组不同的指标中找到一个模式。

关于散点--你的说法非常奇怪,也许它只考虑到了寻找数值的事实,而没有考虑到它们的分类价值和正确答案的百分比。在X轴上从0到5的图形是一簇零和它们的正确分类的乘积,从5对面是单位的乘积。

下面是这些模型的图表,但显示了目标 "1 "的分布情况

正如你所看到的,红色模型的分布比例偏移超过5,这意味着 "1 "没有机会被正确分类,而有机会的则比蓝色模型少--分别为23%和28%。

而这里是分类的保真度的变化情况

当然,我们也可以使用这样的扁平化模型,但有必要将分类的划分从0.5转移到0.7,例如,但留给处理的材料不多,但另一方面,这样的扁平化模型可以合并...

事实上,它是有偏见的,只是说有利于某些类别,它可能是在一个趋势市场,即一个学习样本(大约)。

如果你采取蓝色的,你有急剧下降的概率,也就是说,如果在理想情况下,信号的概率应该是1,那么你有它0.6-0.7的最大值,也就是说,两个类在0.5左右旋转,对一个或另一个类有小的偏差,事实上,有噪音而不是信号,或者模型被强烈规范化

在测试样本上保持错误工作的能力......如果你设法在跟踪上接近错误,那么作为一个规则,模型是好的。

 
马克西姆-德米特里耶夫斯基

事实上,它是有偏见的,只是说有利于某些类别,它可能是在一个趋势市场,即一个训练样本(大致如此)。

我们在相同的条件下对模型进行比较,下面是相同的模型在其他数据目标单位下的分类1--35%与39%的对比。

分类保真度

而由于所有数值的集群更接近中心,我们得到的乘积是

马克西姆-德米特里耶夫斯基

如果你采取蓝色,你会得到概率的急剧下降,也就是说,如果在理想情况下,信号的概率应该是1,那么你有它0.6-0.7的最大值,即两个类围绕着0.5,对一个或另一个类的小偏差,事实上有噪音,但没有信号。

有能力在错误的测试样本上继续工作......如果你设法接近托盘上的错误,那么作为一项规则,该模型是好的。

为什么这个概率必须是 "1"--而是过于自信,相反,我认为在正确的(理想的)模型中,必须有0.1和0.3以及0.7和0.9之间的两个驼峰--因为这将表明稳定性和充分性,但这样的模型在事实上还没有被观察到。

关于估计系数值的近似--是的,我同意--我将查看delta,并对动态进行一些测量--在catbust,你可以看到当树木被添加到模型中时,数值是如何变化的。
 
阿列克谢-维亚兹米 金。

我们在相同的条件下对模型进行比较,下面是相同的模型在其他数据目标单位下的分类1--35%与39%的对比。

分类的保真度

而由于所有数值的累积更接近于中心,我们得到的乘积是

为什么这个概率应该是 "1"--而是自满,事实上我认为一个适当的(理想的)模型应该在0.2和0.4以及0.7和0.9之间有两个驼峰--这将表明稳定性和充分性,但我在现实中还没有看到这种模型。

关于估计系数值的近似--是的,我同意--我会看一下delta,并对动态进行一些测量--在catbust,你可以看到当树木被添加到模型中时,指标如何变化。

事件的概率越高,信号就越准确,这甚至有点来自于定义:)2、在嘈杂的数据上不会有驼峰,至少因为会有瞬态,但模型至少应该在适当的程度上捕捉到极端值,否则永远无法确定输入的情况