交易中的机器学习:理论、模型、实践和算法交易 - 页 109

 
我赞同这个观点,这个想法是在周末产生的。事实上,网络说 "我不知道 "的次数越多,就越接近于过度训练的时刻。在OOS开始时,几乎所有的信号都得到了明确的解释,但随着时间的推移,网络越来越多地开始说 "我不知道",这表明有新的数据进来,而这些数据是难以解释的。当达到一定程度的 "我不知道 "时,网络会被重新训练。一个非常有用的东西....
 
如果不谈预测因素的预选,所有关于OOS模型的逐渐衰减以及这一信息在贸易中的作用的讨论看起来都是没有说服力的。
 
SanSanych Fomenko:
如果不谈预测因子的预选,所有关于模型在OOS上的逐渐消退以及这一信息在贸易中的有用性的讨论看起来都是没有说服力的。
那么,该如何选择呢。让我们选择一个具有最大概括水平的模型,看看它在训练区间的表现如何。euviti应该均匀地 生长...然后是运气。没有它,就没有地方...
 
安德烈-迪克

阿托。

如果一个模型在OOS上给出了错误的信号,那是训练有误的表现,而不是市场发生了变化。

我同意这一点。但你如何分析两个网格的信号?这不是很清楚吗?它们的分歧有多大,还是一致的?
 
阿列克谢-伯纳科夫
我同意这一点。如何分析两个网格的信号?这不是很清楚吗?它们是如何分歧的,还是一致的?

把信号带到一个共同的模式,就像这样。

卖出 买入 解释

-1 0卖出

0 0 栅栏

0 1 买

-1 1栅栏

在一个训练有素的模型中,信号很少相互矛盾。对他们不要求训练区的信号数量相等,作为一项规则,他们是不同的,这是可以理解的,因为市场可以有长期的全球趋势。但我限制一个网格的信号数量不能超过另一个网格信号数量的2倍。我无法回答为什么是2倍,但这是一个经验性的比率。例如,如果趋势从上升变为下降,卖出信号的数量增加,买入信号开始说谎,出现矛盾,交易量 减少--这是需要新的训练的信号。

 
安德烈-迪克

把信号带到一个共同的模式,就像这样。

卖出 买入 解释

-1 0卖出

0 0 栅栏

0 1 买

-1 1栅栏

在一个训练有素的模型中,信号很少相互矛盾。对他们不要求训练区的信号数量相等,作为一项规则,他们是不同的,这是可以理解的,因为市场可以有长期的全球趋势。但我限制一个网格的信号数量不能超过另一个网格信号数量的2倍。我无法回答为什么是2倍,但这是一个经验性的比率。例如,如果趋势从上升变为下降,卖出信号的数量增加,买入信号开始说谎,出现矛盾,交易量 减少--这是需要进行新的训练的迹象。

谢谢。这可能是一个可行的想法。
 
组合器

是的,但不是在神经元配置上。

安德烈似乎在暗示一些输入是如此强大,以至于任何模型都会默认它们,以获得良好的、未经调整的结果。

也可能他指的是其他东西。但如果能有更详细的答案,我将不胜感激。

 

新版jPrediction 9.00发布

引自用户手册。

"jPrediction "与其他机器学习软件之间的差异

jPrediction的主要区别是没有任何用户定义的设置,这使你可以摆脱人为错误的因素,无论是在设置和选择算法的过程中还是在选择神经网络架构的过程中。 jPrediction中机器学习的整个过程是完全自动化的,不需要用户的任何特殊知识或干预。

jPrediction在自动模式下执行的功能

  1. 读取和解析一个有多个例子的文件,建立一个数学分类模型。
  2. 在机器学习之前将数据归一化。
  3. 将样本中的所有例子集分为两个子集:训练子集和测试子集。
  4. 对训练子集的例子进行平衡。
  5. 神经网络架构的形成。
  6. 在具有不同预测因子(因素)组合的案例训练子集上训练一组模型。
  7. 减少神经网络结构--去除多余的元素。
  8. 在例子的测试子集上测试一组模型,并计算出概括能力。
  9. 根据最大可推广性的标准选择最佳模型。

因为从模型集合中,每个模型都不同于其他任何预测因子的组合,只选择具有最大概括能力的模型,因此,减少(选择)最重要的预测因子是自动进行 的。"

应该说,从第8版开始,jPrediction对训练样本中预测因子的最大数量没有限制。在第8版之前,训练样本中的预测因子数量被限制在10个。

在第8版之前,jPrediction是单一模型。也就是说,取一个样本,只对一个单一的模型进行训练和测试。

从第8版开始,jPrediction变成了多模型,也就是说,它在样本的不同部分训练和测试许多不同的模型,而且每个部分都包含不同的预测因子组合。这些模型中的一个会在样本的测试部分给出最大的普遍性。

问题是,如果采取不同的预测器组合,那么对组合的全面搜索会导致所谓的组合(来自组合学一词)"爆炸",即每增加一个预测器,需要训练和测试的模型数量是没有预测器的两倍。很明显,当样本中的预测器数量以数十甚至数百为单位时,等待在合理时间内完成所有组合模型的训练和测试就成了问题。

jPrediction中的组合 "爆炸 "问题不是通过尝试所有可能的组合来解决的,而是通过顺序搜索法。该方法的实质如下。

假设我们通过尝试所有可能的N个和更少的预测因子的组合,找到了一些包含N个预测因子的组合,具有最大的普遍性。我们需要在其中添加N+1个预测器。为此,我们将样本中未包括在组合中的所有预测因子逐一加入,并测量其概括能力。如果在这样的搜索过程中,我们找到了N+1个预测器的组合,其概括能力高于N个预测器的最佳组合,我们可以用同样的方法找到N+2个预测器的组合。如果他们没有找到,那么很明显,再找下去就没有意义了,尝试组合的算法在N个预测器的最佳组合上停止了。因此,与充分尝试所有可能的组合相比,为模型搜索预测器组合的算法停止得更早。由于搜索从少量的预测器开始,并朝着增加预测器数量的方向发展,因此还可以节省计算资源。而训练所需的预测器越少,建立模型所需的时间和计算能力就越少。

这就是那种馅饼。

如果你有兴趣,所附的ZIP档案包含PDF格式的jPrediction 9俄语用户手册。

附加的文件:
 
酷!你是唯一一个把这一切都拖进去的人吗?"减少 "一词并不明确。如果你看一下技术,它是对某种东西的多重还原。而对你来说,这是一个选择。
 
尤里-雷舍托夫

新的jPrediction 9.00版本已经发布


一切都很好,除了一件小事:没有与其他模型的比较。

我提供我的服务以进行比较

1.你准备一个包含预测因子和目标变量的输入Excel文件

2.你来计算一下

3.你把输入文件发给我。

4.我使用Randomforest, ada, SVM进行计算。

我们进行比较。

原因: