交易中的机器学习:理论、模型、实践和算法交易 - 页 1488

 
阿列克谢-维亚兹米 金。

我们不得不假设,我们能做的就是开发一种最适合数据的算法,因为我们不知道未来,即使基于现有的预测值,也有很多变化。如果我们幸运的话,我们可能会发现一个将持续存在一段时间的模式,这就是为什么要用一定的标准来寻找这样的模式,逻辑上说,至少它应该是一个在整个样本中出现的模式。

市场上只有一种模式,它将永远是--时间周期,时期:交易时段,日,周,......,以及它们的半周期。这些循环原则上是不可破坏的,形成了一个复杂的时间结构,并决定了一个样品的工作量。通过识别这个层次结构内的价格行为,交易系统将始终发挥作用。

 
市场本身就不是分形的。它只在时间段内具有自相似性的属性,在时间段内形成某些结构。每个气球的tick或任何其他样本的体积不能被选择--它必须是一些满足嵌套时间周期的定义值。
 
Aleksey Vyazmikin:

标准算法是为处理静止现象、封闭系统而设计的,因此在那里,任何信息都被认为是先验有用的,它不以随机性来评估,而只是将其用于手头的任务(按目标分类)的可能性,而我们有很多噪音,我提出了一个处理它的逻辑方法。

即培训领域成功行业的统一性
它在那里很好,因为适合于学习,精确到0%的误差。

我想应该是在通过深度减法或其他方法对模型进行规范化/粗化时。例如,在训练区的20%误差时停止。

我认为只有一个办法--在每个节点版本添加后,通过树的结果部分运行所有数据,并分析平衡线。

版本数=(特征数*树上的节点数*3(如果按四分位数划分))。* 树木的数量

这将需要很长的时间来计算,恐怕比NS还要长。

 
Alexander_K:

市场上有一种模式,它将永远是--时间周期、时期:交易时段、日、周、......以及它们的半周期。这些循环原则上是不可破坏的,形成了一个复杂的时间结构,并决定了可以工作的样本量。通过确定价格在这个层次结构中的行为,交易系统将始终发挥作用。

我不否认时间的重要性,但这不足以建立一个模型--你需要其他影响价格的变量。

 
Aleksey Vyazmikin:

我不否认时间的重要性,但这还不足以建立一个模型--你需要其他影响价格的变量。

这就够了。

圣杯 正是在时间周期内坐镇。一个时间周期的结构是另一个时间周期的结构的一部分。

如果你与 一样 的样本量,对应于 不同的 严格定义的时间框架,这些嵌套结构就像在你的手掌上。

国家安全局不能处理它吗?我在没有神经网络的情况下,在我的TS中做到了这一点。

 
elibrarius

即培训领域成功行业的统一性?

就我个人而言,我评估每一年(目前是5年)的财务结果,考虑到缩减和恢复因素,以及其他评价标准。目前,我甚至不看分类,因为有一个趋势策略,即使有35%的正确分类,也可能是年终(其他时期)的利润。

elibrarius


它在那里很好,因为适合于学习,精确到0%的误差。

问题是有多少棵树被用于此,以及基本上模型有多少内存。一棵树,有6个裂缝的深度,不能做这样的配合......


elibrarius

我猜它必须是通过规范化/用深度还原或其他方法加载模型。例如,在训练部分的20%误差时停止。

我已经使用了分裂和完整性限制,是的,它应该在训练中使用。


elibrarius

我认为只有一个办法--在每个节点版本添加后,通过树的结果部分运行所有数据,并分析平衡线。

一个节点的版本数=(特征数*树上的节点数*3(如果按四分法划分))。* 树木的数量

这将需要很长的时间来计算,恐怕比NS还要长。

这将是更有效的,这是更重要的,最终将有更多的市场模型。

目前,我花了大约15天的时间进行计算--我得到了大约800片独特的叶子,平均有8片,其中一半是类似的,在时间间隔上显示出稳定的结果(而且检查仍然需要不小的机器时间)。即把800/8的计算速度放慢100倍,甚至会产生一个类似的结果。

 
Alexander_K:

够了,够了。

圣杯正是在时间周期内坐镇。一个时间周期的结构是另一个时间周期的结构的一部分。

如果你与 一样 的样本量,对应于 不同的 严格定义的时间段,那么这些嵌套结构就正好在你的手掌中。

国家安全局不能处理它吗?我在我的TS中没有使用神经网络就做到了。

我没有从中得到圣杯,虽然我的工作只是与分形的结构和相似性,即在不同的TF中嵌套时间。这还不够,也许我还没有意识到一切。

NS是一种工具,人脑可能会或可能不会更快更准确地找到解决方案...

 
阿列克谢-维亚兹米 金。

就我个人而言,我评估每一年(目前是5年)的财务结果,考虑到缩减和恢复因素,以及其他评价标准。目前,我甚至不看分类,因为有一个趋势策略,即使有35%的正确分类,也可能是年终(其他时期)的利润。

问题是有多少棵树被用于此,以及基本上模型有多少内存。一棵树,有6个裂缝的深度,不能做这样的配合......


分割和完整性约束是我已经在使用的,是的,它应该在训练中使用。


它将更有效率,这是最重要的事情,而最终的结果将是更有市场的模型。

目前,我花了大约15天的时间来计算--我得到了大约800片独特的叶子,其中平均有8片,其中一半是类似的,这在时间间隔上显示出稳定的结果(而且检查仍然需要不小的机器时间)。也就是说,将800/8的计算速度放慢100倍,甚至可以得到一个相当的结果。

听起来你在做阀的前向测试。
我也是,但要用手。我认为这是评估模型的最佳方式。

还没有找到一个时间稳定的模型。向前/向后移动半年/一年,模型已经开始表现不佳或流失。即使是新训练的相同特征和相同的模型参数。也就是说,特征的重要性也在变化。

 
elibrarius

听起来你在做valking forward测试。
我也是,但要手动。我想这是评估模型的最好方法。

还没有找到一个时间稳定的模型。向前/向后移动半年/一年,模型已经开始表现不佳或流失。即使是新训练的相同特征和相同的模型参数。也就是说,功能的重要性也在变化。

这就是为什么有必要在训练中考虑到所有这些,并在考虑到平衡的情况下进行拆分,然后对分类准确性的概率进行估计。有问题的部分应该直接进入交易禁令或99%的概率,然后在应用模型时就可以过滤掉了。

 
阿列克谢-维亚兹米 金。

这就是为什么有必要在训练中考虑到所有这些,并在考虑到(如果不是平衡的话)分类准确性概率的情况下进行拆分。有疑问的部分应禁止交易,或标记为99%的概率,然后在应用模型时可将其过滤掉。

根据分类的概率进行拆分。更准确地说,不是按概率,而是按分类误差。因为在训练演习中一切都知道,我们有确切的评价,而不是概率。
虽然有不同的分离方式,即对杂质的测量(左侧或右侧采样)。