交易中的机器学习：理论、模型、实践和算法交易

Aleksey Vyazmikin 2020.08.04 12:44 #19561

elibrarius:

这就对了。立即描述行动的顺序是个好主意...
再次思考你的描述，我认为有以下顺序。

1.计算所有预测器在训练中的相关性
2.建立树
3.在最后一次劈叉时，要记住例如最后100次的最佳劈叉。储存到100个，以便有足够的选择。
4.从这100个中选择5个与最佳分割的预测器不相关且相互不相关的。

此外，也不清楚在这5种不同的分割中选择哪一种？
如果是随机的，那么它就类似于随机森林，它给每棵树随机的预测因子，并在此基础上建立一棵树。
如果是平均数，那么又是随机森林的类似物，那么森林从随机树中找到算术平均值。

现在你说对了!

这就是为什么随机森林是随机的，它们充满了垃圾，上面描述的条件不一定是真的，尽管可能有类似的情况，而且有可能一个成功的模型会产生于类似的那种分解。然而，在这里，将有一个更受控制的过程。

当然，片中每个分割的权重都会被权衡，也许我们会给出相同的系数，我们可以在相同的历史上拾取系数。这就是我现在一般在用树叶组装模型时的做法。

Aleksey Vyazmikin 2020.08.04 12:46 #19562

Valeriy Yastremskiy:

呐，类似的动作有和、减、乘、除，可能还有更复杂的对数依赖，以及幂。而且这些不是计算，而是每个单元的模拟量表。而DAC和ADC是一种输入输出，它们不参与计算，而是提供数字。

在诺伊曼架构中，程序和数据都存储在内存中，没有对程序和数据的并行访问；先访问数据，再访问程序，然后再回到数据，因此数据处理受到限制。而这里的程序是通过小设备存储在每个单元中的，并且有一个对程序的访问，同时也有对数据的访问。

这里有一个我不明白的数据，是不是有条件地讲，每条指令都可以直接访问内存和计算结果，而不需要传送器？

Aleksei Kuznetsov 2020.08.04 12:48 #19563

Aleksey Vyazmikin:

现在你说对了!

随机森林是随机的，因为它充满了垃圾，所描述的条件不一定满足，尽管可能有类似的情况，而且有可能通过类似的分解得到一个成功的模型。然而，在这里，将有一个更受控制的过程。

当然，片中每个分割的权重都会被权衡，也许我们会给出相同的系数，我们可以在相同的历史上拾取系数。我现在就是这样做的，一般来说，在用树叶组装模型的时候。

我不明白最后一步，即在5个分体中选择哪个？

Aleksey Vyazmikin 2020.08.04 12:56 #19564

elibrarius:
我不明白最后一步--在5个拆分中选择哪个？

所有5个分片的读数都要考虑在内，这增加了稳定性。

假设最好的分裂被赋予0.6的权重，其他四个被赋予各0.1的权重，如果总和给出0.8或其他分数，由抽样决定，那么答案就是真正的 "1 "或表单中预期的其他类。

我们还需要检查召回率，也就是说，在这个子样本上，拆分有多少召回率。

Maxim Dmitrievsky 2020.08.04 12:59 #19565

Aleksey Vyazmikin:

我不明白的是，这些数据是名义上的，每条指令都可以直接访问内存和计算结果，没有传送带？

没有 "数据"，只有电子，其电流由晶体管等控制。NS架构本身是印在板子上的，不是数字形式的。他们长期以来一直在以协处理器的形式制造这种模拟神经网络，例如在iPhone中。

这篇文章中没有任何新内容。

Aleksey Vyazmikin 2020.08.04 13:02 #19566

Maxim Dmitrievsky:

没有 "数据"，只有电子，其电流由晶体管控制，如此而已。NS架构本身是印在板子上的，不是数字形式的。他们长期以来一直在以协处理器的形式制造这种模拟神经网络，例如在iPhone中。

这篇文章中没有任何新内容。

而且我明白，我们谈论的是动态计算，而不是静态的、预先确定的。

Maxim Dmitrievsky 2020.08.04 13:06 #19567

Aleksey Vyazmikin:

而我的理解是指动态计算，而不是静态的、预先确定的计算。

例如，来自iPhone相机矩阵的信号被直接送入模拟NS，绕过了数字化处理。NS对图像进行预处理以提高质量（过滤掉噪音等）。

然后将其转换为数字图片

Valeriy Yastremskiy 2020.08.04 13:18 #19568

Aleksey Vyazmikin:

我的理解是，我们谈论的是动态计算，而不是静态的、预先确定的计算。

一个粗略的比喻是电子闸阀和压缩机。当然，细胞中的设备是静态的，但它们有很多，而且可以并行访问它们）而且计算可以是动态的，如果我们改变输入信号，我们会得到动态的输出。

Aleksei Kuznetsov 2020.08.04 13:33 #19569

Aleksey Vyazmikin:

应考虑到所有5个分体的读数，这增加了稳定性。

假设我们把0.6的权重给了最好的分割，把0.1的权重给了其他四个，如果总和给出了0.8或其他一些数值，由抽样决定，那么我们就假设答案是真正的 "1 "或工作表中预期的其他类别。

你还需要检查召回率，即分片对该子样本的召回率是多少。

最干净的分裂将与不太干净的分裂混在一起。也就是说，我们恶化了托盘上的结果，这在原则上并不重要。但不确定它是否会改善测试的结果，即普适性。有人应该试试...就个人而言，我不认为泛化会比脚手架的情况好。

限制树的深度，不做最后的分割，在前一个分割处停止，这就容易多了。我们最终会得到同样不那么清晰的床单，比起我们做一个额外的分割。无论我们是否进行拆分，你的选择都会在两者之间提供一些东西。例如，你将用你的方法在第7层的深度上对板材进行平均。它将比第6个深度水平表略为干净。我认为这个概括不会有太大的变化，而且要检验这个想法是很费事的。你也可以对几棵深度为6和7的树进行平均--你会得到与你的方法差不多的结果。

Andrey Dik 2020.08.04 13:52 #19570

Aleksey Vyazmikin:

本质上是对波浪的某种作用？传入的数据被转换为多项式，然后多项式被转换为波，这些波以某种方式被 "碰撞/合并 "了？

嗯，是的。

以前曾有过制造模拟计算机的尝试，但它们要么非常缓慢，要么非常耗能。

交易中的机器学习：理论、模型、实践和算法交易 - 页 1957