交易中的机器学习：理论、模型、实践和算法交易

Aleksey Vyazmikin 2022.01.30 15:05 #25621

Maxim Dmitrievsky#:

那么你需要更加具体。

我正在考虑写一篇文章，更详细地解释我在做什么。

我想在这里讨论类似的方法，但结果是没有人感兴趣。

简而言之，以下是我分阶段做的事情。

1.通过CatBoost，我保存了不同类型的量子表，有不同数量的 "量子"（强制预分裂）。

2.我通过脚本分析每个量子的稳定性和指标的预测能力。

2.1 通过整个样本的完整性和准确性的门槛。

2.2 评估样本区的预测目标指标与目标指标的偏差的稳定性--我取7个点，用均方根法筛选出来。

3.我从所有表格中为每个预测器选择最好的量子，考虑到它们在发生量化的范围空间中不重叠。

4.我创建了一个新的样本（所有量子和无量子的两种类型相结合），来自量子的预测器的信号为0或1。

5.我排除了那些在样本中具有类似信号的预测因子。

6.教学模式。

如果在第5点之后，我们还对测试和考试样本进行鲁棒性检查，只选择那些显示出满意结果的预测器，那么训练结果就会大大改善。这是一种作弊，但是否值得使用是一个实验的问题。我的假设是，指标稳定的时间越长，它们就越有可能继续保持稳定。

如果你对某一阶段有疑问，请问，我会尽量提供更多信息。

P.S. 你也可以直接保存采样的量表，排除低效的预测因子，并在常规的样本上进行训练--这也会提高学习效果。

[删除] 2022.01.30 15:28 #25622

Aleksey Vyazmikin#:

我正在考虑写一篇文章，更详细地解释我在做什么。

我想在这里讨论类似的方法，但结果是没有人感兴趣。

简而言之，以下是我分阶段做的事情。

1.通过CatBoost，我保存了不同类型的量子表，有不同数量的 "量子"（强制预分裂）。

2.我通过脚本分析每个量子的稳定性和指标的预测能力。

2.1 通过整个样本的完整性和准确性的门槛。

2.2 评估样本区的预测目标指标与目标指标的偏差的稳定性--我取7个点，用均方根法筛选出来。

3.我从所有表格中为每个预测器选择最好的量子，考虑到它们在发生量化的范围空间中不重叠。

4.我创建了一个新的样本（所有量子和无量子的两种类型相结合），来自量子的预测器的信号为0或1。

5.我排除了那些在样本中具有类似信号的预测因子。

6.教学模式。

如果在第5点之后，我们还对测试和考试样本进行鲁棒性检查，只选择那些表现出令人满意的预测器，那么训练结果就会有很大改善。这是一种作弊，但是否值得使用是一个实验的问题。我的假设是，指标稳定的时间越长，它们就越有可能继续保持稳定。

如果对某一步骤有疑问--请问，我将尽力提供更多信息。

P.S. 你也可以直接保存采样的量表，排除低效的预测因子，并在常规的样本上进行训练--这也会提高学习效果。

什么是量子表？树状分区表？我从来没有做过这样的事情

最好是一篇有实例的文章

Aleksey Vyazmikin 2022.01.30 17:05 #25623

Maxim Dmitrievsky#:

什么是量子表？树状分区表？我从来没有做过。

有例子的更好的文章

量子表是将一个预测器划分为界线/范围，然后参与学习。是的，我以前多次写过这个问题。

[删除] 2022.01.30 17:18 #25624

Aleksey Vyazmikin#:

量子表是将预测器划分为边界/范围，然后参与学习。是的，我以前多次写过这个问题。

哦，我明白了。看来，芯片量化只是为了加快学习速度。或者说，这是一个很难的问题？我只是一个古典方法的支持者，再加上我自己的一点变态行为。

Aleksey Nikolayev 2022.01.30 17:27 #25625

Vladimir Baskakov#:
你们还没有表现出任何有用的东西，只是在胡说八道。书呆子

继续关注。

Aleksey Nikolayev 2022.01.30 17:29 #25626

Aleksey Vyazmikin#:

量子表是将预测器划分为边界/范围，然后参与学习。是的，我以前曾多次写过这个问题。

整个问题的关键是我们量化什么，如何量化，有什么目的。

Aleksey Nikolayev 2022.01.30 17:38 #25627

Aleksey Nikolayev#:

这都是关于我们量化的内容，我们如何量化它，以及为了什么目的。

我曾经尝试过通过Equity Monotonicity图进行量化，当时使用的是预测器而不是时间。我没有看到特别好的东西。

mytarmailS 2022.01.30 17:55 #25628

有没有人尝试将蒙蒂科尔悖论与交易/决策联系起来？

Aleksey Vyazmikin 2022.01.30 18:42 #25629

Maxim Dmitrievsky#:
啊，知道了。似乎量化功能只是用来加快学习速度。或者说，这是一个很难的问题？我只是一个古典方法的支持者，再加上我自己的一点变态行为。

学习加速是优势之一，但也有类似预测器状态的聚集效应。粗略地说，我把分区部分当作一个单独的二进制预测器，从基本预测器中去除噪音。

除了改善学习的效果外，我还可以减少模型中给出类似结果的树的数量，从而减少模型中的噪音。

我正在尝试使用刚性框架表，这是指分区不是基于数据，而是基于给定的标准，例如斐波那契水平。

Aleksey Vyazmikin 2022.01.30 18:46 #25630

Aleksey Nikolayev#:

这都是关于量子，如何和为了什么目的。

这就是我所写的--目的是确定一种一致的模式，在某一领域具有统计优势。而我们对预测者--任何预测者--进行量化。

而 "如何 "做到这一点是一个开放的问题--到目前为止，只能搜索根据经验假设或统计分区算法CatBoost制作的预制表。

在图3中，"量子"--很可能选择了中间范围，这有一些统计上的优势。

交易中的机器学习：理论、模型、实践和算法交易 - 页 2563