交易中的机器学习:理论、模型、实践和算法交易 - 页 2563

 
Maxim Dmitrievsky#:

那么你需要更加具体。

我正在考虑写一篇文章,更详细地解释我在做什么。

我想在这里讨论类似的方法,但结果是没有人感兴趣。

简而言之,以下是我分阶段做的事情。

1.通过CatBoost,我保存了不同类型的量子表,有不同数量的 "量子"(强制预分裂)。

2.我通过脚本分析每个量子的稳定性和指标的预测能力。

2.1 通过整个样本的完整性和准确性的门槛。

2.2 评估样本区的预测目标指标与目标指标的偏差的稳定性--我取7个点,用均方根法筛选出来。

3.我从所有表格中为每个预测器选择最好的量子,考虑到它们在发生量化的范围空间中不重叠。

4.我创建了一个新的样本(所有量子和无量子的两种类型相结合),来自量子的预测器的信号为0或1。

5.我排除了那些在样本中具有类似信号的预测因子。

6.教学模式。

如果在第5点之后,我们还对测试和考试样本进行鲁棒性检查,只选择那些显示出满意结果的预测器,那么训练结果就会大大改善。这是一种作弊,但是否值得使用是一个实验的问题。我的假设是,指标稳定的时间越长,它们就越有可能继续保持稳定。

如果你对某一阶段有疑问,请问,我会尽量提供更多信息。

P.S. 你也可以直接保存采样的量表,排除低效的预测因子,并在常规的样本上进行训练--这也会提高学习效果。
[删除]  
Aleksey Vyazmikin#:

我正在考虑写一篇文章,更详细地解释我在做什么。

我想在这里讨论类似的方法,但结果是没有人感兴趣。

简而言之,以下是我分阶段做的事情。

1.通过CatBoost,我保存了不同类型的量子表,有不同数量的 "量子"(强制预分裂)。

2.我通过脚本分析每个量子的稳定性和指标的预测能力。

2.1 通过整个样本的完整性和准确性的门槛。

2.2 评估样本区的预测目标指标与目标指标的偏差的稳定性--我取7个点,用均方根法筛选出来。

3.我从所有表格中为每个预测器选择最好的量子,考虑到它们在发生量化的范围空间中不重叠。

4.我创建了一个新的样本(所有量子和无量子的两种类型相结合),来自量子的预测器的信号为0或1。

5.我排除了那些在样本中具有类似信号的预测因子。

6.教学模式。

如果在第5点之后,我们还对测试和考试样本进行鲁棒性检查,只选择那些表现出令人满意的预测器,那么训练结果就会有很大改善。这是一种作弊,但是否值得使用是一个实验的问题。我的假设是,指标稳定的时间越长,它们就越有可能继续保持稳定。

如果对某一步骤有疑问--请问,我将尽力提供更多信息。

P.S. 你也可以直接保存采样的量表,排除低效的预测因子,并在常规的样本上进行训练--这也会提高学习效果。

什么是量子表? 树状分区表? 我从来没有做过这样的事情

最好是一篇有实例的文章
 
Maxim Dmitrievsky#:

什么是量子表? 树状分区表? 我从来没有做过。

有例子的更好的文章

量子表是将一个预测器划分为界线/范围,然后参与学习。是的,我以前多次写过这个问题。

[删除]  
Aleksey Vyazmikin#:

量子表是将预测器划分为边界/范围,然后参与学习。是的,我以前多次写过这个问题。

哦,我明白了。看来,芯片量化只是为了加快学习速度。或者说,这是一个很难的问题?我只是一个古典方法的支持者,再加上我自己的一点变态行为。
 
Vladimir Baskakov#:
你们还没有表现出任何有用的东西,只是在胡说八道。书呆子

继续关注。

 
Aleksey Vyazmikin#:

量子表是将预测器划分为边界/范围,然后参与学习。是的,我以前曾多次写过这个问题。

整个问题的关键是我们量化什么,如何量化,有什么目的。

 
Aleksey Nikolayev#:

这都是关于我们量化的内容,我们如何量化它,以及为了什么目的。

我曾经尝试过通过Equity Monotonicity图进行量化,当时使用的是预测器而不是时间。我没有看到特别好的东西。

 
有没有人尝试将蒙蒂科尔悖论 与交易/决策联系起来?
 
Maxim Dmitrievsky#:
啊,知道了。似乎量化功能只是用来加快学习速度。或者说,这是一个很难的问题?我只是一个古典方法的支持者,再加上我自己的一点变态行为。

学习加速是优势之一,但也有类似预测器状态的聚集效应。粗略地说,我把分区部分当作一个单独的二进制预测器,从基本预测器中去除噪音。

除了改善学习的效果外,我还可以减少模型中给出类似结果的树的数量,从而减少模型中的噪音。

我正在尝试使用刚性框架表,这是指分区不是基于数据,而是基于给定的标准,例如斐波那契水平。

 
Aleksey Nikolayev#:

这都是关于量子,如何和为了什么目的。

这就是我所写的--目的是确定一种一致的模式,在某一领域具有统计优势。而我们对预测者--任何预测者--进行量化。

而 "如何 "做到这一点是一个开放的问题--到目前为止,只能搜索根据经验假设或统计分区算法CatBoost制作的预制表。

在图3中,"量子"--很可能选择了中间范围,这有一些统计上的优势。