交易中的机器学习:理论、模型、实践和算法交易 - 页 3069

 
Aleksey Vyazmikin #:
马克西姆,你能用你的系统在我的样本上做一个机器人吗?对我来说,这比一个黑盒子更有意思。
你的系统肯定有数以百万计的功能。我的方法是全自动的。你只需告诉我,在你看来哪些特征是好的,是几项特征,还是参数不同的同一项特征,我都可以在上面运行。它会自己选择目标。因为在任何情况下,你的数据集都只会保留标志,其他的都会改变。
 
Maxim Dmitrievsky #:
你那里一定有无数个标志。我的方法是全自动设置的。你只需告诉我,在你看来哪些标志是好的,是几块,还是参数不同的同一块,我都可以在上面运行。它会自己选择目标。因为在任何情况下,你的数据集都只会保留标志,其余的他都会改变。

不是一百万,是六千个特征。你平均有多少个?一般来说,CB 可以很容易地移动它们。事实上,目标是可以改变的--随它去吧。我的样本不多,只有 4k 行训练数据和用于验证的测试数据(据我所知,每个模型都有固定数量的树)。

 
Aleksey Vyazmikin #:

不,不是一百万,是六千个标志。你平均有多少个?一般来说,CB可以很容易地移动它们。事实上,目标是可以改变的--随他们去吧。样本本身并不大--4k 行用于训练 + 测试转储用于验证(据我所知,每个模型都有固定数量的树)。

10-20 个特征就足够了。您可以从中任意选择一个,这样公式就可以简单地加载到一个现成的库中。因此,您无需更改任何内容。读取价格文件后,我会生成必要的特征,而不会读取现成的特征。我也不需要大量的稀疏特征。特征越多,就越难找到稳定的关系。

我们应该意识到,这是个很特殊的东西,有它自己的技巧。它不是普通的学习。

把 3k 个模型放在训练中,然后上床睡觉。明天我会边喝咖啡边看最好的模型 😋。
 
Maxim Dmitrievsky #:
10-20 个功能就足够了。任选其一,这样公式就可以简单地加载到现成的库中。这样就不会改变任何东西。读取价格文件后,我会生成必要的属性,而不是读取现成的属性。我也不需要大量的稀疏属性。特征越多,就越难找到稳定的关系。

把 3k 个模型放在训练中,上床睡觉。明天我会边喝咖啡边看最好的模型 😋。

从数组中读取并处理计算出的数据不是比写一些公式更容易吗?

我认为你根本无法修改代码。我不坚持做实验。

 

仍在学习

R2: 0.9806482223765112

学习2204 型 3000


 
Aleksey Vyazmikin #:

从数组中读取并处理计算出的数据不是比编写一些公式更容易吗?

我认为完全不修改代码是不可能的。我不坚持做实验。

您需要将公式传输到终端。我会给你一个准备好的机器人。我只需要你提供功能。指标名称,如果你不能把它们放到公式中。
 
Женя #:

你没有理解我想告诉你的主要内容,试着在 SB(随机漫步)上运行你的 piplan,也许(肯定)你会得到接近的结果,它能告诉你什么呢?

8%--误差是荒谬的,在适当准备的筹码和目标上,这原则上是不可能发生的,你是在预测过去与未来的混合,而你的预测实际上是在搜索过去。

SR - 夏普比率,以观察次数的根进行归一化,是衡量策略绩效的标准。SR 是阿库拉西的函数,更是预测收益与实际收益的相关性的函数,阿库拉西 60%+ 会带来两位数的 SR,这是平滑的指数(再投资时)权益。

因此,SB 的不同变现可以有趋势、周期和任何你想要的东西。这种比较会产生什么结果?
 
Maxim Dmitrievsky #:
公式需要传输到终端。我会给你发一个现成的机器人。您只需要我提供功能。如果你不能在公式中提供指标名称。

您可以单独给我二进制模型。我知道最终会有两个二进制模型。这种方法将允许您使用任何数据。

 
Aleksey Vyazmikin #:

你能不能把二进制模型分开给我。我想最终会有两个模型吧?这种方法可以让您处理任何数据。

我不会讨价还价。你让我训练--把征兆给我,我来训练和测试。如果结果不错,我就把源代码给你。

如果有正常的迹象,数量也不会很多。我不需要有 6k 个标志的数据集,我没时间做这个。

否则我会做其他事情。

 

我看到在过去的几页里,大家的情绪有些激动。我请大家就事论事,不要试图打击对手。

我理解每个人都认为自己是对的,但也要尽量尊重他人的意见。

我建议大家不要争论,也不要按套路划分(Python/R)。 反正谁也无法向谁证明什么。

原因: