交易中的机器学习：理论、模型、实践和算法交易

Алёша 2017.06.26 15:50 #4251

伊万-内格雷什尼。

你是对的，预测指标是多余的。但预测价格也是多余的，因为交易策略的目标不是价格而是利润。

按照这个逻辑，我们应该建立的模型不是指标，也不是价格图表，而是交易者的行为，最好的目标功能是他或她的盈利交易的指标。

在实践中，你应该采取交易历史或在策略测试器中运行专家顾问，并以价格模式作为输入，以交易作为输出来教导模型。

因此，"利润 "是回报（盈利能力，回报），即价格的增加被其绝对值归一化，这就是臭名昭著的 "动量 "指标，知道未来的动量，你就是宇宙的统治者。

Алёша 2017.06.26 15:55 #4252

马克西姆-德米特里耶夫斯基。

而现在这里讨论的是某种幼儿园的人字形应用与否，如果预测方法本身从一开始就是错误的（即不会导致成功），这到底有什么区别呢 :)

这是对的，问题在于细节，不要太仓促。而这种 "幼稚 "不仅涉及到 "之 "字形，它是一个真正的陷阱...

СанСаныч Фоменко 2017.06.26 16:09 #4253

阿利奥沙。

我不敢这样做，在你和其他人的态度中都不敢。在你的妄想中，你并不孤单。

你写的东西有很多道理，文章很好，我说的很真诚，很简短，很简明。但是有一点缺陷，我已经指出来了，因为我自己也以同样的方式被骗了很久了。

让我再一次尝试解释我的立场。

你提到的文章是机器学习的宣传材料：它表明机器学习的概念不仅包括模型，还包括模型的数据准备和模型评估。它还表明，任何对机器学习感兴趣的人都可以用最小的努力尝试这一切。

我的想法根本不在文章中。这是一个广告。

我对这个主题和其他论坛主题的想法是，机器学习中主要的、基本的 东西不是模型，而是"预测者与目标变量相关"的理由。

它是 "相关的"，而不是目标本身或一组特定的预测因素。也就是说，我把我自己的意思放在 "有关系 "的意义上，与 "预测因素的重要性 "所定义的意义不同。

我从来没有在任何地方宣传或证明ZZ的使用：我只是在我的例子中把它作为最突出的预测因素。我还表示，对于我自己的预测器组，我得到的预测误差不到30%--应该说，这不是一个坏结果。

但是，再次强调：之所以能得到这个结果，是因为我能够过滤掉预测因素，撇开那些与目标变量 "相关 "的因素。在我的例子中，对ZZ。但对我的方法来说，目标并不重要，重要的是整个 "目标-预测器 "集。

Алёша 2017.06.26 16:42 #4254

桑桑尼茨-弗门科。

除此之外，我还指出，就我个人而言，对于我所拥有的一组预测器，我得到的预测误差不到30%--应该说是一个非常好的结果。

但是，我再次强调：之所以能得到这个结果，是因为我能够过滤掉预测因子，撇开那些与目标变量 "相关 "的因素。在我的例子中，对ZZ。但对我的方法来说，目标并不重要，整个 "目标预测器 "才重要。

这不是一个糟糕的结果，而是非常棒的，我敢肯定，即使是文艺复兴也没有这么接近，他们每天的数据是以兆字节为单位的。看看数值上的实时得分。ai ，想想为什么他们至少有45%的误差（logloss~0.69），而你只有30%。

但是你说的是真的，你已经创建了你的合成目标函数，它在功能上以一种巧妙的方式（显然对你来说并不明显）与特征相结合，你在洛恩和测试上有如此漂亮的扫描，一切看起来都是正确的......但是为什么你还没有成为亿万富翁，尽管如果你在预测下一个蜡烛颜色时有30%的错误，你可以在大约一年内轻松成为一个富翁，因为你预测的不是未来而是通过指标将过去与未来混在一起。尝试预测一个纯粹的未来回归者，一切都会水到渠成。

СанСаныч Фоменко 2017.06.26 17:55 #4255

Aliosha:

这不是一个糟糕的结果，这是一个梦幻般的结果，我相信即使是文艺复兴也没有接近它，他们每天的数据量达数兆字节。看一下numer.ai 上的实时分数，想想为什么他们至少有45%的误差（logloss~0.69）而你只有30%。

但是你说的是真的，你已经创建了你的合成目标函数，它在功能上以一种巧妙的方式（显然对你来说并不明显）与特征结合在一起，你在洛恩和测试上有如此好的衡量标准，一切看起来都是正确的......但是你还不是一个亿万富翁，尽管如果你在预测下一个蜡烛颜色时有30%的错误，你可以在大约一年内轻松成为一个富翁，这是因为你没有预测未来，而是通过指标将过去与未来混合在一起。尝试预测一个纯粹的未来回报，一切都会水到渠成。

ZZ是一个不好的目标变量，因为它的肩部起点和终点有相同的重量。如果你把目标变量放在反转之前和ZZ反转之后，我一直无法找到这样一个目标变量的预测器--我所知道的所有关于这样一个目标变量的预测器都只是噪音。我与论坛上的一个人合作，他有自己的一套预测器，我们都有相同的结果。

不是亿万富翁，原因很简单：我的模型的机器学习模型估计，目标在ZZ（那30%），与测试器中的结果无关，因为这个误差是沿着ZZ肩任意分布的，也就是说，假信号与真信号混在一起。我交易趋势，似乎，但预测下一个蜡烛。为了克服这一矛盾，我有一个专家顾问，成功交易了一年多，然后在10月7日，它在一个固定最大风险水平的止损点上弹出。

但这是趋势交易。

你一直建议交易DIVERSES，而不是趋势。这是一个不同的交易，有更好的设计模型--GARCH。开发得非常好，有大量现成的工具，有大量的金融市场交易实例，包括外汇。这就是我现在正在做的事情。加入进来。

PS。

关于在ZZ上展望未来。

你必须认真写。当你训练时，在历史上你总是有一个到最后的、最右边的栏的数值。但在EA中却不是这样：在ZZ的右侧总是有一个未成形的肩部，此外，前一个肩部也可能是透支的。因此，我们必须在历史上学习。然后转移到一个新的文件，在那里沿着图表重新训练，只考虑已经形成的ZZ值。而这是100条以上的滞后。而且没有 "偷看"，而是与滞后相反。

Mihail Marchukajtes 2017.06.26 17:59 #4256

我总结一下，让很多人清楚地了解....

确实有复杂的目标函数，或者说研究者决定问题出在输出变量上，并开始将其复杂化。这曾经发生过，我也曾经这样做。但随着时间的推移，我明白没有必要这样做，预测价格变化就足够了，如果不能在适当的质量水平下完成，那么再复杂的产出也无法挽救局面。

至于平衡曲线，它是训练质量的结果。正是这种曲线的类型决定了学习的质量。两个条件。

平衡曲线呈45度角的均匀增长

没有强烈的跳跃和跌落。

像这样....

Алёша 2017.06.26 18:16 #4257

桑桑尼茨-弗门科。

ZZ是一个不好的目标变量，因为它的肩部起点和终点具有相同的重量。如果我们把目标变量放在反转之前和ZZ反转之后，我无法找到这种目标变量的预测因素--我所知道的这种目标变量的所有预测因素都只是噪音。我与论坛上的一个人合作，他有自己的一套预测器，我们都有相同的结果。

不是亿万富翁，原因很简单：我的模型的机器学习模型估计，目标在ZZ（那30%），与测试器中的结果无关，因为这个误差是沿着ZZ肩任意分布的，也就是说，假信号与真信号混在一起。我交易趋势，似乎，但预测下一个蜡烛。为了克服这一矛盾，我有一个专家顾问，成功交易了一年多，然后在10月7日，它在一个固定最大风险水平的止损点上弹出。

但这是趋势交易。

你一直暗示你在交易差异，而不是趋势。这是一种不同的交易，有更好的设计模型--GARCH。开发得非常好，有大量现成的工具，有大量的金融市场交易实例，包括外汇。这就是我现在正在做的事情。加入进来。

PS。

关于在ZZ上展望未来。

你必须认真写。当你训练时，在历史上，你总是把数值放到最后，最右边的栏。但在EA中却不是这样：在ZZ的右侧总是有一个未成形的肩部，此外，前一个肩部也可能是透支的。因此，我们必须在历史上学习。然后转移到一个新的文件，在那里沿着图表重新训练，只考虑已经形成的ZZ值。而这是100条以上的滞后。而且没有 "偷看"，而是与滞后相反。

关于我上面写的 "测试者 "和预测结果不一致的问题，如果我预测回归者，一切都很符合，我想了很久，但我不确定我是否有时间把ML 预测的依赖函数正式化，变成夏普比率，我确定它反映的是统一的，因为经验关系是相当明确的。从技术上讲，"测试器 "的结果与一些预测对已实现收益的简单卷积（标量乘积）没有太大区别（原谅我的HFTs），相应地，预测与收益的相关性越大，测试器的结果越好，真正的交易成本不同。当然，这样的函数（predict2Sharp）将不是从准确性而是从logloss，因为猜测的数量本身不如乘以被猜测的回报重要。

关于GARCH ，据我所知，这是一个预测波动率的线性模型，它不预测市场方向，还是我错了？

Mihail Marchukajtes 2017.06.26 18:25 #4258

阿利奥沙。

至于 "测试者 "的结果和预测的不一致，我在上面写了为什么，如果你预测回归者，一切都很适合，很长一段时间成熟的想法，但我不能得到的时间，数学形式化的依赖函数预测ML 在夏普比率，我相信有一个毫不含糊的显示，因为经验的关系是相当不明确的。从技术上讲，"测试器 "的结果与一些预测对已实现收益的简单卷积（标量乘积）没有太大区别（原谅我的HFTs），相应地，预测与收益的相关性越大，测试器的结果越好，真正的交易成本不同。当然，这样的函数（predict2Sharp）将不是从准确性而是从logloss，因为猜测的数量本身不如乘以被猜测的回报重要。

关于GARCH ，据我所知，这是一个预测波动率的线性模型，它不预测市场方向，还是我错了？

我承认，我试图用夏普系数、索蒂诺系数等来划分基础策略的信号，并得出结论，所有这些系数都是基础策略的结果。也就是说，夏普的结果是完全一样的，因为信号以这样那样的利润关闭，而不是在超额完成任务.....。虽然我不是一个很好的程序员，所以我可能错误地计算了这些系数。但我的夏普在-2到2的范围内。所以我想我是对的....。

Алёша 2017.06.26 18:34 #4259

Mihail Marchukajtes:

我承认，我曾试图用夏普（Sharpe）、索蒂诺（Sortino）等来对基础策略的信号进行分类，得出的结论是所有这些系数都是基础策略的结果。也就是说，夏普的结果是完全一样的，因为信号以这样那样的利润关闭，而不是在超额完成任务.....。虽然我不是一个很好的程序员，所以我可能错误地计算了这些系数。但我的夏普是在-2到2的范围内，所以我想我得到了它的权利....。

有许多通用的SR，但经典的SR是评估一个策略/交易员/基金业绩的最简单和最常见的指标。SR<1.5被认为是低劣的，>=2是伟大的!

从数量上讲，SR大致是指利润与风险的比率。

Mihail Marchukajtes 2017.06.26 18:45 #4260

阿利奥沙。

有许多通用的SR，但经典的SR是评估交易者基金策略表现的最简单和最常见的指标。SR<1.5被认为是令人毛骨悚然的，>=2是很好的!

从数量上讲，SR大致是指利润与风险的比率。

原则上来说，这并不重要。预测能力为零，....。

交易中的机器学习：理论、模型、实践和算法交易 - 页 426