交易中的机器学习:理论、模型、实践和算法交易 - 页 426

 
伊万-内格雷什尼

你是对的,预测指标是多余的。但预测价格也是多余的,因为交易策略的目标不是价格而是利润。

按照这个逻辑,我们应该建立的模型不是指标,也不是价格图表,而是交易者的行为,最好的目标功能是他或她的盈利交易的指标。

在实践中,你应该采取交易历史或在策略测试器中运行专家顾问,并以价格模式作为输入,以交易作为输出来教导模型。

因此,"利润 "是回报(盈利能力,回报),即价格的增加被其绝对值 归一化,这就是臭名昭著的 "动量 "指标,知道未来的动量,你就是宇宙的统治者。

 
马克西姆-德米特里耶夫斯基

而现在这里讨论的是某种幼儿园的人字形应用与否,如果预测方法本身从一开始就是错误的(即不会导致成功),这到底有什么区别呢 :)

这是对的,问题在于细节,不要太仓促。而这种 "幼稚 "不仅涉及到 "之 "字形,它是一个真正的陷阱...

 
阿利奥沙

我不敢这样做,在你和其他人的态度中都不敢。在你的妄想中,你并不孤单。

你写的东西 有很多道理,文章很好,我说的很真诚,很简短,很简明。但是有一点缺陷,我已经指出来了,因为我自己也以同样的方式被骗了很久了。


让我再一次尝试解释我的立场。


你提到的文章是机器学习的宣传材料:它表明机器学习的概念不仅包括模型,还包括模型的数据准备和模型评估。它还表明,任何对机器学习感兴趣的人都可以用最小的努力尝试这一切。


我的想法根本不在文章中。这是一个广告。


我对这个主题和其他论坛主题的想法是 机器学习中主要的、基本的 东西不是模型,而是"预测者与目标变量相关"的理由。

它是 "相关的",而不是目标本身或一组特定的预测因素。也就是说,我把我自己的意思放在 "有关系 "的意义上,与 "预测因素的重要性 "所定义的意义不同。

我从来没有在任何地方宣传或证明ZZ的使用:我只是在我的例子中把它作为最突出的预测因素。我还表示,对于我自己的预测器组,我得到的预测误差不到30%--应该说,这不是一个坏结果。

但是,再次强调:之所以能得到这个结果,是因为我能够过滤掉预测因素,撇开那些与目标变量 "相关 "的因素。在我的例子中,对ZZ。但对我的方法来说,目标并不重要,重要的是整个 "目标-预测器 "集。

 
桑桑尼茨-弗门科

除此之外,我还指出,就我个人而言,对于我所拥有的一组预测器,我得到的预测误差不到30%--应该说是一个非常好的结果。

但是,我再次强调:之所以能得到这个结果,是因为我能够过滤掉预测因子,撇开那些与目标变量 "相关 "的因素。在我的例子中,对ZZ。但对我的方法来说,目标并不重要,整个 "目标预测器 "才重要。

这不是一个糟糕的结果,而是非常棒的,我敢肯定,即使是文艺复兴也没有这么接近,他们每天的数据是以兆字节为单位的。看看数值 上的实时得分ai ,想想为什么他们至少有45%的误差(logloss~0.69),而你只有30%。

但是你说的是真的,你已经创建了你的合成目标函数,它在功能上以一种巧妙的方式(显然对你来说并不明显)与特征相结合,你在洛恩和测试上有如此漂亮的扫描,一切看起来都是正确的......但是为什么你还没有成为亿万富翁,尽管如果你在预测下一个蜡烛颜色时有30%的错误,你可以在大约一年内轻松成为一个富翁,因为你预测的不是未来而是通过指标将过去与未来混在一起。尝试预测一个纯粹的未来回归者,一切都会水到渠成。

 
Aliosha:

这不是一个糟糕的结果,这是一个梦幻般的结果,我相信即使是文艺复兴也没有接近它,他们每天的数据量达数兆字节。看一下numer.ai 上的实时分数,想想为什么他们至少有45%的误差(logloss~0.69)而你只有30%。

但是你说的是真的,你已经创建了你的合成目标函数,它在功能上以一种巧妙的方式(显然对你来说并不明显)与特征结合在一起,你在洛恩和测试上有如此好的衡量标准,一切看起来都是正确的......但是你还不是一个亿万富翁,尽管如果你在预测下一个蜡烛颜色时有30%的错误,你可以在大约一年内轻松成为一个富翁,这是因为你没有预测未来,而是通过指标将过去与未来混合在一起。尝试预测一个纯粹的未来回报,一切都会水到渠成。

ZZ是一个不好的目标变量,因为它的肩部起点和终点有相同的重量。如果你把目标变量放在反转之前和ZZ反转之后,我一直无法找到这样一个目标变量的预测器--我所知道的所有关于这样一个目标变量的预测器都只是噪音。我与论坛上的一个人合作,他有自己的一套预测器,我们都有相同的结果。

不是亿万富翁,原因很简单:我的模型的机器学习模型 估计,目标在ZZ(那30%),与测试器中的结果无关,因为这个误差是沿着ZZ肩任意分布的,也就是说,假信号与真信号混在一起。我交易趋势,似乎,但预测下一个蜡烛。为了克服这一矛盾,我有一个专家顾问,成功交易了一年多,然后在10月7日,它在一个固定最大风险水平的止损点上弹出。

但这是趋势交易。

你一直建议交易DIVERSES,而不是趋势。这是一个不同的交易,有更好的设计模型--GARCH。开发得非常好,有大量现成的工具,有大量的金融市场交易实例,包括外汇。这就是我现在正在做的事情。加入进来。


PS。

关于在ZZ上展望未来。

你必须认真写。当你训练时,在历史上你总是有一个到最后的、最右边的栏的数值。但在EA中却不是这样:在ZZ的右侧总是有一个未成形的肩部,此外,前一个肩部也可能是透支的。因此,我们必须在历史上学习。然后转移到一个新的文件,在那里沿着图表重新训练,只考虑已经形成的ZZ值。而这是100条以上的滞后。而且没有 "偷看",而是与滞后相反。

 

我总结一下,让很多人清楚地了解....

确实有复杂的目标函数,或者说研究者决定问题出在输出变量上,并开始将其复杂化。这曾经发生过,我也曾经这样做。但随着时间的推移,我明白没有必要这样做,预测价格变化就足够了,如果不能在适当的质量水平下完成,那么再复杂的产出也无法挽救局面。

至于平衡曲线,它是训练质量的结果。正是这种曲线的类型决定了学习的质量。两个条件。

平衡曲线呈45度角的均匀 增长

没有强烈的跳跃和跌落。

像这样....

 
桑桑尼茨-弗门科

ZZ是一个不好的目标变量,因为它的肩部起点和终点具有相同的重量。如果我们把目标变量放在反转之前和ZZ反转之后,我无法找到这种目标变量的预测因素--我所知道的这种目标变量的所有预测因素都只是噪音。我与论坛上的一个人合作,他有自己的一套预测器,我们都有相同的结果。

不是亿万富翁,原因很简单:我的模型的机器学习模型估计,目标在ZZ(那30%),与测试器中的结果无关,因为这个误差是沿着ZZ肩任意分布的,也就是说,假信号与真信号混在一起。我交易趋势,似乎,但预测下一个蜡烛。为了克服这一矛盾,我有一个专家顾问,成功交易了一年多,然后在10月7日,它在一个固定最大风险水平的止损点上弹出。

但这是趋势交易。

你一直暗示你在交易差异,而不是趋势。这是一种不同的交易,有更好的设计模型--GARCH。开发得非常好,有大量现成的工具,有大量的金融市场交易实例,包括外汇。这就是我现在正在做的事情。加入进来。


PS。

关于在ZZ上展望未来。

你必须认真写。当你训练时,在历史上,你总是把数值放到最后,最右边的栏。但在EA中却不是这样:在ZZ的右侧总是有一个未成形的肩部,此外,前一个肩部也可能是透支的。因此,我们必须在历史上学习。然后转移到一个新的文件,在那里沿着图表重新训练,只考虑已经形成的ZZ值。而这是100条以上的滞后。而且没有 "偷看",而是与滞后相反。


关于我上面写的 "测试者 "和预测结果不一致的问题,如果我预测回归者,一切都很符合,我想了很久,但我不确定我是否有时间把ML 预测的依赖函数正式化 ,变成夏普比率,我确定它反映的是统一的,因为经验关系是相当明确的。从技术上讲,"测试器 "的结果与一些预测对已实现收益的简单卷积(标量乘积)没有太大区别(原谅我的HFTs),相应地,预测与收益的相关性越大,测试器的结果越好,真正的交易成本不同。当然,这样的函数(predict2Sharp)将不是从准确性而是从logloss,因为猜测的数量本身不如乘以被猜测的回报重要。


关于GARCH ,据我所知,这是一个预测波动率的线性模型,它不预测市场方向,还是我错了?

 
阿利奥沙

至于 "测试者 "的结果和预测的不一致,我在上面写了为什么,如果你预测回归者,一切都很适合,很长一段时间成熟的想法,但我不能得到的时间,数学形式化的依赖函数预测ML 在夏普比率,我相信有一个毫不含糊的显示,因为经验的关系是相当不明确的。从技术上讲,"测试器 "的结果与一些预测对已实现收益的简单卷积(标量乘积)没有太大区别(原谅我的HFTs),相应地,预测与收益的相关性越大,测试器的结果越好,真正的交易成本不同。当然,这样的函数(predict2Sharp)将不是从准确性而是从logloss,因为猜测的数量本身不如乘以被猜测的回报重要。


关于GARCH ,据我所知,这是一个预测波动率的线性模型,它不预测市场方向,还是我错了?


我承认,我试图用夏普系数、索蒂诺系数等来划分基础策略的信号,并得出结论,所有这些系数都是基础策略的结果。也就是说,夏普的结果是完全一样的,因为信号以这样那样的利润关闭,而不是在超额完成任务.....。虽然我不是一个很好的程序员,所以我可能错误地计算了这些系数。但我的夏普在-2到2的范围内。所以我想我是对的....。

 
Mihail Marchukajtes:

我承认,我曾试图用夏普(Sharpe)、索蒂诺(Sortino)等来对基础策略的信号进行分类,得出的结论是所有这些系数都是基础策略的结果。也就是说,夏普的结果是完全一样的,因为信号以这样那样的利润关闭,而不是在超额完成任务.....。虽然我不是一个很好的程序员,所以我可能错误地计算了这些系数。但我的夏普是在-2到2的范围内,所以我想我得到了它的权利....。

有许多通用的SR,但经典的SR是评估一个策略/交易员/基金业绩的最简单和最常见的指标。SR<1.5被认为是低劣的,>=2是伟大的!

从数量上讲,SR大致是指利润与风险的比率。
 
阿利奥沙

有许多通用的SR,但经典的SR是评估交易者基金策略表现的最简单和最常见的指标。SR<1.5被认为是令人毛骨悚然的,>=2是很好的!

从数量上讲,SR大致是指利润与风险的比率。

原则上来说,这并不重要。预测能力为零,....。

原因: