交易中的机器学习:理论、模型、实践和算法交易 - 页 156

 
顺便说一下,长期的宇宙百分比是在5分钟内获得的,交易量也相应增加,所以.....,一切都适合....。
 
阿列克谢-伯纳科夫


2)嗯,是的......但这个夏普2-3是如何计算的?基金是如何计算的,或者说他们如何确定这是真实交易的真实夏普估计值?


重点是,在模型上,夏普是回报与风险的比率,有许多变化,什么算作回报,如愚蠢的增长百分比或回归的动态增长,而风险是CKO或最大缩减,等等。这些差异不是根本的,但如果2-3是一个现实,每个人都会成为亿万富翁,在真正的交易中,由于一些原因,它出来的东西少了许多倍,即使是由博士团队完成。但很多都与能力有关,如果许多模型的交易价格为10万美元,甚至高达1000万美元,情况就会好得多,但这甚至无法偿还投资和员工奖金的工资。

 
J.B:

这就是模型的问题,夏普是收益与风险的比率,有许多变化,什么算作收益,如愚蠢的百分比增长或增长动态的回归,风险是CKO或最大跌幅,等等,这些差异不是根本的,但如果2-3是真实的,每个人都会成为亿万富翁,在真实的交易中,由于一些原因,它出来的次数少,即使由博士团队完成。但很多时候与那里的能力有关,如果许多模型的交易价格为10万美元,甚至高达1000万美元,情况会好得多,但这甚至无法偿还投资和员工奖金的工资。

博士并不是一个指标。再培训的效果将不亚于女士和B女士。因此,实际情况的指标急剧下降。
 
阿列克谢-伯纳科夫

嗯,好吧。

假设我不是把增长划分为上升/下降,而是建立一个回归模型。所以R^2或其他确定的指标(如稳健的绝对偏差指标)就可以了。

关于相互信息--它是未经证实的,还是有强有力的证据表明该指标的工作不可靠?我有疑虑。

更新: 我对使用相互信息的合成和真实数据做了很多研究。如果依赖关系是静止的,那么这个度量在任何地方都能很好地工作。如果依赖性处于噪声的边缘,那么度量可能显示为零依赖性。但总的来说,我看不出有什么理由它在多变量非线性系统中的表现会比例如F1差。你可以在这里阅读:https://habrahabr.ru/company/aligntechnology/blog/303750/

但是,当我对一个增量价格运动进行分类时,我得到了大约以下的图片(对5个货币对一起,即一个模型适用于所有)。


这至少是在50个待处理样本上的中位准确值,最高为57%的区域。对于个别货币对,我实现了60%以上的中位数准确率。这仅仅是在时间序列数据上。

对不起,没有时间给出确凿的证据,市场数据不是静止的,依赖性也不是线性的,比如在2D中模拟一个10维分形的噪音,像这样:红色的一类绿色的另一类,只有在10D中才有。

正如你所看到的,它不是高斯依赖关系,有很多 "岛屿 "等等。那么,请计算一下,在分类下降时,增加和删除一个维度时,使用相互信息或r^2 的效率是多少。R^2 通常是线性的,在复杂拓扑的分离超表面和许多岛屿的情况下,一切都很悲哀。这里不能没有经典的统计标准,你可以自己检查。如果有100d或1000d这样的混乱情况呢?

 
J.B:

对不起,没有时间提供有力的证据,市场数据不是静止的,依赖性也不是线性的,比如在2D中模拟10维分形噪声,就像这样:红色的一类绿色的另一类只有在10D中才有。

正如你所看到的,它不是高斯依赖性的很多,有 "岛屿 "等等。那么,请计算一下,在分类下降时,增加和删除一个维度时,使用相互信息或r^2 的效率是多少。R^2 通常是线性的,在复杂拓扑的分离超表面和许多岛屿的情况下,一切都很悲哀。这里不能没有经典的统计标准,你可以自己检查。如果有100d或1000d这样的混乱情况呢?

这是不可以证明的...

你不能理解我。我是说,我不是在分类,我是在建立一个回归模型。分类与它有什么关系...我没有运行任何超平面。我正在做一个目标中值的条件建模,并通过残差分析来衡量其质量。这就是它一直以来的做法。

如果我们谈论的是分类,那么对某物的正态性要求就没有必要,例如,如果某物的概率接近于零。非线性和多维性只是相互信息的范围。我认为你在这个问题上不太了解......

 
迪米特里

10%是存款负荷。

如果你有1000美元的存款,你把它加载10%--你开了一个100美元的交易。

现在,注意,根据你的经纪人/教练提供的杠杆,你可以购买不同的手数--10,000美元(1:100),5,000美元(1:50),20,000美元(1:200)。

P.S. fuckerbaby........


不要在一个轻松的话题中说脏话...

让我们来算一算。

第一个例子。我有500美元。一个微型lot值1000美元。我用微型lot开了一笔交易(因为购买较大的金额不再适合内在的风险限制),因此使用1:2的杠杆。由于庄家给我的最大杠杆是1:100,我把存款装入2%,买入1000美元/100。

第二个例子。如果我开了5笔交易,在相同的资本水平下,我把我的存款增加10%,并使用1:10的杠杆(0.01 * 100000 * 5 / 500)。

也就是说,所提供的最大杠杆率只取决于存款负荷的百分比,并让我有机会打开整个切口。所涉及的实际杠杆率由我决定。但对于我的投资来说,最低是1:2。

现在一切都清楚了吗?

 
阿列克谢-伯纳科夫

不要在一个轻松的话题中说脏话...

让我们来算一算。

第一个例子。我有500美元。一个微型手的价格是1000美元。我用微型lot开了一笔交易(因为购买较大的金额不再适合内在的风险限制),因此使用1:2的杠杆。由于庄家给我的最大杠杆是1:100,我把存款装入2%,买入1000美元/100。

如果我开了5笔交易,在相同的资本水平下,我把存款增加10%,并使用1:10的杠杆(0.01 * 100000 * 5 / 500)。

我们现在清楚了吗?

你正在使用厨房为你提供的相同杠杆。你不改变杠杆率(它是给定的--一个常数),而是改变你在给定杠杆率下使用的资本量。

再次强调--对于你的账户类型,厨房给你的杠杆率是多少?1:100?

 
迪米特里

你使用厨房为你提供的同样的杠杆。这不是你使用的杠杆(它是一个固定的常数),而是你在给定的杠杆下使用的资本量。

再次强调--对于你的账户类型,厨房给你的杠杆率是多少?1:100?


最大杠杆 - 是的,1:100。但我不使用它。再一次。

 
Alexey Burnakov:

这并不具有证明力...

你不能理解我。我说,我不做分类,我建立一个回归模型。分类与它有什么关系...我没有运行任何超平面。我正在做一个目标中值的条件建模,并通过残差分析来衡量其质量。这就是它一直以来的做法。

如果我们谈论的是分类,那么对某物的正态性要求就没有必要,例如,如果某物的概率接近于零。非线性和多维性只是相互信息的范围。我认为你在这个问题上不太了解......

那么,如何不进行分类,比如说1000个因素,一个深度神经网络 有很好的比如说100个输出,在不同的时间范围内给出一个给定的工具向上/向下运动的概率。那是一种退步吗?回归是指对价格进行预测。

你可以使用相互信息,而我们可能只是简单地看一下这些因素,并计算每个因素对最终预测的影响百分比,对于一个特定的模型,这就更糟糕了。googleNet在先进性方面的表现。我们不需要回归,我们不关心一项资产到底会值多少钱,这使模型复杂化,没有意义,主要的是在N秒内,它将以给定的概率向正确的方向移动。

 
阿列克谢-伯纳科夫

最大的杠杆率是的,1:100。但我不使用它。我再说一遍。

好吧,如果你不理解基本的东西,那么就没有必要争论了。

简而言之,你必须将你的利益与对冲基金的百分比除以10左右。