从理论到实践 - 页 336

 
Alexander_K2:

今天的最后一篇文章。

所以。诺瓦亚曾经问过的最迫切的问题。

为什么要把当前的勾股流(实际上是一个埃朗流)转换成指数流,然后再回到相同的、但已经明显扭曲的流?

我同意--这里犯了一个错误。我们应该与现有的蜱虫流一起工作,并在这个自然的源流上进行进一步的转化,而不是人为的转化。

因此,转换的算法看起来如下。

1.我们采取最初的tick流,但改为每秒钟读取一次tick--看看获得的时间间隔和增量的分布情况。

2. ...每三个刻度线被读取--我们看一下分配。

3. ...

直到时间间隔的分布获得一个明确的、明显的二朗流,满足概率密度函数 的公式,而增量的分布越来越接近于正态分布。

这是我要做的,我会让你知道结果。

谢谢你的关注。

这只是多年痛苦研究的开始,基于假设和大量的冒号。

而结论就像一个圣杯......

这就像一个圣杯...

 
Alexander_K2:

今天的最后一篇文章。

所以。诺瓦亚曾经问过的最迫切的问题。

为什么要把当前的勾股流(实际上是一个埃朗流)转换成指数流,然后再回到相同的、但已经明显扭曲的流?

我同意--这里犯了一个错误。我们应该与现有的蜱虫流一起工作,并在这个自然的源流上进行进一步的转化,而不是人为的转化。

因此,转换的算法看起来如下。

1.我们采取最初的tick流,但改为每秒钟读取一次tick--看看获得的时间间隔和增量的分布情况。

2. ...每三个刻度线被读取--我们看一下分配。

3. ...

直到时间间隔的分布获得一个清晰、明显的Erlang流,满足概率密度函数 的公式,而增量的分布越来越接近于正态分布。

这是我要做的,我会让你知道结果。

谢谢你的关注。

通过读取每2个,然后是第3个,以此类推,每n个tick,你实际上得到一个收盘价范围的图表。

而这个图表中的分布情况我已经向你介绍过了。

在开始的时候,你会得到中心峰的减少,它将开始模糊地接近正态,然后分布会变成二元的。

为了理解这个过程,你需要在边缘进行研究,而边缘的衡量标准是:当n=1时,你会接近对数正态分布,而随着n的增加,接近n=100时,你会有一个双峰分布。这意味着分布一直是双峰的,只是由于小n的离散性,它互相重叠,情况不清楚。

所以你的研究是自行车的发明。

 
Yuriy Asaulenko:

不,这不是卖大象的方法。

A_K2的特点是完全缺乏系统的方法和对细节的挖掘。当没有整体的视野时,有什么细节?

此外。

我真诚地希望A_K2能生产出真正有用的东西。然而,从他的帖子来看,这次也将是一次空白的射击。

进步、科学和技术总是从简单的形式(描述)转向更复杂的形式。而且,不得不说,那些简单的东西已经相当好用了。

如果你从来没有设计 过汽车,那么从奔驰车开始就没有前景了。你应该从简单的东西开始,像Zhiguli这样的东西--工作原理与奔驰车相同,但一切都要简单得多。当你的Zhigul开始移动时,你可以改进,现代化,复杂化,使其达到奔驰水平。请记住,15年前的韩国汽车是什么样的--你会忍不住哭泣。

看起来A_K2又开始设计奔驰车了。)它至少可以在Zhigul前4个月建成--它不需要任何科学的设计,技术方案就足够了)。

 
Alexander_K2:

你必须与你所拥有的蜱虫流一起工作,并在这个自然源流上进行进一步的转化,而不是在一个人工源流上。

我已经就此事写信给你,但显然我的声音还不够。
你的 "真正的抽搐 "是不寻常的东西。我不知道那个 "DDE "的背后是什么,但它完全不是外汇结算通常给出的那种胡乱的垃圾。至少蜱虫比平时少了10倍,这已经令人震惊。你直方图上的第一个口袋应该是~200ms,而不是一秒钟。

请把最后收到的几千条蜱虫放到csv中,不要减薄,不要用过去的数值填空,而只填那些来的价格。也许有人会使用它们,并确认这些数值比通常的交易更可接受。然后,也许这个主题的集体智慧会建议如何用十几行mql代码来制作一个圣杯

 
Alexander_K2:

而且你不必转换任何东西?我不相信!!!!!!!!这并不有趣。

大数据处理的原则始终是使用具有最大信息量的原始数据,但要在其中添加不同的指标,或者在不损失信息的情况下缩小数据。

如果你开始捣鼓信息,很明显,这种算法的价值和充分性立即下降。

 
Alexander_K2:

但六个月前,我们讨论过,由于不同的经纪商有不同的tick-flow,第一个任务是把它们带到一个单一的通用视图。不是吗?

一者与另一者并不矛盾。

普遍的观点并不意味着有必要使它们达到相同的滴答流......。
 

谢谢,这里有一个收益分布的比较,以及过去1000个audcad投标值的自相关。最上面一行是你的虱子。底排是终端的内容。有区别,但我无法从图表中看出哪个更好。我喜欢直方图的峰值没有像终端那样被简略化。

一些静止性测试。

你的虱子是。

> Box.test(pricesDiff, lag=20, type="Ljung-Box")

        Box-Ljung test

data:  pricesDiff
X-squared = 39.466, df = 20, p-value = 0.005832

> adf.test(pricesDiff, alternative = "stationary")

        Augmented Dickey-Fuller Test

data:  pricesDiff
Dickey-Fuller = -11.556, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary

> kpss.test(pricesDiff)

        KPSS Test for Level Stationarity

data:  pricesDiff
KPSS Level = 0.44326, Truncation lag parameter = 7, p-value = 0.05851


还有那些在终端的人。

        Box-Ljung test

data:  pricesDiff
X-squared = 29.181, df = 20, p-value = 0.08426

> adf.test(pricesDiff, alternative = "stationary")

        Augmented Dickey-Fuller Test

data:  pricesDiff
Dickey-Fuller = -10.252, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary

> kpss.test(pricesDiff)

        KPSS Test for Level Stationarity

data:  pricesDiff
KPSS Level = 0.3404, Truncation lag parameter = 7, p-value = 0.1


你的Box-Ljung检验中的p值要低一个数量级,这很好。


而且最重要的是,你的蜱虫是一个有记忆的过程,它非常没有标记。我不知道如何用数字表示,但在我的模型中,你的虱子比正常的虱子更容易预测。


我想知道是否有任何其他测试来评估可预测性?

 

来自亚历山大文件01AUDCAD_Real的刻度线之间的距离 14400(1秒增量)。


 
Alexander_K2:

如果是这样的话,那么显然每个人都应该像我一样在一个不连续的报价流中工作,仅此而已。不是吗?

这也是我一个月前的想法。既然你有一个对数分布(或帕斯卡),我也想通过瘦身来获得一个好的分布。经过几个星期的尝试,"我把p改成0.71而不是0.72,就可以了"。- 我从来没有做对过,这都是卷尺,不是科学。

价格收益的分配,以及时间停顿只是后果。最重要的是要得到一个静止的非马尔科夫过程。而且越是静止的和非马尔科夫的--越好。我认为这是第一个具有非马尔科夫静止性要求的必要转换,它产生什么分布并不重要。
我不知道如何实现这种非马尔科夫的静止性,但看起来是正确的方法。

然后,对于这样一个稀疏的系列,人们可以尝试根据交易策略进行第二次转换。就像在返回者中实现一个范围,正如你对你的模型所希望的那样。这里的转变取决于你的策略,你可以创建特征并训练神经元,而不是二次减薄。


p.s.--"非马尔科夫静止性"纯粹是对这一属性的个人亵渎性称呼。在科学上,它可能有不同的称呼。

 
Novaja:

来自亚历山大的文件01AUDCAD_Real 14400(离散性为1秒)的刻度线之间的距离。

从几页前的图表来看--峰值已经从0转移到了1。我想这取决于交易的货币对(AUDCAD和CADJPY)。


亚历山大_K2

我认为这是一个帕斯卡尔分布,r=2,p=0.5,q=0.5。

我试着在R中用这样的参数画出Pascal的分布,它并不吻合。但还有其他的符号,而不是r,p,q,也许我弄错了什么。

原因: