市场模型:恒定的吞吐量 - 页 3

 

这个想法本身很好奇,但其背后的信息真的很奇怪。我个人不喜欢它。如果信息量总是大致不变,那么市场上就没有什么事情发生。但事实并非如此。在市场上,有定期的灾难,其中信息量正好发生变化(如过渡到另一个相位状态)。

 

该人提议分析压缩信息的比特,以预测流中的新 "帧",例如,与MPG1帧相比,什么比MPG4帧更好,以预测下一帧?

也许跟着电影的情节走会更容易些 :)

 
hrenfx:

信息是一组比特,不能以任何方式进行压缩来传输。

假设市场作为一个相对封闭的系统,在单位时间内产生恒定(或缓慢变化)的信息量。

这意味着什么呢?

市场数据是可以从市场上获得的任何东西。最简单的是价格。

让时间的单位是时间。假设在时间上,市场上的信息量始终为N。 它更简单。

我们在这段时间 内收集了来自市场的数据。我们把它压缩到最大(不可能再压缩了),从而得到一组不可压缩的比特--它是在时间单位"时间"内数量不变(N)的信息。

尽可能多地压缩是一种理论。有很多的压缩算法。压缩算法越强,它就越能估计出可用数据中包含的信息量。也就是说,我们不能确切地确定信息量,但我们可以估计它。

这里 介绍了如何使用这个模型进行交易。

验证模型的适当性并不十分困难。拥有大量的历史市场数据就足够了。取一个时间 大小的滑动窗口。而对于窗口的每个位置,进行压缩(算法可以不同)获得比特的数量。因此,我们将获得信息量估计的BP。现在只剩下分析这份BP并做出适当的结论。



克劳德-香农(Claude Shannon)顺便放弃了他的科学生涯,据传现在从事股票市场,他提出了信息衡量的概念。

某个事件有M个可能的结果Xi,概率为P[Xi],描述第i个结果发生的概率,包含

信息,其值由表达式定义。

I[Xi]=ln(1/P[Xi])=-ln P[Xi]

这种信息的预期值或平均值I 等于 H。

也就是说,熵是对不确定性的一种衡量,还记得医院的平均温度吗?:))) 在这里。

这就是不确定性,熵 :)。

"信息是一组比特,无论如何都不能压缩传输",听起来!

但在我看来,一个集合 "不能 任何方式被压缩 "的唯一方式是

一个仅由一个比特组成的集合,即当没有冗余时,就会有

没有什么可以压缩的!也就是说,当这个位子取两个值 "0 "或 "1 "中的一个时,但!

是完全肯定的!所以你表示希望有一些程序可以

带来了外汇市场中的随机性,有一些程序可以完全解决这个问题。

消除这种随机性,使其不能再进一步?而这更不可能,因为外汇市场不是一个闭环 系统

这一点被强烈的非平稳性所证明,即统计参数的波动性,货币对的报价和

市场的经验观点是技术分析和基本面分析的结合,正如你所知,这

分别涉及到市场的内部情绪和市场外的情况分析。

这就是为什么我写了这么多,因为你的,呃,假设在我看来是完全颠倒的。

 
TheVilkas:

我熟悉信息理论的基本知识。似乎给信息下了一个模糊的定义。让我转述一下。

数据中包含的信息量是恢复数据所需的最小比特数。

也就是说,最大压缩(可恢复)数据中的比特数就是该数据的信息量。所谓数据中包含的纯信息。

 
hrenfx:

信息是一组比特,不能以任何方式进行压缩来传输。

假设市场作为一个相对封闭的系统,在单位时间内产生恒定(或缓慢变化)的信息量。

这意味着什么呢?

市场数据是可以从市场上获得的任何东西。最简单的是价格。

让时间的单位是时间。假设在时间上,市场上的信息量始终为N。 它更简单。

我们在这段时间 内收集了来自市场的数据。我们把它压缩到最大(不可能再压缩了),从而得到一组不可压缩的比特--它是在时间单位"时间"内数量不变(N)的信息。

尽可能多地压缩是一种理论。有很多的压缩算法。压缩算法越强,它就越能估计出可用数据中包含的信息量。也就是说,我们不能确切地确定信息量,但我们可以估计它。

这里 介绍了如何使用这个模型进行交易。

验证模型的适当性并不十分困难。拥有大量的历史市场数据就足够了。取一个时间 大小的滑动窗口。而对于窗口的每个位置,进行压缩(算法可以不同)获得比特的数量。因此,我们将获得信息量估计的BP。现在只剩下分析这份BP并做出适当的结论。


无损归档意味着编译一个新的字母表,其对要归档的信息的描述+编码将小于信息本身的大小。粗略地说,它是一些模式的分配。但这对于像正则语法这样的模型是有效的--在这些模型中,有严格的、毫不含糊的规则,或者说对这些规则的偏离并不频繁。比如说,如果有噪音,归档效率就会急剧下降。如果在一个文本中,有一个词出现了100次,但每次都有一个错误或几个字母被调换,无损压缩算法无法将其保持在一个独立的模式中。有损压缩算法,如图像、视频和声音的压缩算法,在这里是有效的。但所有这些仍然不能考虑到上下文规则,例如根据大小写改变词尾,等等等等。例如,他们会强调文本中最常用的字母组合,仅此而已。对市场来说也是如此--它将分离出最常见的基本模式,但并不是说使用这些模式就能实现概率预测的事实。它可能更准确,是一个有利可图的预测。否则,就会有90%的概率预测会有这样那样的情况继续存在。但剩下的10%的情况下的财务损失将与使用这些90的利润相同。

简而言之,一切都取决于存档者。深度规则的分配是人工智能(或自然:)的工作,而不是rar:)当然,最主要的不是它们的全球性,而是使用时的获利可能性。

 

我不明白第一个帖子的主题变成了公式,但我认为你是想谈 的问题

ZS:我讨厌信息传输理论,因为一个错误(我把bps和baud混为一谈),我的成绩单得到了 "O "而不是 "A"。

 
Mathemat:

这个想法本身很好奇,但基本前提真的很奇怪。我个人并不喜欢它。如果信息量总是近似恒定,市场上就不会发生什么事。但事实并非如此。在市场上,有定期的灾难,其中信息量正好发生变化(如过渡到另一个相位状态)。


我希望论坛成员能记住这个主题。https://www.mql5.com/ru/forum/105740

第一页

其中,流动理论中的一个特殊作用是由一个称为流动强度(FTI)的一阶矩函数来发挥。

可能是另一种说法,IP是每单位时间内的信息量。如果你不同时分析新闻的话,这的一些类似物可以被认为是单位时间内的刻度数。顺便说一下,在我看来,你不能压缩,压缩(不压缩)的信息量不会改变

Z.U.,如果没有tickframe,你会很难做到。检查历史记录也不行https://www.mql5.com/ru/forum/1031/page1#comment_6372,以分钟为单位的历史记录会杀死这些信息......

 
hrenfx:

测试模型的充分性并不十分困难。拥有大量的历史市场数据就足够了。取一个大小为Time 的滑动窗口。并对每个窗口位置进行压缩(可以使用不同的算法),获得比特数。因此,我们将获得信息量估计的BP。剩下的就是分析这份BP并得出适当的结论。

经测试。我取了一个每天大小的滑动窗口(288M5),每次移动5分钟,从2010年初到2010年10月,应用RAR7Z LZMA 压缩 - 每个存档器压缩了近60000个滑动窗口。这是外汇市场(澳元兑美元、欧元兑美元、英镑兑美元、美元兑日元、美元兑加元、纽元兑美元、白银、黄金)压缩窗口大小的图表。

令人惊讶的是,RAR 显示出极其不稳定的结果。压缩窗口的大小波动很大。7Z LZMA 显示了稳定的结果和较小的压缩窗口尺寸。因此,7Z LZMA 被选为进一步研究的对象。

然后我开始做同样的事情,但我改变了市场样本:首先我增加了一个符号(澳元兑美元),然后一个又一个,直到我有9个 符号(澳元兑美元、欧元兑美元、英镑兑美元、美元兑日元、美元兑加元、新西兰元、白银、黄金)。任务是找出存档者如何在引入新符号的情况下找到相关的内容。如果存在相关关系,当增加一个新符号时,压缩窗口的平均尺寸应该非线性增长。结果是这样的。

我们可以看到,已经有8个 工具至少有20%的 数据是多余的(不包含任何信息)。也就是说,有一种相关性,而且是不小的相关性。有趣的是,加入第9种 金融工具(GOLD)并没有显示出相互关系(MI没有下降)。增加了金融工具的RMS相对于开始时(1个 工具)增加了50% 以上(9个 工具)。

对于不同的金融工具集,压缩窗口大小(MO被减少到1)的变化图如下。

这些图形的分布情况。

可以得出什么结论?

不可能反驳或确认该模型。压缩算法很好地显示了金融工具之间存在基本的(非常简单的算法)关系(8种 金融工具中超过20% 的冗余数据被消除)。许多人会说这是自然的,因为使用的是Solid-conversion。但这并不完全是这样。例子是黄金 存档者无法找到与其他8个 符号的联系。

P.S. 没有刻意分析交叉点,因为我们知道它们与专业完全相关,因此不包含任何额外信息。因此,只有专业人员。

P.P.S 所有关于窗口尺寸的数据都附在后面。

P.P.P.S. 解决这个问题很有意思。我不得不使用一些新的方法。特别是,我不得不使用RAM-磁盘来对各种窗口进行50多万次压缩。最后,它是相对快速的。

附加的文件:
4analyse.rar  497 kb
 
hrenfx:

...

如果你不介意,请做同样的事情,但用RMS人工生成的BP。看看会发生什么,非常有趣。
 
hrenfx:

然后我做了同样的事情,但我改变了市场样本:首先我添加了一个金融工具(澳元兑美元),然后我又添加了一个,直到我有9个 金融工具(澳元兑美元、欧元兑美元、英镑兑美元、美元兑日元、美元兑加元、新西兰元、白银、黄金)。

那么究竟是如何增加的呢?