faa1947: См. мой пост выше -Alexey. Все-таки надо начинать с длины выборка, которая определяется целью прогноза для ТС. Т.е.: достаточна ли длина выборки для ответа на вопрос: можно входить в позу (выходить из позы) или нельзя? Скорее всего длина выборки будет не значительной (до сотни) и исчезнут фантастические распределения, подобные выше приведенному.
我明白,我使用的是 "类 "或 "区间 "的概念。
faa1947,在你的图中,我看到分布不是单峰的。这是另一个问题。
那么类(机架)的数量也是通过一些公式、规则计算出来的......最有名的有
斯特吉斯公式、弗里德曼-迪亚科尼斯规则、斯科特规则、平方根选择等。
denkir :
我认为可以。它们不应该以任何方式影响样本的统计参数(尤其是分布参数)。这就是它们成为异常值的原因。
依据是样本量足够大,不会受到异常值的影响。这也是我赞成大样本量的原因之一。然后同事faa1947 说,如果我没记错的话,异常值与离群值是不一样的。很明显,如果您的样本中eurusd 汇率波动范围在 1.20-1.50 美元 之间,然后服务器出现错误,返回值为 15.77 美元,那么这样的异常 值将会扰乱样本的所有统计参数。
-亚历克西
Alexey-: 一个真实的分布描述了一个序列的特性,而一个非稳态的分布顾名思义就是这些特性发生了变化。
但请告诉我,真实分布和静止之间有什么联系?我承认我从未见过这种联系。如果这不是秘密的话,你是从哪里得到的?;-)
См. мой пост выше -Alexey. Все-таки надо начинать с длины выборка, которая определяется целью прогноза для ТС. Т.е.: достаточна ли длина выборки для ответа на вопрос: можно входить в позу (выходить из позы) или нельзя? Скорее всего длина выборки будет не значительной (до сотни) и исчезнут фантастические распределения, подобные выше приведенному.
看,问题就在这里。通过减少样本量,我们可能会错过波动集群这种现象。那么使用非线性模型就没有意义了。所以我们可以使用线性模型。而这并不能反映金融序列的本质,即其导数(不要与矩阵分析中的导数相混淆)。
您是根据哪些数据得出双峰分布的?能否上传数据文件?
看,问题就在这里。通过减少样本量,我们可能会错过波动集群这种现象。那么使用非线性模型就没有意义了。所以我们可以使用线性模型。而这并不能反映金融序列的本质,即其导数(不要与矩阵分析中的导数相混淆)。
如果我们信奉系统方法,我们就应该从目标:进入/退出到姿势。干残差的商数是多少?如果我们抽取的样本有限,那么根本不需要波动性或非平稳性,不是吗?必须选择模型。ARMA(甚至不是 ARIMA)被广泛使用。我们的目标并不是应用某种模型。我们的目标是获得具有合理置信度的预测。例如,计算 100、500、1000 根蜡烛图的预测结果就很有意思。也许我们会看到一些东西。
您获得双峰分布所依据的数据是什么?能否上传一个数据文件?
欧元兑美元 D1 从 1999/01/04 到 2011/01/13, 3063 根烛台,取自终端。
因为样本足够大,不会对异常值产生反应。这也是我赞成样本量大的原因之一。然后,我的同事faa1947 说,如果我没记错的话,离群值并不等于异常值。很明显,举例来说,如果eurusd 汇率在样本中的波动范围是 1.20-1.50 美元,然后服务器出了点差错,返回的值是 15.77 美元,那么这样一个离群 值就会把样本的所有统计参数都搞乱。
但是你告诉我,真实分布和静态之间有什么联系?我承认,我从未见过这种联系。如果这不是秘密的话,你是从哪里得到的?;-)
我在最后一页引用了教科书上的一段话来回答你。如果还不清楚,我再详细解释一下:
一般种群的概念在某种意义上类似于随机变量的概念(概率分布规律、概率空间),因为它完全受一组特定条件的制约。
一组特定的条件会产生一个静止过程。如果它是不确定的,那么就不存在总体,也就不存在真正的分布。逻辑大致是这样的。当然,我也可能是错的。
根据你的回答--答案是错的。顺便说一下,我希望能看到您作出上述陈述所依据的矩阵的参考文献。如果你没有(即你不知道为什么要删除离群值以及离群值如何影响分布),那么我建议你,就像你之前对我说的那样,去学习材料。对于大的离群值,一切都很清楚,你指出应该对它们进行检查(这种检查可以发现引号中的缺口)是对的,但问题不在于它们,而在于 3-4-5 sigma。同样有趣的是,即使不涉及是否应删除异常值的问题,我认为删除异常值的方法(至少根据上述书籍,尽管它并没有说明所有内容)也是一项非常庞大和漫长的工作,而且相当复杂。
一组特定条件会产生一个静止过程。如果它是不确定的,就不存在总体,因此也就不存在真正的分布。逻辑大致是这样的。当然,我可能是错的。
根据维基百科的解释:一般人群是研究人员选择用于分析的一组数值。研究人员可以通过任何规则,包括 "静止性 "这样可疑的规则,对总体进行抽样。在统计概念之外选择规则是正常的,例如 "用卢布购买欧元的所有交易"。这些交易是由某种经济过程产生的,而我们只知道大概的经济过程,我们不知道交易的数量。这两种情况使我们认为非平稳性是货币报价的主要特征,其余的都是其标志。
对于大的离群值,一切都很清楚,您也正确地指出,应该对它们进行检查(这种检查可以发现报价中的缺口),但发言(和问题)不是关于它们,而是关于 3-4-5 个等值线。
此外,我还带来了 100 根蜡烛图的欧元-美元货币对 D1 报价柱状图。
以下是样本的描述性统计
此外,Close 值中的一个值持续变为 3 sigma、5 sigma 和 5 average。
我们看到
1. 左撇子随处可见。
2.直方图列数发生变化,尽管每 100 根蜡烛图都指定了 20 个区间 3.
3. 正态拟合的 p 值以及拟合的置信区间相应发生变化。
其中一半是错误的,另一半是低估的,还有一些是正确的。这就是为什么应该用专业文献来核对维基,并由教育部等部门推荐。稍后,我将从统计学百科辞典中写出一个定义。我觉得你完全搞糊涂了。
人口是研究人员选择用于分析的一组数值。
其中一半是错误的,另一半是轻描淡写的,还有一些是正确的。因此,最好用专业文献对《维基》进行核对,并由教育部推荐,等等。稍后,我将从统计学百科辞典中写出一个定义。我觉得你完全糊涂了。
只有当所有现有数据都被提取出来,并且已知没有其他数据时,才会出现这种情况。否则,如果我抽取 10 根蜡烛,那就是样本人群,而不是一般人群。例如,当你测量一台机器的功耗时,已知明天会有新的数据--永远不会有普通人群。一般人群会对其进行评估(样本)--请阅读有关评估的内容。在估算时,它并不符合正常规律(如果不知道它是正常规律的话),而是通过特殊的方法来确定规律,而在未知的情况下,如何才能去除某些东西呢(我给了你一本书的链接--书中有这方面的记载)。而且,对它的进一步评估不是通过一个样本,而是通过几个样本,对特殊测试等进行比较。不幸的是,你只顾自己断章取义,而不去理解我帖子的意思。我再说一遍。在外汇交易中,选择一般人群的规则是所有我们不知道的交易。我对百科全书和维基百科中的定义不感兴趣--我感兴趣的是预测,而不是一般人群的统计属性。在您的压力下,我几乎陷入了植物学的私通,甚至跑到 STATISTICS 软件包中查看 "普通人群 "的定义:这个世界著名的软件包并不考虑这个概念。
排放清理。给出了排放物对拟合效果的具体影响,仔细看。如果不去除排放物,就会得到错误的拟合结果,这就是问题的关键所在,而且很有可能具有非常好的特性。如果改变离群值,规律参数或规律都会发生变化,而这一切都是因为样本中的一两个值。拟合之后,就没有必要清理数据了。
您最好还是阅读有关计量经济学 的教科书和更好的软件包文档,而不是有关数理统计的教科书和文档--这将提高您的理解能力。任何计量经济学软件包都是从准备分析数据开始的,而不是反过来,先拟合再准备数据。
.:)我只是不想误导读者,但我希望有需要的读者能弄明白。
好吧,我不打扰你们了。
我不认为这是正确的决定
任何软件包都只是一个工具,仅此而已。我们似乎在说不同的语言。
请原谅我让你对软件包提出建议。在理论争论中,比如在论文和毕业论文中,你的方法很有道理,比我的方法更可取。但我们面临的是一个实际问题,而软件包不仅仅是一个工具,而是一个系统,在这个系统中,许多概念汇集在一起,从而产生一个实际的结果。我们得到的不仅仅是对术语的明确解释,还有对术语的明确计算。文章的作者提到了 GARCH,这是一个非常宽泛的概念,比 "一般人群 "更不明确。
希望您能继续参与这个话题。