交易中的机器学习:理论、模型、实践和算法交易 - 页 2526

 
Aleksey Nikolayev#:

例如,如果1<=t1<=t2<n,那么ACF(t1,t2)=sqrt(t1/t2)。

我还有一个问题。这里我们考虑的是无限大的样本中相邻值的ACF。例如,t1=1,t2=2。我们得到ACF=sqrt(0.5) ~ 0.707。现在我们采取其他相邻的数值,例如,t1=10000,t2=10001。我们得到ACF=1(几乎) 事实证明,相邻的数值之间的关联性不同。这是否正常?

 
LenaTrap#:

说实话,我根本无法理解什么。

p.s 也许一些超级聪明的数学家会怜悯我并解释这里发生了什么?

你不需要一个 "超级聪明的数学家 "在贸易中.....

DL有3层--内部(隐藏)手柄t时刻分别是外部t-1和t+1...- 因此,自相关是可能的...我认为...我是这样认为的

虽然在我看来,出于某种原因,如果我们不采取一个特征在时间上的delta变化,而是采取一些指数--那么,也许,这些相交的值在时间空间上的自相关的影响可以在某种程度上得到平衡......有待商榷...因为close(t)/close(t-1)也有交集,因此有自相关......。尽管在TF>15分钟时,自相关似乎消失了(没有观察到)--我自己没有亲自检查过......而这还不是我需要的索引......

在用足够的TF对价格走势进行建模时,祈求自相关是没有用的......而且在每一个tick之后使用一个模型是没有意义的(如在推导规律性,更多的是长期规律性)......我认为(但在概率上更公平)...

但是,递归神经网络只向前传递信息(随着玻尔兹曼机的出现,开始被用于多层概率学习)...虽然已经响起

递归网络和贝叶斯方法本身既没有表现出从金融时间序列中提取 "记忆 "的能力,也没有在新数据上获得关于最稳健模型的结论。

这就是为什么在实际问题中使用带有误差反向传播及其dy/dx最小化的递归网络的原因(因为它们允许执行整合,只是因为它们的dy/dx最小化能力)。

p.s.

一般来说,对我来说--这是同样的蒙特卡洛方法--只是通过机器...我还没有看到使用反向传播寻找前进的新东西......纯粹是术语上的......

p.p.s

除了使用Theano,你可以在不太使用PC资源的情况下进行尝试(尽管TensorFlow已经被吹捧过)...

什么是Y,什么是X是由开发者决定的(无论是先验的还是统计分析的结果)...如果你精通python -- 在sklearn中,即使是二合一的特征也已经在一些方法中实现了? 例子! -- 特征的重要性自己做,而ML也自己做 -- 几行就可以了(就像你在几行中发现corrcoef)。

 
LenaTrap#:

在真正的市场上?就个人而言,我有这样的某种哲学

*但不太愿意讨论,因为没有证据,讨论假设是没有用的

在真正的交易中--不要曲解意思......

是的,哲学对每个人来说确实是不同的......统计学的目的是为了解释方差

并将独立测试的依赖关系正式化

 
医生#:

我还有一个问题。考虑在一个无限大的样本中相邻值的ACF。例如,t1=1,t2=2。我们得到ACF=sqrt(0.5) ~ 0.707现在我们采取其他相邻的数值,例如,t1=10000,t2=10001。我们得到ACF=1(几乎) 事实证明,相邻的数值之间的关联性不同。这是否正常?

没错,就是这样。这是谈论SB的非平稳性的第二个原因(第一个原因是方差随时间增长)。只有在静止过程中(根据其定义),ACF才只取决于时间差ACF(t1,t2)=ACF(t1-t2)。这就是为什么对于静止数列,ACF通常被写成一个参数t1-t2的函数。

 
文件编号

当然,这个问题应该是向阿列克谢提出的。但我会回答 "随便"。我假设问题是,SB的行进路径与sqrt(t)成正比。

所指的是著名的 "玩家的废墟 "问题。例如,可用于检验价格 "渴望 "达到某些水平的效果的统计学意义。

 
Aleksey Nikolayev#:

这意味着著名的 "玩家爆仓 "问题。例如,它可以用来测试价格 "渴望 "达到某些水平的效果的统计意义。

这就更有意思了。

也许我们应该放弃 "市场是时间序列 "的观点,最终在市场分析方面有所突破。

 
Aleksey Nikolayev#:

没错,就是这样。这是谈论SB的非平稳性的第二个原因(第一个原因是分散性随时间增长)。只有对于静止过程(根据其定义),ACF才只取决于时间差ACF(t1,t2)=ACF(t1-t2)。这就是为什么静止数列的ACF通常被写成一个参数t1-t2的函数。

好的。让我以另一种方式提出这个问题。下面描述的两种情况是否彼此不同?

1)我们有一个无限大的样本。考虑两个时间时刻n和(n-t)。考虑到1<=(n-t)<=n。计算ACF((n-t),n)=sqrt((n-t)/n)

2)我们有一个长度为n的样本。计算滞后t的样本ACF:ACF(t)=sqrt((n-t)/n)

 
JeeyCi#:

虽然在我看来,出于某种原因,如果你不采取特征随时间变化的三角洲,而是收缩一些指数--那么也许这些重叠的值在时间空间中的自相关的影响可以以某种方式得到平衡......有待商榷...因为close(t)/close(t-1)也有交集,因此有自相关......。尽管在TF>15分钟时,自相关似乎消失了(没有观察到)--我自己没有亲自检查过......而且这还不是我需要的索引......


你可能真的不需要它,但在任何趋势下,时间序列数据开始显示自相关,有时非常高,这在理论上应该干扰许多分析模型/神经网络。

这种效果真的很难用于预测,因为没有什么是持久的,趋势随着等级的变化而变化,混乱随着顺序的变化而变化,随机游走的时间序列突然可能完全不游走,反之亦然,通过这样的估计,你无法理解过程的结构,这太简单了,这就像在200SMA上方交易一样。

但也许仍然值得检查一下你的神经网络对自相关的反应,如果存在自相关并对其造成干扰,则尝试将其删除。相邻的元素根本不应该有任何重叠(如果这是我的想法?),如果你使用这样的数据,如果模型成功,那将是一个伟大的奇迹。

 
LenaTrap#:

你可能真的不需要它,但对于任何趋势,时间序列数据

不要歪曲:想和我争论,你还在说你的...只是关于时间序列...(而且没有人取消抽样方法)...

价格的长期性不是时间的函数,我已经不止一次提出我的观点(我不会重复)......我向你展示了在DL中可以得到自相关的地方......以及对X和Y使用什么,以及用于建立什么依赖关系的模型--我也写了10次了--这是由开发者决定的......

我不是你的模型的开发者--我不需要证明价格随时间变化的行为......。(也许我不应该在DL上乱写乱画--这里的每个人都在思考着什么,并反驳它或向别人证明什么--从每一个学科中抽取一个字)...做MO的工程师(这里没有)仍然会理解自动相关辩论的狭隘性(为了书呆子的谈话),无论是在趋势中还是在勾股中,如果模型建立在一个更广泛的方面,在更广泛的学习集的地平线上,而不是你的跳蚤(自动相关)可以出来的地平线...这就是深度学习的作用(说明一切)。

...对我来说,交易的问题不是一个问题。

Aleksey Nikolayev#:

著名的 "玩家的废墟 "问题。

.........这就是为什么我长期以来一直在回避这些废话......已经发现,这里没有人对建模有任何了解,而那些有了解的人,不会在这个线程上浪费时间......好吧,网络上有很多有用的DL资料,而不是你在这里毫无理由地吐出的那些公然的专业术语......

对于统计学,你真的应该更好地与学术数学家交谈,这不是我应该回答的......- 我对你认为自相关统治DL的观点不感兴趣...- 这是我第五次写 "这是一个糟糕的模型"(我不想写第十次)......让你的学术界来回答你(如果我的回答让你想证明什么)。

 
医生#:

嗯,好吧。让我以另一种方式提出这个问题。下面描述的两种情况是否彼此不同?

1)我们有一个无限大的样本。考虑两个时间时刻n和(n-t)。考虑到1<=(n-t)<=n。计算ACF((n-t),n)=sqrt((n-t)/n)

2)我们有一个长度为n的样本。我们计算滞后t的样本ACF:ACF(t)=sqrt((n-t)/n)

不同的是,在第一种情况下,ACF考虑了所有可能的时间时刻对,而在第二种情况下,其中一个时间时刻是固定的t2=n,许多时间时刻对 例如,一对t1=1,t2=2)被排除在考虑之外。一般来说,ACF是两个参数的函数。只有静止过程的ACF可以被视为一个参数t=t1-t2(滞后)的函数。

样本ACF总是从一个过程的特定数字样本(实现)计算出来的,并且总是变成一个参数(滞后值)的函数。这就是为什么对SB实施的样本ACF不是对其ACF的估计的主要原因)