贝叶斯回归 - 有没有人用这种算法做了一个EA? - 页 46

 
Yuri Evseenkov:

对应用贝叶斯公式的尝试。再一次。

任务。使用贝叶斯定理,确定尚未到达的刻度线的哪个值最有可能。

鉴于。时间序列x,y。

y=ax+b 从最后一个刻度到未来的直线。

P(a,b|x,y)=P(x,y|a,b)*P(a)*P(b)/P(x,y);(1)贝叶斯公式。

P(a,b|x,y)是系数a和b对应于未来刻度的x和y坐标的概率

我们需要找到这样的a和b,使这个概率(或者更正确地说,一个概率测量)是最大的

P(x,y|a,b) - 让我们把按价格水平分布的真实直方图作为一个似然函数。该函数由一个二维数组(矩阵)定义:价格范围--概率,落在该范围内的点数与总点数的百分比比。

P(b) - 增量的正态分布被当作先验概率b。使用具有正态分布值的PRNG。

P(a) 系数a决定了直线的斜率和预测增量的符号。到目前为止,我正在考虑使用我之前发布的线性回归 代码。即把那里发现的系数a的概率看作是统一的。在(1)中,用考虑到这个a和给定y的计算结果的差异而计算出的概率P(a)代替。

也许你对每个刻度的增量符号的表现有一些想法?


勾勒出2个指标,正在研究虱子。第一个定义了线性回归的A和B(为了以防万一,分别为买入和卖出),并画了一条线。第二张是Tick值的直方图(红色 - Ask,蓝色 - Bid)。勾股图的每个条形是一个新的勾股,它们与图表本身的条形不重合。

这是我从该帖子中了解到的全部内容。下一步是什么?如果我理解了这个逻辑,我就会完成它。


附加的文件:
 
Dr.Trader:

在我看来,使用点数进行预测是很危险的,应该为每个经纪人分别建立模型。

关于实际的刻度线--它们在不同的经纪商之间可能有很大的不同。

我同意。我在上面写道。我再说一遍。

外汇是很多经纪公司,外汇公司,套件 - 欧洲,中国,巴哈马,百慕大...有很多这样的人。他们中没有一个人占主导地位,也没有对价格的形成做出决定性的贡献,市场上的任何参与者也没有。该假设是基于概率论的中心极限定理(CLT)。

"足够多的弱依赖性随机变量的总和具有大致相同的幅度(没有单一的总和占主导地位,对总和没有决定性的贡献),其分布接近正态。"(维基百科)。

按照我对外汇的理解,它与外汇有关。如果我们把所有经纪公司的所有点数都收集在一个M5柱子里(数以百万计的点数),那么柱子内的点数分布将接近正态。 时间框架越长,它就越接近。 每个特定的经纪公司都有自己的报价流,通过该经纪公司的贬值措施与主导的全球流有所不同。图表上的这一主导流向是一条曲线(当然不是直线!),任何经纪公司都不可能从这里走远。

在这个问题上,人们对维基百科上关于CDT的表述持怀疑态度。在我看来,这也是不正确的。尽管此后我在其他资料中也遇到过这种表述。甚至MQL4参考文献中也有一个根据这种措辞的指标实例。

因此,我认为TPT的规则是在基本因素影响较弱的时期,有足够多的增量。

 
Dr.Trader:

勾勒出2个指标,正在研究虱子。第一个定义了线性回归的A和B(分别为买入和卖出,以防万一),并画出一条线。第二张是Tick值的直方图(红色 - Ask,蓝色 - Bid)。勾股图的每个条形是一个新的勾股,它们与图表本身的条形不重合。

这是我从该帖子中了解到的全部内容。下一步是什么?如果我理解了这个逻辑,我就会完成它。


我想用贝叶斯公式来计算概率。线性回归 和发现的系数a只适用于计算先验概率P(a)。
 

假设有一个参考价格,是由流动性提供者给出的,而经纪人的报价只是围绕着它跳动。在这种情况下,每个经纪人的报价将在 "主要价格 "周围的一些范围内跳舞,在直方图上形成一种圆顶。如果你把圆顶直方图加起来,你最后得到的东西在形状上类似于正态分布,我同意。

但它仍然对我们不起作用,我们正在处理来自一个特定经纪人的报价,而正态分布是不可能的。我观察柱状图有一段时间了,我的经纪人给我最多4000个点(大约是20分钟),我把它们全部用于柱状图。它更像是一个侧卧的半椭圆。如果价格开始上升/下降--椭圆长出了薄薄的一面,但最终又恢复了它的形状。但有时会有两个高峰。你可以尝试用其他分布来描述这个平均数字,并在计算中使用它(而不是高斯)。如果你用少量的刻度线做直方图,例如一百个,那只是一个没有形状的不断跳动的分布,我想这是不行的,你需要一千或更多的刻度线。

这里图片中的直方图有右边的三分之一是价格快速变化的结果,然后整个东西应该采取左边三分之二的形式。

 
Dr.Trader:

假设有一个参考价格,是由流动性提供者给出的,而经纪人的报价只是围绕着它跳动。在这种情况下,每个经纪人的报价将在 "主要价格 "周围的一些范围内跳舞,在直方图上形成一种圆顶。如果你把圆顶直方图加起来,你最后得到的东西在形状上类似于正态分布,我同意。

但它仍然对我们不起作用,我们正在处理来自一个特定经纪人的报价,而正态分布是不可能的。

这是另一个问题。它涉及到实际应用。

在公式(1)中,概率函数P(x,y|a,b)是一个真实的直方图,是一个真实的具体经纪人的真实点击率。例如,如果窗口中12%的点位落入y(price)+range(set),则概率P(x,y|a,b)=0.12。我在配置文件中建立了直方图。



然后是修正乘数,即先验概率P(a)和P(b)。因此,作为P(b),我选择了一个PRIRATE价格的正态分布。为什么呢,这在以前的帖子中已经写了。

 

我读了第一个帖子中的文件,它根本就没有好的结果。

很多公式都无法看懂,所以这里只是自由转述。笔者有一个半年的比特币买卖价格,间隔时间为10秒。他做了一个程序(分类器),将当前的价格,并返回三个信号--买入,卖出,和只是持有未平仓合约。预测的时间是提前10秒。每隔10秒,程序应接收新的数据,并再次全部计数。最初的数据被分成几个向量,它使用这些向量进行价格预测。分类器采取三个数据数组--一个是过去30分钟的数据,第二个是过去60分钟的数据,第三个是过去120分钟的数据(每个数组仍然是10秒间隔的价格)。我再也不明白了。这些公式与神经元学非常相似,即每个输入值都对应着一些权重。但这些权重是同时应用于三个阵列的。然后突然发现找不到权重(但这是一个神经元,不是吗?),我们不得不尝试所有的变体。根据经验,作者推导出一些公式,这应该有助于优化权重,拒绝明显不适合的东西,在某处使用了贝叶斯回归。同时,回归的结果可能被用作分类器的输入值。

在我看来,这就像一个学生的学期论文,在他/她到期前的几个晚上完成。不存在挣钱的问题 :)

虽然使用了贝叶斯回归,但它是作为一些复杂系统的一个小部分存在的。也许由于优化了权重,它的影响降低到了零。我还不如把随机数发生器 放到神经元或玛雅历中,反正他们的影响在优化过程中会减少到零。

 
我无法看懂英文的第一篇帖子。我正试图了解贝叶斯定理在其他领域的例子。而我只是想用贝叶斯公式来计算这个或那个价格的发生概率。 而正态分布根本不是一个必要的属性。这只是到目前为止先验概率之一的假设。
 

我看到了两篇关于该分支主题的文章--可能对爱好者有帮助

第1条。

用STAN进行贝叶斯回归:第一部分正常回归

第二条

用STAN进行贝叶斯回归的第二部分:超越正态性

每篇文章都是为两本同名书籍做的广告

Bayesian regression with STAN: Part 1 normal regression
Bayesian regression with STAN: Part 1 normal regression
  • Lionel Hertzog
  • datascienceplus.com
This post will introduce you to bayesian regression in R, see the reference list at the end of the post for further information concerning this very broad topic. Bayesian regression Bayesian statistics turn around the Bayes theorem, which in a regression context is the following: $$ P(\theta|Data) \propto P(Data|\theta) \times P(\theta) $$...
 

你们--工程师、物理学家、无线电操作员--是如此奇怪.....

我曾多次在这里告诉你们,量化师、替代交易商、做市商--他们不是傻瓜,他们的数学很好,他们的年薪不是10万多GEL+奖金,但你们似乎都不明白。

股票市场的价格是一个连通系统的表现,所以任何有用的(勉强足够的)价格模型都不可能是简单的。是的,里面可以有贝叶斯回归,但只是作为一种辅助的数字方法。而你把一群人扔在 "你的这个尾巴雷克斯,我们将在这里单独用贝叶斯方法践踏它!"。

好吧,也许这能让你明白:大做市商、银行和对冲基金在交易中积极使用的数学方法清单。这份名单还按子专业划分,即按交易的金融工具类型和银行的预测类型划分。这份名单是由花旗银行和摩根大通的一位前高级职员公布的。这个名单不是秘密,你可以从5-10本关于金融数学的书(英文)中弄清楚。但在俄罗斯的论坛上,甚至在如此完整的形式下--名单是罕见的。

数据科学家、统计学家
25000美元
工作描述
专业要求(我们最看重的是在旅途中学习的愿望)。

统计学和时间序列的高级知识:随机过程工具:SSA/SVD,RSSA,FIMA/ARFIMA,非线性自回归外生模型(NARX),(N)GARCH及其衍生物,Hurst指数及其应用,递归量化分析(RQA)。
有Python编程经验(或准备学习)(和一套用于所有统计的库)。
Python中的数据分析库(theano, keras, Torch, Pandas, NumPy, scikit-learn)或其在R中的等价物
在机器学习、协同过滤、聚类分析、图论方面有一定经验
其他混合的方法:ANFIS(基于网络的自适应模糊推理系统)。
神经网络:无监督学习:RNN(递归神经网络)、FNN、RBF等。

任务和环境。
金融数据的统计分析,计量经济学应用

版主:请删除不小心没有快速删除的原文链接,我不行,它还挂在你们数据库论坛的地下室里的帖子。否则他们会认为这是广告。谢谢你。

Все вакансии компании TenViz LLC
Все вакансии компании TenViz LLC
  • www.work.ua
New York, US, based product (services) company with growing sales on 3 continents and 25−35 employees and contractors. We have a growing team in Ukraine, and are hiring full- and part-time people with...
 
机器学习,神经网络分析师
28000 UAH

职位描述

专业要求(我们最看重在旅途中学习的愿望):

人工神经网络和机器学习的知识,包括:

前馈神经网络(FNN)
递归神经网络(RNN)家族。包括长短期记忆模型(LSTM)
CNN - 卷积神经网络
径向基函数(RBF)
混合方法 ANFIS(基于自适应网络的模糊推理系统)
有Python编程经验(或准备学习)(和一套用于所有统计的库)
Python中的机器学习和数据分析库(theano, keras, Torch, Pandas, NumPy, scikit-learn)
此外,对R和/或Matlab的良好知识也有帮助

相关知识领域。

统计学和时间序列的高级知识(随机过程和工具):ARFIMA,非线性自回归外生模型(NARX),小波变换
频谱估计模型 - 奇异频谱分析(SSA)(SVD)
协作过滤,聚类分析,图论

TASKS(优先顺序)。

金融数据的统计分析,计量经济学应用
在大量的金融市场数据上建立交互式分布式查询处理的服务和框架