贝叶斯回归 - 有没有人用这种算法做了一个EA? - 页 39

 
-Aleks-:
这就是你需要考虑的问题--为了使数据相似--在我看来,你应该采取一种模式,而不仅仅是一个n条的窗口。
我完全同意。在分析中采取多少条是不仅是所讨论的回归的阿喀琉斯之踵。虽然我想计算的不是回归,而是用贝叶斯公式计算概率。就目前而言,我将愚蠢地采取目前的n条窗口。而在测试和试验阶段,对于似然函数和先验概率,我将采取从波动率尖峰到波动率尖峰的时期。这通常是重要新闻事件之间的间隔时间。
 
Alexey Burnakov:
我最近在和同事讨论线性回归的 历史和发展。长话短说,最初的数据很少,预测因素也很少。普通线性回归在一些假设下进行管理。然后,随着信息技术的发展,数据量增加,预测器的数量很容易超过几万个。在这些条件下,普通线性回归将无济于事--过度学习。因此,出现了规范化的版本,以及符合分布要求的版本,等等。
这部分是正确的。二级正则化无助于减少模型中预测因子的数量。神经计算最初使用Hebb的学习规则,这导致了神经网络权重的无限增长。然后,意识到大脑在增长和维持神经子单元的权重方面资源有限,在60年代和80年代加入了L2正则化。这使得权重得到了限制,但仍有很多可以忽略不计的权重。大脑中的情况并非如此。在大脑中,神经元并不是与所有其他神经元相连,即使是以可忽略不计的权重。只有有限的连接数量。然后,在2000年代,引入了L1和L0正则化,允许放电连接。成群结队的科学家们开始使用带有L1正则化的线性编程,用于从图像编码到神经模型的一切,这些模型很好地描述了大脑过程。经济学家仍然落后于其他科学,这是因为他们的 "傲慢"(一切都已经在我们之前被发明了),或者仅仅是他们对数学的理解不够。
 
Vladimir:
这部分是正确的。二级正则化无助于减少模型中预测因子的数量。在神经计算中,起初他们使用Hebb的学习规则,这导致了神经网络权重的无限增长。然后,意识到大脑在增长和维持神经子单元的权重方面资源有限,在60年代和80年代加入了L2正则化。这使得权重得到了限制,但仍有很多可以忽略不计的权重。大脑中的情况并非如此。在大脑中,神经元并不是与所有其他神经元相连,即使是以可忽略不计的权重。只有有限的连接数量。然后,在2000年代,引入了L1和L0正则化,允许放电连接。成群结队的科学家们开始使用带有L1正则化的线性编程,用于从图像编码到神经模型的一切,这些模型很好地描述了大脑过程。经济学家仍然落后于其他科学,这是因为他们的 "傲慢"(一切都在我们之前已经发明了),或者只是对数学的理解不深。
我只能把L2误认为是限制性的砝码。而且是山脊(Tikhonov)回归。https://www.quora.com/What-is-the-difference-between-L1-and-L2-regularization

但有时L1变得更好也是因为增加了对绝对误差和非平方的惩罚。误差平方会给出太长的尾巴,也就是说,在报价有重尾的情况下,增加残差平方会对模型的质量有不好的影响。嗯,这只是说说而已。
 
Vladimir:
经济学家仍然落后于其他科学,这是因为他们的 "傲慢"(一切都已经在我们之前被发明了),或者只是对数学的理解不够。
是的,我亲自和一位经理(swd经理)谈过,他以前在股票经纪公司工作。他说,价格递增被认为是正常的,就是这样。使用的是上个世纪的方法和错误观念。我告诉他,那里没有常态。没有一个测试通过。他甚至不知道我们在说什么。但他不是一个铁杆数学家,他是一个开发经理。
 
我有一个怀疑,指标线(如果你不太深入,比如说同一个马什卡)大致上是一条回归线。至少,它是一个粗略的近似值
 
Alexey Burnakov:
是的,我亲自和一位曾经为股票经纪人工作的经理(swd经理)谈过。他说,价格递增被认为是正常的,就是这样。使用的是上个世纪的方法和错误观念。我告诉他,那里没有常态。没有一个测试通过。他甚至不知道我们在说什么。但他不是一个铁杆数学家,他是一个开发经理。
如果没有常态又如何?甚至一些开发经理也写到了这一点,弗拉基米尔在这里写到了这一点。如果你不理解回归的原则或意义,你甚至如何使用回归呢?你像僵尸一样在黑夜里走来走去,有这种常态/正常。它可能是以立方体、正方形、之字形或以Repin的图片形式分布。预测回归的能力并不取决于它。
 
Dmitry Fedoseev:
如果没有常态又如何?甚至一些发展的负责人也写到了这一点,弗拉基米尔在这里写到了这一点。如果你根本不了解回归的原理或意义,你甚至如何使用回归呢?你像僵尸一样在黑夜里走来走去,有这种常态/正常。它可能是以立方体、正方形、之字形或以Repin的图片形式分布。预测回归的能力并不取决于它。
这就是为什么它能做到。晚上更容易思考。甚至高管们也知道这一点。)
 
Yuri Evseenkov:
完全同意。要分析多少条,不仅是讨论中的回归的致命弱点。虽然,我不想计算回归,而是想用贝叶斯公式计算概率。就目前而言,我将愚蠢地采取目前的n条窗口。而在测试和试验阶段,对于似然函数和先验概率,我将采取从波动率尖峰到波动率尖峰的时期。这通常是重要新闻事件之间的间隔时间。

而概率将表达什么,是对下一个条形的预测,还是对下一个条形的运动矢量?

 
一般来说,我们应该首先定义回归的目的:找到一条能最准确描述所选市场片断的曲线,还是预测未来的价格位置?近似值的质量如何决定预测的准确性?
 
Vasiliy Sokolov:
首先,我们应该决定建立回归的目的:挑选一条最能准确描述所选市场区块的曲线,还是预测未来的价格位置?近似的质量如何决定预测的准确性?

而你如何建立一条在描述过去时尽可能准确、在预测未来时尽可能准确的曲线?

或者说,不分析过去,你怎么能预测未来?

近似是对过去的分析