交易中的机器学习:理论、模型、实践和算法交易 - 页 3081

 

这篇文章完美地诠释了广告对微不足道的结果的宣传。

标题"因果 效应"就戳中了我们的落后,因为在研究各种正弦时,我们并没有意识到这是因果 效应 从输入数据到正弦 输入并得到结果的结果。

笔者以RF 为例,向输入端输入数据,得到的结果是错误的。

为了让大家意识到我们正在处理 MO 的一个全新方向,那么输入数据(预测因子)被称为协变量,RF 算法 被称为元学习器,整个过程被称为因果 Effects。

因果 Effects 的辩护者没有意识到,有时在俄语中,协变量是指那些不仅对目标变量有影响,而且对相邻预测变量也有影响的预测变量,也就是说,应该更准确地使用这一术语,以避免歧义。

RF 算法称为 "元学习器 "是因果 Effects 的另一个宣传噱头,因为该算法产生的规则肯定不是学习器。但从广告的角度来看,机器学习 应该有 学习者,而且 "元 "和 "basta "都很重要。

论文详细说明了选择RF 作为基础 算法的理由,特别指出可以使用任何(?)MO 算法来代替RF。作为对这一思想的概括,文中使用了 "讨厌"(nuisance)一词,即令人不快、讨厌、 恼人 。如果用文字表述,或许应译为 "噪声的函数",即射频 算法 是 "噪声的函数"。但这听起来是多么复杂和美妙啊!最重要的是,读者以前认为射频 算法产生的规则有一定误差,现在却乐在其中。

我们还可以继续说下去,但上述内容足以让我们将所有这些因果 效应 归结为纯粹的广告,顺便说一句,这种广告非常成功,因为真正的无稽之谈卖出了好价钱,并在斯坦福大学获得了教授的职位,得到了想要跟上新的先进潮流的追随者。

那么,谁是所谓的 ME 最新前沿趋势的作者呢?从参考文献的数量来看,维克多-切尔诺茹科夫(Victor Chernozhukov)是一个没有受过任何教育的人,90 年代初毕业于一所农业学院。我清楚地记得那个时候,数以百万计的切尔诺茹科夫人在没有受过教育、没有事实根据的意识的呐喊声中,奔走相告,胡作非为,其中许多人成了亿万富翁和政界要人。


今天,整个世界都生活在广告的法则之下,所有的领域都以为 MO 会通过这个杯子。但事实并非如此。

 
СанСаныч Фоменко #:

这篇文章完美地诠释了广告对微不足道的结果的宣传。

因果 效应"这个名字本身就戳中了我们的落后,因为我们在研究各种正弦时,并没有意识到这是因果 效应 的结果, ,从输入数据到 输入并得到结果。

作者以RF 为例,给出输入数据并得到错误结果。

为了让大家意识到我们正在处理 MO 的全新方向,我们将输入数据(预测因子)称为协变量,将RF 算法 称为元学习器,将整个过程称为因果 Effects。

因果 效应 的辩护者没有意识到,有时在俄语中,协变量是指那些不仅对目标变量有影响,而且对相邻预测变量也有影响的预测变量,也就是说,为了避免歧义,应该更准确地使用这一术语。

RF 算法称为 "元学习器 "是因果 Effects 的另一个宣传噱头,因为该算法产生的规则肯定不是学习器。但从机器学习的广告角度来看,"元 "和 "basta "的重要性 应该 得到学生们的认可。

论文详细说明了选择RF 作为基础 算法的理由,特别指出可以使用任何(?)MO 算法来代替RF。作为对这一思想的概括,文中使用了 "讨厌"(nuisance)一词,即令人不快、讨厌、 恼人 。如果用文字表述,或许应译为 "噪声的函数",即射频 算法 是 "噪声的函数"。但这听起来是多么复杂和美妙啊!最重要的是,读者以前认为射频 算法产生的规则有一定误差,现在却乐在其中。

还可以继续说下去,但上述内容足以将所有这些因果 效应 纯粹归结为广告,顺便说一句,这种广告非常成功,当真正的胡说八道被卖出并在斯坦福大学获得教授职位时,就会得到想要跟上新的先进趋势的追随者。

那么,谁是所谓的 ME 最新前沿趋势的作者呢?从参考文献的数量来看,维克多-切尔诺茹科夫(Victor Chernozhukov)是一个没有受过正规教育的人,90 年代初毕业于一所农业学院。我清楚地记得这个时代,当时数以百万计的切尔诺茹科夫人在没有受过教育、没有事实根据的意识的呐喊下,奔走呼号,胡言乱语。


今天,整个世界都生活在广告的法则之下,所有的领域都以为 MO 会通过这个杯子。但事实并非如此。

谢谢你的分析,因为我没看。关于同一主题的视频已经足够了。
[删除]  
СанСаныч Фоменко #:

这篇文章完美地诠释了广告对微不足道的结果的宣传。

因果 效应"这个名字本身就戳中了我们的落后,因为我们在研究各种正弦时,并没有意识到这是因果 效应 的结果, ,从输入数据到 输入并得到结果。

作者以RF 为例,给出输入数据并得到错误结果。

为了让大家意识到我们正在处理 MO 的全新方向,我们将输入数据(预测因子)称为协变量,将RF 算法 称为元学习器,将整个过程称为因果 Effects。

因果 效应 的辩护者没有意识到,有时在俄语中,协变量是指那些不仅对目标变量有影响,而且对相邻预测变量也有影响的预测变量,也就是说,为了避免歧义,应该更准确地使用这一术语。

RF 算法称为 "元学习器 "是因果 Effects 的另一个宣传噱头,因为该算法产生的规则肯定不是学习器。但从机器学习的广告角度来看,"元 "和 "basta "的重要性 应该 得到学生们的认可。

论文详细说明了选择RF 作为基础 算法的理由,特别指出可以使用任何(?)MO 算法来代替RF。作为对这一思想的概括,文中使用了 "讨厌"(nuisance)一词,即令人不快、讨厌、 恼人 。如果用文字表述,或许应译为 "噪声的函数",即射频 算法 是 "噪声的函数"。但这听起来是多么复杂和美妙啊!最重要的是,读者以前认为射频 算法产生的规则有一定误差,现在却乐在其中。

还可以继续说下去,但上述内容足以将所有这些因果 效应 纯粹归结为广告,顺便说一句,这种广告非常成功,当真正的胡说八道被卖出并在斯坦福大学获得教授职位时,就会得到想要跟上新的先进趋势的追随者。

那么,谁是所谓的 ME 最新前沿趋势的作者呢?从参考文献的数量来看,维克多-切尔诺茹科夫(Victor Chernozhukov)是一个没有受过正规教育的人,90 年代初毕业于一所农业学院。我清楚地记得这个时代,当时数以百万计的切尔诺茹科夫人在没有受过教育、没有事实根据的意识的呐喊下,奔走呼号,胡言乱语。


今天,整个世界都生活在广告的法则之下,所有的领域都以为 MO 会通过这个杯子。但事实并非如此。

这只是你的专业无能的神化,当新的信息不进入碗。或者翻译有问题。我只能表示同情:)

 
Maxim Dmitrievsky #:

当新信息再也不能以任何方式进入碗中时,这只是你亵渎的极致。或者是翻译问题。我只能表示同情)

所有术语都被扭曲,基本信息被歪曲得面目全非。

你能向普通人传达未被扭曲的信息吗?

 
СанСаныч Фоменко #:

...

论文详细论证了选择 RF 作为基本 算法的理由,特别规定可以使用任何(?)MO 算法来代替 RF。作为对这一思想的概括,文中使用了 "讨厌"(nuisance)一词,即令人不快、讨厌、恼人。如果用文字表述,或许应译为 "噪声的函数",即射频算法是 "噪声的函数"。但是,这听起来多么复杂和美妙,最重要的是,读者以前认为射频算法产生的规则有一定的误差,现在却乐在其中。

...

我在阅读时一直在寻找这一切的实际应用--那么你没有找到吗?

在我看来,这篇文章应该是提供了一种工具,用于评估总体样本区域与训练时所使用的样本之间的偏差测量。因此,有了这个工具,就有可能发现样本中的异常部分。你认为它是否存在?

[删除]  
Aleksey Vyazmikin #:

你能向平民传达不掺杂任何杂质的信息吗?

我很同情

 
СанСаныч Фоменко #:

以为我在吹箫 .....哦,不。

我也是这么想的))

这些意味深长的话描述了整个主题
 
Aleksey Vyazmikin #:

我阅读并搜索了这一切的实际应用--所以你没有找到?

在我看来,这篇文章应该提供一种工具,用于评估测量样本总面积与进行训练的样本的偏差。因此,有了这个工具,就有可能发现样本中的异常部分。你认为它是否存在?

文章中没有。

它描述的是对原始预测因子进行不同划分的常规拟合,包括交叉验证。这是一个用文字伪装起来的例程。

 
СанСаныч Фоменко #:

文章里没有。

文章介绍了对原始预测因子进行不同划分的常规拟合方法,包括交叉验证。用文字伪装的套路。

感谢专家意见。

 
Maxim Dmitrievsky #:


而干扰函数(或参数)不是噪声函数,而是辅助函数,它们不是特定任务的目标函数


能否在文章中提供这些 "辅助 "函数的链接?

与此同时,文章还相当详细地介绍了使用 RF 的原因,RF 被称为基本函数,它的工作结果是计算大量信息:

随机森林(randomForest) 的一个对象,它是一个包含以下组件的列表:

调用

randomForest 的原始调用

类型

回归 分类 无监督之一

预测值

根据袋外样本预测的输入数据值。

重要性

一个 包含 nclass + 2 列(分类)或 2 列(回归)的矩阵。对于分类, nclass 列是 以准确率平均下降率计算的特定类别度量。nclass + 1 列是所有类别的准确度平均下降率。最后一列是基尼指数的平均下降率。对于回归,第一列是准确度下降的平均值,第二列是 MSE 下降的平均值。 如果 重要性=FALSE,最后一个测量值仍将作为向量返回。

重要性SD

基于置换的重要性度量的 "标准误差"。对于分类,是 一个 p nclass + 1 矩阵 ,与重要性矩阵 nclass + 1 相对应。对于回归,是一个 长度 为 p 的 向量

局部重要度

一个 p 乘 n 的矩阵,包含个案重要性度量,其中 [i,j] 元素表示第 i 个变量在第 j 个个案中的重要性 如果 localImp=FALSE 为空。

生长的树数。

mtry

在每个节点进行拆分时采样的预测因子个数。

森林

(包含整个森林的列表 如果 randomForest 以无监督模式运行或 keep.forest=FALSE 为 NULL。

错误率

(仅用于分类)输入数据的预测误差率向量,第 i 个元素是第 i 个之前所有树的(OOB)误差率。

混淆

(仅分类)预测的混淆矩阵(基于 OOB 数据)。

票数

(仅用于分类)一个矩阵,每行代表一个输入数据点,每列代表一个类别,给出随机森林的(OOB)"投票 "分数或数量。

OOB.times

案例 "出包 "的次数(因此用于计算 OOB 误差估计值)。

邻近度

如果 调用 randomForest proximity=TRUE,则为输入数据的接近度矩阵(基于数据点对位于相同终端节点的频率)。

mse

(仅回归)均方误差向量:残差平方和 除以 n。

rsq

(仅回归)"伪 R 平方":1 - mse / Var(y)。

测试

如果给出了测试集(通过 xtest 附加的 ytest 参数 ),该组件是一个列表,包含测试集的 相应 预测值 误差率、混淆度 票数 用于分类) 预测值 mse rsq 用于回归)。 如果 proximity=TRUE ,还有一个组件 proximity 其中包含测试集之间以及测试和训练数据之间的邻近度


我们不知道作者在上述列表中具体使用了什么,但在使用 RF 时,根本没有其他来源可用于确定分类或回归误差,也没有必要使用其他来源。

不同的输入数据组合会产生不同的 RF 误差。这就是作者所研究并得出结论的误差方差和某种不知道如何计算的偏差。