交易中的机器学习:理论、模型、实践和算法交易 - 页 2427

 
Aleksey Vyazmikin:

好吧,既然我在做一个脚本来准备数据,我还是需要做一个文件,列出被排除的列,其中包括。

1.有相关预测因素的列(顺便问一下,你如何选择放弃哪一列,比如5个相关的预测因素?)

2.从第一个文件表中丢弃的列,除了有目标的那一列。

另外,带有目标标签的列应该被写入文件,最好是按列名搜索。

该文件的结构如下

让这成为你的家庭作业)...
代码有这方面的一切。
对于问题,有stackowerflow网站和其他 ...
不要折磨老人))。
 
Aleksey Vyazmikin:

我需要在更短的时间内选择正确的预测器。如果再去看预测器,就会使处理时间增加一百倍。我的方法是基于这样的逻辑:一个好的预测器(包括适合特定学习方法的预测器)将被模型在 所有样本区间 要求,这就消除了对样本区的拟合。

为了让它在所有人身上都有,我们需要交叉验证。而你只能通过测试或考试来检查。
如果你在10%的样本上进行交叉验证,你必须训练10次,而不是数百次。而如果你做了20%,你必须教5次。

 
elibrarius:

你必须用验证法进行交叉检查,才能做到这一切。而你只能通过测试或考试来检查。
如果你在10%的样本上进行交叉验证,你需要训练10次,而不是数百次。如果是20%,那么就是5倍。

我把样本分成8个部分,为每个部分建立100个不同的模型,然后分析这些模型,看看哪些预测因子是有需求的--意味着它们被用来找到一个模式,我对估计值进行平均,然后用剩余的预测因子来训练整个样本。这背后的逻辑是,一旦这些预测因素的模式在某一特定区域被发现,那么模型将能够在整个样本中均匀地 概括这些预测因素,而不是像通常的情况那样对样本的区域进行调整。

你的方法是在小部分样本上建立模型,在每一部分样本上建立的模型都是不同的,因为会选择适合特定训练领域的最佳预测器,考虑到样本并不完美(具有代表性),我们可以说这种方法只调查了部分可用的信息,这些信息在未来可能会重复也可能不会重复,我的方法将允许学习更多关于市场的信息,过度训练将减少。此外,如果在CatBoost中不固定量子表,那么在一般情况下,每次训练都会在不同的预测器上进行,因为具体的样本地点的量子表的构造不同。

 
mytarmailS:

现在是对第一个问题的回答

我不知道哪里出了问题--它在骂人。

Error in get.findCorrelation(data = df1, not.used.colums = c("Target_100_Buy",  : 
  could not find function "get.findCorrelation"
 
Aleksey Vyazmikin:

我不知道哪里出了问题--它在骂人。

运行代码来创建一个函数,然后运行函数本身
 
mytarmailS:
运行函数创建代码,然后运行函数本身。

它成功了,谢谢你。

mytarmailS:
让它成为你的家庭作业)...
该代码有它的一切...
有stackowerflow和其他网站的问题...
不要折磨一个老人))。

我只能用具体的例子来搞清楚,否则我最好在MQL中解决这个问题。

 
现在最神秘的论坛话题是心灵感应的交流。
他们毕竟训练了机器--机器给了他们超能力。


 
账号_
现在最神秘的论坛线程,有心灵感应的交流。
他们毕竟训练了机器--机器给了他们超能力。


是的,我还以为我在幻想呢 :-)好吧,这是一个很好的谈话,最重要的是信息量很大 :-)
 
没有人承认这里教的是什么机器,或者是什么
 
Vladimir Baskakov:
没有人承认这里教的是什么机器,什么

我还想知道,为什么每个卖他那可恶的平均机的稻草人都认为在这个主题中宣传自己是他的责任,这是一种启蒙教育还是什么?))