文章 "机器学习模型的变量评估和选择" - 页 4

 
JulInParis:

嗨,弗拉德、

我正在尝试一步步重新运行您的示例。

输入数据 部分,In(p=16)函数 处理一个价格对象。它的 R 格式或类别是什么(zoo、xts 或 dataframe)?没有这些信息,就无法运行x <- In(p=16) 命令...

致以最崇高的敬意

朱利安

你好,朱利安、

> class(price)
[1] "matrix"
> colnames(price)
[1] "Open"  "High"  "Low"   "Close" "Med"   "CO"

我是 Rstudio 的用户。Откройте его в Rstudio и проводите эксперименты.

Удачи

附加的文件:
EURUSD30.zip  302 kb
 
Zhi Long Yang:
非常感谢文章作者。我刚刚开始就遇到一个问题。我安装的是RStudio,不是作者建议的Revolution R Open 3.2.1。“RandomUniformForests”包和“RoughSets”包已经加载,但是nearZeroVar()函数和findLinearCombos() 函数无法正常调用,这些函数是Revolution R Open特有的么?

Revolution R Open(现在由微软维护,改名为MRO)相当于R的一个加强版。RStudio只是一个IDE,不能和R相提并论。所提两个函数在作者原文中很清晰标明是caret包的函数。另,原文作者使用俄语,或许英文尚且能交流,用中文似乎沟通不上。
 

Смотрите  caret::nearZeroVar () // caret::findLinearCombos () 

Удачи

 
Vladimir Perervenko:

你好,朱利安、

> class(price)
[1] "matrix"
> colnames(price)
[1] "Open"  "High"  "Low"   "Close" "Med"   "CO"

您可以使用 Rstudio。Откройте его в Rstudio и проводите эксперименты.

Удачи



大家好、


谁能告诉我ZZ函数 变量 中定义的--Dig--是什么意思?如果是,这个常数的值应该是多少?

 
hzmarrou :


亲爱的各位、


谁能告诉我ZZ函数 变量 中定义的--Dig--是什么意思?如果是,这个常数的值应该是多少?

我已经在下一个分支中回答了你。
 

弗拉基米尔,你好、


请原谅我提出这个愚蠢的问题,但我目前正试图从您的好例子出发,构建我自己的(非常简单的)模型,我想知道您为什么要在 ZZ 函数中将 ZZ 的差值前移:




dz <- zz %>% diff%>% c(0,.)

......我的意思是,毕竟我们想要训练一个模型来预测 Zigzag 的未来值,那么使用预测器(技术指标)来训练一个模型有什么意义呢?这些预测器(技术指标)总结了 N 日结束时的市场报价,目标值是 N 日的 Zigzag 值与其 N-1 值之差的符号(这就是你在移位后所做的)?难道我们不应该使用第 ( N+1) 天的 Zigzag 值与第 N 天的 Zigzag 值之差的符号来代替吗(即我们不需要移位)?

我知道我一定是在您的方法论中遗漏了什么显而易见的东西,但如果您能花 5 分钟时间向我解释清楚,我会非常高兴。


致以最崇高的敬意。


朱利安

 
JulInParis :

弗拉基米尔,你好、


请原谅我提出这个愚蠢的问题,但我目前正试图从您的好例子出发,构建我自己的(非常简单的)模型,我想知道您为什么要在 ZZ 函数中将 ZZ 的差值前移:




dz <- zz %>% diff%>% c(0,.)

......我的意思是,毕竟我们想要训练一个模型来预测 Zigzag 的未来值,那么使用预测器(技术指标)来训练一个模型有什么意义呢?这些预测器(技术指标)总结了 N 日结束时的市场报价,目标值是 N 日的 Zigzag 值与其 N-1 值之差的符号(这就是你在移位后所做的)?难道我们不应该使用第 ( N+1) 天的 Zigzag 值与第 N 天的 Zigzag 值之差的符号来代替吗(即我们不需要移位)?

我知道我一定是在您的方法论中遗漏了什么显而易见的东西,但如果您能花 5 分钟时间向我解释清楚,我会非常高兴。


致以最崇高的敬意。


朱利安

问题是正确的。文章中有一个错别字。应该是这样的

1. 计算输入

 x <- In(p = 16 ) 

2. 计算目标

 out1 <- ZZ(ch = 25 )
 

> head(out1) zz sig [1,] 84.213 0 [2,] 84.199 -1 [3,] 84.185 -1 [4,] 84.171 -1 [5,] 84.157 -1 [6,] 84.143 -1 > tail(out1) zz sig [4995,] 89.3965 0 [4996,] 89.3965 0 [4997,] 89.3965 0 [4998,] 89.3965 0 [4999,] 89.3965 0 [5000,] 89.3965 0

3.合并数据 中的xout。其中:

  • 删除sig== 0 的示例
  • 创建新变量Сlass(因子)
  • 我们在 "未来 "中将 Class 变量移至 1 bar
  • 从集合中删除变量 sig

 data <- cbind(x, sig = out1[ , 2 ]) %>% tbl_df %>% 
   dplyr::filter(., sig != 0 ) %>%
  mutate(., Class = factor(sig, ordered = F) %>% dplyr::lead()) %>% 
  dplyr::select(-sig) %>% 
  na.omit() 

> data %>% str() Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 4944 obs. of 18 variables: $ DX : num 0.355 0.541 6.324 3.026 9.511 ... $ ADX : num 12 11.3 11 10.5 10.4 ... $ oscDX : num 0.303 0.427 5.012 2.459 -8.641 ... $ ar : num -18.8 -18.8 -18.8 -18.8 -12.5 ... $ tr : num 0.032 0.051 0.037 0.004 0.011 ... $ atr : num 0.0422 0.0432 0.0425 0.038 0.0348 ... $ cci : num -14.75 20.6 27.23 6.22 -33.27 ... $ chv : num 0.0422 0.03 -0.0439 -0.0456 -0.1172 ... $ cmo : num -16.3 -20.1 -26.5 -39.2 -40.7 ... $ sign : num -0.0137 -0.013 -0.0117 -0.0107 -0.0108 ... $ vsig : num -0.00352 0.00655 0.0132 0.01059 -0.00103 ... $ rsi : num 45.7 49.8 50 46.8 42.4 ... $ slowD : num 0.408 0.438 0.447 0.43 0.405 ... $ oscK : num 0.0137 0.039 -0.0116 -0.0427 -0.0322 ... $ SMI : num -18.2 -16.6 -15.8 -16.2 -17.1 ... $ signal: num -12.8 -13.6 -14 -14.5 -15 ... $ vol : num 0.01005 0.01004 0.00985 0.00975 0.00946 ... $ Class : Factor w/ 2 levels "-1","1": 1 1 1 1 1 1 1 1 1 1 ... - attr(*, "na.action")=Class 'omit' Named int [1:34] 1 2 3 4 5 6 7 8 9 10 ... .. ..- attr(*, "names")= chr [1:34] "1" "2" "3" "4" ...

在文本中进一步说明。

祝好运

 
MetaQuotes Software Corp.:

新文章 机器学习模型的变量评估和选择已发布:

作者:Vladimir Perervenko


zigzag信号做为目标变量应用上存在很大问题,

所有模型的基础是基于先验的已经zigzag点(-1,1),其他的condition=0的点是排除在外的,

实际应用中,你不知道改时点是否是zigzag点(-1,1),很大的可能是condition=0的点,因为区分不了(-1,1)和(0)这两种状态,

所以在0的时点同样需要计算和判断。  这个时候训练模型和实际模型就会存在很大的偏差;

 
freewalk :

zigzag信号做为目标变量应用上存在很大问题,

所有模型的基础是基于先验的已经zigzag点(-1,1),其他的condition=0的点是排除在外的,

实际应用中,你不知道改时点是否是zigzag点(-1,1),很大的可能是condition=0的点,因为区分不了(-1,1)和(0)这两种状态,

所以在0的时点同样需要计算和判断。  这个时候训练模型和实际模型就会存在很大的偏差;

绘制一个简单的绘图说明的数字(-1,1(0)????

请您仔细阅读的文章?而旁边呢?而且不知道如何使用ZZ?

也许翻译不好?

指定更精确您的意见,请能提高英语水平?