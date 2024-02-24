交易中的机器学习：理论、模型、实践和算法交易 - 页 643 1...636637638639640641642643644645646647648649650...3399 新评论 Yuriy Asaulenko 2018.02.03 18:37 #6421 尤苏夫霍贾-苏尔托诺夫。MAs的设计本质是为了欺骗你--那些不了解市场规律的人。而每个人都上当了。令 人惊讶的是，这是一个事实。环顾四周，你会发现，MA是所有数字系列的属性，无论它们是市场还是随机的。醒醒吧，交易员们，不要让自己被愚弄了。我称之为偏执狂））。 MAs是最常见的过滤器，它没有任何罪过。任何伴侣的方法都是好的，在它适用的地方和地方。 Dr. Trader 2018.02.04 00:01 #6422 马克西姆-德米特里耶夫斯基。那么关于寻找特征的实际问题是什么呢？ 在我们的情况下，只有价格。任何价格转换都是一种先验的规律性，其形式是对过程的某种 "记忆"（在n个时期内构建的指标）。也就是说，如果我们不知道规律性，我们只能输入价格，不同时期的增量，以考虑到记忆过程。 除了价格增量之外，还能有什么呢？ 或者说，你在那里如此严格地挑选，有什么呢？:) 有一个atvoregression过程的订单，你可以通过NS做同样的事情。在我看来，这似乎是唯一可以被教导的东西。我的意思是采取计量经济学模型并扩展它们 IMHO......这就是为什么我甚至不尝试拿起筹码:)和神经是好的（但不是真的）。 换句话说，我们可以在价格中找到什么：趋势、季节性、周期性、噪音你自己在几页前贴出了一个例子，有一个学习识别螺旋的神经元。标准的两个特征需要3个隐藏层的神经元。而如果你增加了更多的功能，一层就足够了。 所以在这里，你也可以用一百个过去的增量来喂养一个神经元，并在十几个隐藏层中进行处理，或者得到一些好的自制特征，这些特征是90年代的单层网格可以处理的。 Dr. Trader 2018.02.04 00:48 #6423 我发现了另一个有趣的包，用于筛选出预测因素。它被称为FSelector。它提供了大约十几种筛除预测因子的方法，包括熵值。 我从https://www.mql5.com/ru/forum/86386/page6#comment_2534058，得到了带有预测器和目标的文件。 library(FSelector) library(corrplot) load("ALL_cod.RData") trainTable <- Rat_DF1 PREDICTOR_COLUMNS_SEQ <- 1:27 TARGET_COLUMN_ID <- 28 targetFormula <- as.simple.formula(colnames(trainTable)[PREDICTOR_COLUMNS_SEQ], colnames(trainTable)[TARGET_COLUMN_ID]) impMatrix <- matrix(NA, nrow = 0, ncol = length(PREDICTOR_COLUMNS_SEQ)) impMatrix <- rbind(impMatrix, colnames(trainTable)[PREDICTOR_COLUMNS_SEQ] %in% cfs(targetFormula, trainTable)) rownames(impMatrix)[nrow(impMatrix)] <- "cfs" impMatrix <- rbind(impMatrix, chi.squared(targetFormula, trainTable)[[1]]) rownames(impMatrix)[nrow(impMatrix)] <- "chi.squared" impMatrix <- rbind(impMatrix, colnames(trainTable)[PREDICTOR_COLUMNS_SEQ] %in% consistency(targetFormula, trainTable)) rownames(impMatrix)[nrow(impMatrix)] <- "consistency" if(class(trainTable[,TARGET_COLUMN_ID]) != "factor"){ impMatrix <- rbind(impMatrix, linear.correlation(targetFormula, trainTable)[[1]]) rownames(impMatrix)[nrow(impMatrix)] <- "linear.correlation" impMatrix <- rbind(impMatrix, rank.correlation(targetFormula, trainTable)[[1]]) rownames(impMatrix)[nrow(impMatrix)] <- "rank.correlation" } impMatrix <- rbind(impMatrix, information.gain(targetFormula, trainTable)[[1]]) rownames(impMatrix)[nrow(impMatrix)] <- "information.gain" impMatrix <- rbind(impMatrix, gain.ratio(targetFormula, trainTable)[[1]]) rownames(impMatrix)[nrow(impMatrix)] <- "gain.ratio" impMatrix <- rbind(impMatrix, symmetrical.uncertainty(targetFormula, trainTable)[[1]]) rownames(impMatrix)[nrow(impMatrix)] <- "symmetrical.uncertainty" impMatrix <- rbind(impMatrix, oneR(targetFormula, trainTable)[[1]]) rownames(impMatrix)[nrow(impMatrix)] <- "oneR" impMatrix <- rbind(impMatrix, random.forest.importance(targetFormula, trainTable)[[1]]) rownames(impMatrix)[nrow(impMatrix)] <- "random.forest.importance" impMatrix <- rbind(impMatrix, relief(targetFormula, trainTable)[[1]]) rownames(impMatrix)[nrow(impMatrix)] <- "relief" impMatrix for(i in 1:nrow(impMatrix)){ if(length(unique(impMatrix[i,]))==1){ impMatrix[i,] <- 0 }else{ impMatrix[i,] <- -1 + (impMatrix[i,]-min(impMatrix[i,]))/(max(impMatrix[i,])-min(impMatrix[i,]))*2 } } while(nrow(impMatrix) < ncol(impMatrix)){ impMatrix <- rbind(impMatrix, 0) } while(ncol(impMatrix) < nrow(impMatrix)){ impMatrix <- cbind(impMatrix, 0) } impMatrix <- as.matrix(impMatrix) colnames(impMatrix) <- colnames(trainTable)[PREDICTOR_COLUMNS_SEQ] corrplot(impMatrix) 每种方法对预测器的评价我都在最后的图表中显示。 蓝色是好的，红色是坏的（对于corrplot结果被缩放为[-1:1]，对于确切的评价，见cfs(targetFormula, trainTable), chi.squared(targetFormula, trainTable)等的结果。） 你可以看到，X3、X4、X5、X19、X20几乎被所有的方法评估得很好，你可以从它们开始，然后尝试增加/减少更多。 然而，在Rat_DF2上使用这5个预测因子时， rattle中的模型没有通过测试，同样没有奇迹发生。也就是说，即使有剩余的预测因子，你也必须调整模型参数，做交叉验证，自己添加/删除预测因子。 Dr. Trader 2018.02.04 02:24 #6424 桑桑尼茨-弗门科。你能不能对合并结果运行一个窗口并给出图表。 熵值adf测试结果ArchTest结果只取了今年1月左右的eurusd m1，以及1天的滑动窗口。 根据逻辑，如果熵在增长，那么你应该暂停交易，在低熵时继续交易。但在这里，由于某种原因，我们在低熵时有一个趋势，虽然在平盘时更容易交易。 (更正了所附代码中的错别字，如果你已经有时间下载旧的代码，请再下载一次) 附加的文件： eurusd_m1.zip 2380 kb entropy_archtest_adftest.txt 3 kb [删除] 2018.02.04 03:08 #6425 交易员博士。几页之前，你发布了一个神经网络学习检测螺旋的例子。标准的两个特征需要3个隐藏层的神经元。而如果你增加了更多的功能，一层就足够了。 所以在这里，你也可以用一百个过去的增量来喂养一个神经键，并在十几个隐藏层中进行处理，或者得到一些很好的自制特征，90年代的单层网格可以处理。我明白，但螺旋线在时间上没有变化......想想看，当螺旋线在时间上现在是一个正方形，现在是一个椭圆，你解决的是一个多么错误的问题啊 和交叉验证没有帮助，因为状态转换是随机的。 Alexander_K2 2018.02.04 03:29 #6426 交易员博士。从逻辑上讲，如果熵值上升，就应该停止交易，在低熵值时继续交易。但在这里，当熵低的时候，由于某种原因，它是有趋势的，尽管在平坦的地方更容易交易，这是不正常的。 这就是为什么我说要慢慢来。 在高熵时，我们得到了反趋势交易的正态分布。 在低熵--帕累托分布、趋势、"记忆"--无论你怎么称呼它。 原来你在R里有一些现成的东西，对你来说比较容易。而我，现在有很多工作要做，要对非熵进行解释，所以我已经退出了论坛的讨论。 我坚持自己的观点--熵的核算是一切的关键。 Dr. Trader 2018.02.04 03:30 #6427 马克西姆-德米特里耶夫斯基。交叉验证没有帮助，因为状态转换是随机的。 如果状态转换是随机的，那么这个过程就是马尔可夫的，这个论坛的整个主题可能会因为无用而被删除 :)但是我，比如说，我相信这个过程是非马尔科夫的。亚历山大似乎同意，他在统计方面比我强得多，我相信他。 [删除] 2018.02.04 03:41 #6428 交易员博士。 如果状态转换是随机的，那么这个过程就是马尔可夫的，整个论坛的主题可以因为无用而被删除 :)但是我，比如说，我相信这个过程是非马尔科夫的。亚历山大似乎同意，他比我更了解统计数据，我会相信他。我已经写道：在局部水平上是随机的，如果不转移到大滞后或其他规模，你就不能把它们全部考虑进去，在那里，这个过程又变得可预测了。一个是BUT，一般人不知道，转移到另一个规模的数量是有限的。这就是为什么亚历山大使用蜱虫。的确如此，但当我们遇到由于历史 的缺失而导致的历史不足，以及因此而导致的对所调查的BP的模式缺乏清晰的概念时，即使它也不会总是有效。
总而言之，有些地方层面的过渡根本无法预测，它需要另一个层面的表述
Alexander_K2 2018.02.04 03:43 #6429
交易员博士。
如果状态转换是随机的，那么这个过程就是马尔可夫的，整个论坛的主题可以因为无用而被删除 :)但是我，比如说，我相信这个过程是非马尔科夫的。亚历山大似乎同意，他比我更了解统计数据，我会相信他。虽然我不使用神经网络，但我读了这个主题，因为费曼确信有可能预测粒子从状态A到状态B的进一步运动（准确地从状态到状态，而不是仅仅推断到无限大）。
为此，他把当前状态和以前状态之间的通常增量作为输入，并考虑到了许多额外的参数。Shelepin L.A.是第一个开始使用非熵的人，由于某种原因而死...这并没有使工作结束。因此，由我们来完成这个课题。
Alexander_K2 2018.02.04 04:36 #6430
是的！我忘了说了。
状态被认为是一组几乎完全描述粒子特征的数据。也就是说，它是一个数据集，简单地说--样本量，有其特征--峰度、不对称性、非熵等。
也就是说，以R.Feynman的信心，可以断言，在正确定义了混凝土对的样本量之后，在计算了这个样本的这些系数的历史特征平均值之后，可以预测，在目前拥有一定的参数集，在一定的时间间隔内，系统将传递到一个具有其稳态参数的状态。
这就是我对这个主题的期望。如果你在确定正确的样本量方面需要帮助，请与我联系，我将尽力提供帮助。 MAs的设计本质是为了欺骗你--那些不了解市场规律的人。而每个人都上当了。令 人惊讶的是，这是一个事实。环顾四周，你会发现，MA是所有数字系列的属性，无论它们是市场还是随机的。醒醒吧，交易员们，不要让自己被愚弄了。
我称之为偏执狂））。
MAs是最常见的过滤器，它没有任何罪过。任何伴侣的方法都是好的，在它适用的地方和地方。
那么关于寻找特征的实际问题是什么呢？
在我们的情况下，只有价格。任何价格转换都是一种先验的规律性，其形式是对过程的某种 "记忆"（在n个时期内构建的指标）。也就是说，如果我们不知道规律性，我们只能输入价格，不同时期的增量，以考虑到记忆过程。
除了价格增量之外，还能有什么呢？ 或者说，你在那里如此严格地挑选，有什么呢？:)
有一个atvoregression过程的订单，你可以通过NS做同样的事情。在我看来，这似乎是唯一可以被教导的东西。我的意思是采取计量经济学模型并扩展它们
IMHO......这就是为什么我甚至不尝试拿起筹码:)和神经是好的（但不是真的）。
换句话说，我们可以在价格中找到什么：趋势、季节性、周期性、噪音
你自己在几页前贴出了一个例子，有一个学习识别螺旋的神经元。标准的两个特征需要3个隐藏层的神经元。而如果你增加了更多的功能，一层就足够了。
所以在这里，你也可以用一百个过去的增量来喂养一个神经元，并在十几个隐藏层中进行处理，或者得到一些好的自制特征，这些特征是90年代的单层网格可以处理的。
我发现了另一个有趣的包，用于筛选出预测因素。它被称为FSelector。它提供了大约十几种筛除预测因子的方法，包括熵值。
我从https://www.mql5.com/ru/forum/86386/page6#comment_2534058，得到了带有预测器和目标的文件。
每种方法对预测器的评价我都在最后的图表中显示。
蓝色是好的，红色是坏的（对于corrplot结果被缩放为[-1:1]，对于确切的评价，见cfs(targetFormula, trainTable), chi.squared(targetFormula, trainTable)等的结果。）
你可以看到，X3、X4、X5、X19、X20几乎被所有的方法评估得很好，你可以从它们开始，然后尝试增加/减少更多。
然而，在Rat_DF2上使用这5个预测因子时， rattle中的模型没有通过测试，同样没有奇迹发生。也就是说，即使有剩余的预测因子，你也必须调整模型参数，做交叉验证，自己添加/删除预测因子。
你能不能对合并结果运行一个窗口并给出图表。
只取了今年1月左右的eurusd m1，以及1天的滑动窗口。
根据逻辑，如果熵在增长，那么你应该暂停交易，在低熵时继续交易。但在这里，由于某种原因，我们在低熵时有一个趋势，虽然在平盘时更容易交易。
(更正了所附代码中的错别字，如果你已经有时间下载旧的代码，请再下载一次)
几页之前，你发布了一个神经网络学习检测螺旋的例子。标准的两个特征需要3个隐藏层的神经元。而如果你增加了更多的功能，一层就足够了。
所以在这里，你也可以用一百个过去的增量来喂养一个神经键，并在十几个隐藏层中进行处理，或者得到一些很好的自制特征，90年代的单层网格可以处理。
我明白，但螺旋线在时间上没有变化......想想看，当螺旋线在时间上现在是一个正方形，现在是一个椭圆，你解决的是一个多么错误的问题啊
和交叉验证没有帮助，因为状态转换是随机的。
从逻辑上讲，如果熵值上升，就应该停止交易，在低熵值时继续交易。但在这里，当熵低的时候，由于某种原因，它是有趋势的，尽管在平坦的地方更容易交易，这是不正常的。
这就是为什么我说要慢慢来。
在高熵时，我们得到了反趋势交易的正态分布。
在低熵--帕累托分布、趋势、"记忆"--无论你怎么称呼它。
原来你在R里有一些现成的东西，对你来说比较容易。而我，现在有很多工作要做，要对非熵进行解释，所以我已经退出了论坛的讨论。
我坚持自己的观点--熵的核算是一切的关键。
交叉验证没有帮助，因为状态转换是随机的。
如果状态转换是随机的，那么这个过程就是马尔可夫的，这个论坛的整个主题可能会因为无用而被删除 :)
但是我，比如说，我相信这个过程是非马尔科夫的。亚历山大似乎同意，他在统计方面比我强得多，我相信他。
如果状态转换是随机的，那么这个过程就是马尔可夫的，整个论坛的主题可以因为无用而被删除 :)
但是我，比如说，我相信这个过程是非马尔科夫的。亚历山大似乎同意，他比我更了解统计数据，我会相信他。
我已经写道：在局部水平上是随机的，如果不转移到大滞后或其他规模，你就不能把它们全部考虑进去，在那里，这个过程又变得可预测了。一个是BUT，一般人不知道，转移到另一个规模的数量是有限的。这就是为什么亚历山大使用蜱虫。的确如此，但当我们遇到由于历史 的缺失而导致的历史不足，以及因此而导致的对所调查的BP的模式缺乏清晰的概念时，即使它也不会总是有效。
总而言之，有些地方层面的过渡根本无法预测，它需要另一个层面的表述
如果状态转换是随机的，那么这个过程就是马尔可夫的，整个论坛的主题可以因为无用而被删除 :)
但是我，比如说，我相信这个过程是非马尔科夫的。亚历山大似乎同意，他比我更了解统计数据，我会相信他。
虽然我不使用神经网络，但我读了这个主题，因为费曼确信有可能预测粒子从状态A到状态B的进一步运动（准确地从状态到状态，而不是仅仅推断到无限大）。
为此，他把当前状态和以前状态之间的通常增量作为输入，并考虑到了许多额外的参数。Shelepin L.A.是第一个开始使用非熵的人，由于某种原因而死...这并没有使工作结束。因此，由我们来完成这个课题。
是的！我忘了说了。
状态被认为是一组几乎完全描述粒子特征的数据。也就是说，它是一个数据集，简单地说--样本量，有其特征--峰度、不对称性、非熵等。
也就是说，以R.Feynman的信心，可以断言，在正确定义了混凝土对的样本量之后，在计算了这个样本的这些系数的历史特征平均值之后，可以预测，在目前拥有一定的参数集，在一定的时间间隔内，系统将传递到一个具有其稳态参数的状态。
这就是我对这个主题的期望。如果你在确定正确的样本量方面需要帮助，请与我联系，我将尽力提供帮助。