文章 "数据科学和机器学习(第 18 部分):掌握市场复杂性博弈,截断型 SVD 对比 NMF"

 

新文章 数据科学和机器学习(第 18 部分):掌握市场复杂性博弈,截断型 SVD 对比 NMF已发布:

截断型奇异值分解(SVD)和非负矩阵分解(NMF)都是降维技术。它们在制定数据驱动的交易策略方面都发挥着重要作用。探索降维的艺术,揭示洞察和优化定量分析,以明智的方式航行在错综复杂的金融市场。

我们现实一点,在大多数现实世界的应用程序中,许多构建机器学习模型的数据集具有非常多的特征或变量(维度)。高维数据可能会引发各式各样的挑战,例如增加计算复杂性、过度拟合的风险、和可视化困难。您通常用到的的数据集拥有 5 个自变量!这不是 AI 算法交易中的大佬所做的。

假设您收集了所有 MT5(38)内置指标缓冲区。您最终会得到 56 个缓冲区的数据。这个数据集现在很庞大。 

all indicators data

维度诅咒

这个诅咒是真实的,对于那些不相信的人,请尝试实现一个包含大量相关自变量的线性回归模型。 

高度相关特征的存在可能会导致机器学习模型捕获训练数据中存在噪声和特定形态,而这些形态也许无法很好地推广到新的、尚未见过的数据。

作者:Omega J Msigwa