文章 "数据科学和机器学习（第 36 部分）：与偏颇的金融市场打交道"

MetaQuotes 2026.02.19 08:16

金融市场非是完美平衡。有些市场看涨，有些看跌，有些市场展现范围起伏行为，表明无论哪个方向都不确定，这些不平衡的信息在训练机器学习模型时可能会误导，在于市场频繁变化。在本文中，我们将讨论若干种途径来应对该问题。

不同的外汇市场和金融工具在不同时间展现出不同的行为。虽然一些金融市场如股票和指数在长期运转中常常看涨，而其它如外汇市场则往往显现看跌行为、等等，这种不确定性在利用人工智能（AI）技术和机器学习（ML）预测市场时增加了复杂性。

数据科学和机器学习 — 与偏颇的金融市场打交道

linfo2 2025.04.23 22:56 #1

谢谢你，欧米茄，很感谢你把这些东西放在一起，我们都很害怕这些东西。我已经下载了附件，我建议它包含所有需要的组件。幸好你有 github，我才能找到并安装先决条件（preprossing.mqh、plots.mqh、Matrixextend.mqh、metrics.mqh 和 Random Forext.mqh）。不幸的是，我被一行信息 "Init - Undeclared Identifier "卡住了if (!random_forest. Init(StringFormat("%s.%s.%s.onnx", symbol_, EnumToString(timeframe_), technique_name), ONNX_COMMON_FOLDER))//从公共文件夹以 ONNX 格式初始化 RFC。我检查过了，在 MQL5\Common 文件夹中确实有USDJPY.PERIOD_D1.randomundersampling.onnx

Omega J Msigwa 2025.04.24 06:59 #2

linfo2 USDJPY.PERIOD_D1.randomundersampling.onnx

所需的组件都是笔记本中导入的所有组件的最新版本，您可以进行 pip 安装，而不必担心版本冲突。或者，您也可以通过附件表上的链接进入 Kaggle.com，在那里您可以编辑和修改代码。

未声明标识符，可能意味着变量或对象未定义。请检查您的代码，或通过 DM 将代码截图发给我。

zhai nan 2025.06.14 11:52 #3

测试结果不可信。测试时间段包括训练数据的时间段。模型会在训练集上表现良好，而在测试集上表现不佳。你可以看到，很多测试结果的时间范围是 2024.07.06 到 2025.01.01。模型的表现很差，而前一段时间的模型表现很好。我计算过，训练集占 80%。数据没有打乱随机分配，训练集和测试集直接按顺序分配。模型能识别之前的训练数据，但不能识别之后的测试数据。你在测试中使用了训练数据，这会导致整体结果膨胀，而在后续测试数据上的表现则非常糟糕，会出现损失。那么聚类中心点也是不可靠的。聚类使用的是所有数据，整体数据将用于聚类，然后再进行训练。因此，该方法使用的训练数据包括 2023.01.01~2025.01.01 的时间范围。可以说，这完全是对训练数据的测试，没有对未知数据进行测试。训练数据和测试数据必须严格区分时间顺序。只有测试数据才能用来测试模型的性能，如 2023.01.01~2024.01.01 为训练数据，2024.01.01~2025.01.01 为测试数据。测试模型只能使用测试数据进行测试。不能有信息泄露的风险，否则模型的所有良好性能都将是不可靠的。

新评论