谢谢你,欧米茄,很感谢你把这些东西放在一起,我们都很害怕这些东西。我已经下载了附件,我建议它包含所有需要的组件。幸好你有 github,我才能找到并安装先决条件(preprossing.mqh、plots.mqh、Matrixextend.mqh、metrics.mqh 和 Random Forext.mqh)。不幸的是,我被一行信息 "Init - Undeclared Identifier "卡住了if (!random_forest. Init(StringFormat("%s.%s.%s.onnx", symbol_, EnumToString(timeframe_), technique_name), ONNX_COMMON_FOLDER))//从公共文件夹以 ONNX 格式初始化 RFC。我检查过了,在 MQL5\Common 文件夹中确实有USDJPY.PERIOD_D1.randomundersampling.onnx
linfo2 USDJPY.PERIOD_D1.randomundersampling.onnx
所需的组件都是笔记本中导入的所有组件的最新版本,您可以进行 pip 安装,而不必担心版本冲突。或者,您也可以通过附件表上的链接进入 Kaggle.com,在那里您可以编辑和修改代码。
未声明标识符,可能意味着变量或对象未定义。请检查您的代码,或通过 DM 将代码截图发给我。
测试结果 不可信。测试时间段包括训练数据的时间段。模型会在训练集上表现良好,而在测试集上表现不佳。你可以看到,很多测试结果的时间范围是 2024.07.06 到 2025.01.01。模型的表现很差,而前一段时间的模型表现很好。我计算过,训练集占 80%。数据没有打乱随机分配,训练集和测试集直接按顺序分配。模型能识别之前的训练数据,但不能识别之后的测试数据。你在测试中使用了训练数据,这会导致整体结果膨胀,而在后续测试数据上的表现则非常糟糕,会出现损失。那么聚类中心点也是不可靠的。聚类使用的是所有数据,整体数据将用于聚类,然后再进行训练。因此,该方法使用的训练数据包括 2023.01.01~2025.01.01 的时间范围。可以说,这完全是对训练数据的测试,没有对未知数据进行测试。训练数据和测试数据必须严格区分时间顺序。只有测试数据才能用来测试模型的性能,如 2023.01.01~2024.01.01 为训练数据,2024.01.01~2025.01.01 为测试数据。测试模型只能使用测试数据进行测试。不能有信息泄露的风险,否则模型的所有良好性能都将是不可靠的。
新文章 数据科学和机器学习(第 36 部分):与偏颇的金融市场打交道已发布:
不同的外汇市场和金融工具在不同时间展现出不同的行为。虽然一些金融市场如股票和指数在长期运转中常常看涨,而其它如外汇市场则往往显现看跌行为、等等,这种不确定性在利用人工智能(AI)技术和机器学习(ML)预测市场时增加了复杂性。
作者:Omega J Msigwa