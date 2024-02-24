交易中的机器学习：理论、模型、实践和算法交易 - 页 3005 1...299829993000300130023003300430053006300730083009301030113012...3399 新评论 mytarmailS 2023.04.08 00:56 #30041 Maxim Dmitrievsky #: 这是在呼吁大家在把初始数列转化为图形、量子、水平、正弦或其他你发明的东西之前先思考一下。 问题设置不正确，我在这里已经说了很久，上一次是在 10-20 页之前，所以没什么好教的，我自己完全明白一切......要转换任务，就必须转换数据...所以，当你让我考虑的时候，我已经考虑过了，我正在考虑我的选择。 [删除] 2023.04.08 02:14 #30042 mytarmailS #: 事实上，任务的设置并不正确，这一点我在这里已经说了很久，上一次是在 10-20 页之前，所以好像没有什么可以教我的，我完全明白一切.....。要转换任务，就必须转换数据...所以，当你让我思考的时候，我已经想好了，我正在浏览选项。 同样，你会得到记忆，而不是概括。 Aleksey Vyazmikin 2023.04.08 03:38 #30043 Maxim Dmitrievsky #: 如果数据中存在恒定的信号，则几乎立即意味着泛化，而噪声则会导致错误。如果没有信号，就会出现记忆化，即分类错误仅仅是重叠了具有不同标签和相同特征值的样本。第二个模型没有预测价值。这就是我提出的问题的答案。 在有模式（小波、小形状等）但没有信号的情况下，只有分为训练有素和未经训练两种模式才能起作用。可训练的被分类，不可训练的被过滤。在这里，良好的记忆可以起到过滤的作用，而泛化则是模式的泛化。 当没有明显的持续模式（如市场），但存在低效率时，方法必须更加精细，因为低效率不一定能用模式来描述。在这种情况下，你必须从中找出一个：哪些需要记住，哪些需要归纳。算法。 对数据进行转换会改变其表现形式，但本身并不能解决问题，因为最终要交易的是原始数据序列。 规律具有浮动概率，可能是周期性的，也可能完全消失。我工作的时间范围很大，也观察到了这些现象。 我想说的是，有可能训练出一个 2008-2017 年（10 年）的模型，它可以一直运行到今天。这样一个模型的信号会很少--召回率最多不超过 30%，但这也说明，10 年中能在未来几年（测试样本）发挥作用的模式很少。 但究竟是哪种模式--周期性的还是一次性的（也许周期为数十 年）--目前还无法确定，因此也就不可能选择一种持续有效的模式。 理想情况下，有必要找到至少每 3 个月出现一次的周期性模式，这样我们就可以期望模型能够摆脱缩减。 根据不同的周期模式训练出的一揽子此类模型将减少缩减。 因此，重要的是初始信号 + 目标 + 相对于目标具有周期性正规律的预测因子。 你的方法--摇晃和筛选--类似于探矿者的工作--当然，你可以找到很多有趣的和没有学到的东西，但你怎么能确定这些东西会是稳定的呢？ 我喜欢自己破解日期，我有这方面的想法，但现在我想朝着提高模型稳定性概率的方向挖掘。 [删除] 2023.04.08 03:44 #30044 Aleksey Vyazmikin #:你的方法--摇晃和筛选--就像一个探矿者的工作--当然你可以找到很多有趣的和没有学到的东西，但如何确保它的稳定性呢？我自己喜欢 "摇枣"，也有这方面的想法，但现在我想朝着提高模型稳定性概率的方向挖掘。 我写了一个基本的理解，如果没有这个理解，就根本不值得做任何事情。如果只是为了确认每一点的话（如果你第一次没有理解的话 🙂 )要验证稳定性，就必须进行测试、测试和更多的测试，除此之外别无他法。MO 最适合做这个。因为理论界的抱怨者们显然连 MO 的基本原理都不懂，就大谈特谈 tsos 和其他废话。这种娱乐不适合精神和道德上的弱者，发牢骚更容易:)。 Aleksey Vyazmikin 2023.04.08 04:09 #30045 Maxim Dmitrievsky #: 我写了一个基本的理解，没有它就根本不值得做任何事情。如果只是为了确认每一点的话（如果你第一次没有理解的话 🙂） 要验证稳定性，就必须进行测试、测试和更多的测试，除此之外别无他法。MO 最适合做这个。 我对您的描述和方法总体上没有异议--我自己也在很久以前对其进行了本质上的描述，尽管实现方式不同。 我的人工实验表明，通常情况下，只要抽取出具有 10 个简单规律性的行（在我的案例中，就是预测值下降的量子段），整个样本的概率就会向 1 的方向移动 15-20%，而样本则会减少 35%。机器学习方法无法实现这一点。从本质上讲，这是对无用/矛盾数据的剔除。但我们想在更接近当前日期的情况下做到这一点，即不是通过统计了解历史，而是通过一些方法只选择虚假/矛盾的模式。 如果我们设定一个任务，根据这个任务，模型应该在任何仪器上都能工作，那么测试是可能的，但这样稳定的模式就更少了。而只是在历史中狂奔，或者更糟糕的是，进行合成--我不认为这是有效的。顶多是可以通过洗日的方式从每日增量中提取合成数据，但我还没有这种能力。您尝试过吗？ Aleksey Nikolayev 2023.04.08 06:18 #30046 mytarmailS #: 我完全不懂，但我想知道价格是否可以用图表来表示，与通常的二维表示法相比是否有任何优势。 谁知道这方面的情况？ 您可以将曼德尔布罗特（Mandelbrot）的价格表示法视为三元树森林，其中每一步棋都分为三步（同方向的两步棋和两步棋之间的修正）。 这样做的好处是可以收集有关价格分形结构的统计数据。缺点是算法复杂，难以避免瞻前顾后。 Slava 2023.04.08 08:55 #30047 Stanislav Korotky #:这与我上面举的 "并行 "平台的矩阵和例子有什么关系？例如，我从 keras 的链接中获取矩阵，并调用它们：并得到零。 对照示例不适合。 分类交叉熵用于有两个以上类别的分类模型。而在 softmax 之后。Softmax 将一组值转换为一组概率，其总和为 1。 试试这样一个控制示例 pred: 0.1, 0.1, 0.2, 0.5, 0.1 true: 0, 0, 1, 0, 0, 0 [删除] 2023.04.08 09:07 #30048 Aleksey Vyazmikin #:最多，我们可以通过调整天数，从每日增量中提取合成数据--但我还无法做到这一点。你尝试过吗？ 我不明白这样的假设是基于什么，而且这又是在利用特质，而不是改进学习方法。所以这是次要的。这就像学校一样。你可以用一本教科书来教，也可以用另一本教科书来教。信息在本质上不会改变，就像变换一样。但它会飞进一个脑袋，又从另一个脑袋飞出来:)在最终目标不明确的情况下，很难使用综合法。最好的办法是用它来测试序列的某些属性，将其混合到不同的部分，看看结果会如何变化。比如如果？对齐数据中的偏移。一般来说，通过减少对原始数据的记忆来提高通用性是很有用的，但就创建现成的 TS 而言，它仍然是不完整的。在原始数据上训练不同的模型集合（包括简单到线性模型），也能得到类似的结果。好了，你知道大概的答案了吧，通过它仍然不可能得到极好的东西，但改进它是可能的。 mytarmailS 2023.04.08 10:35 #30049 Aleksey Nikolayev #:我们可以将曼德尔布罗特的价格表示法视为三元树的森林，其中每一次移动都被分解为三次（两次同方向移动和中间的修正）。这样做的好处是可以收集价格分形结构的统计数据。缺点是算法复杂，难以避免瞻前顾后。 能否以关联规则的形式呈现？ Aleksey Nikolayev 2023.04.08 10:54 #30050 mytarmailS #: 可以用关联规则来表示吗？ 我没有想过这个问题，但我认为不太可能，因为运动的顺序对价格很重要。 为了以防万一，我想用一幅图来说明曼德布罗特的想法。如果可能的话，每个价格变动都会被分成三个变动（通过选择其中的最大修正），然后成为树的一个节点。如果运动中没有修正（或修正小于给定值），则成为树的叶子。 1...299829993000300130023003300430053006300730083009301030113012...3399 新评论 您错过了交易机会： 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符（不带空格） 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号，请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置，否则您将无法登录。 忘记您的登录名/密码？ 使用 Google 登录
这是在呼吁大家在把初始数列转化为图形、量子、水平、正弦或其他你发明的东西之前先思考一下。
事实上，任务的设置并不正确，这一点我在这里已经说了很久，上一次是在 10-20 页之前，所以好像没有什么可以教我的，我完全明白一切.....。
如果数据中存在恒定的信号，则几乎立即意味着泛化，而噪声则会导致错误。如果没有信号，就会出现记忆化，即分类错误仅仅是重叠了具有不同标签和相同特征值的样本。第二个模型没有预测价值。这就是我提出的问题的答案。
规律具有浮动概率，可能是周期性的，也可能完全消失。我工作的时间范围很大，也观察到了这些现象。
我想说的是，有可能训练出一个 2008-2017 年（10 年）的模型，它可以一直运行到今天。这样一个模型的信号会很少--召回率最多不超过 30%，但这也说明，10 年中能在未来几年（测试样本）发挥作用的模式很少。
但究竟是哪种模式--周期性的还是一次性的（也许周期为数十 年）--目前还无法确定，因此也就不可能选择一种持续有效的模式。
理想情况下，有必要找到至少每 3 个月出现一次的周期性模式，这样我们就可以期望模型能够摆脱缩减。
根据不同的周期模式训练出的一揽子此类模型将减少缩减。
因此，重要的是初始信号 + 目标 + 相对于目标具有周期性正规律的预测因子。
你的方法--摇晃和筛选--类似于探矿者的工作--当然，你可以找到很多有趣的和没有学到的东西，但你怎么能确定这些东西会是稳定的呢？
我喜欢自己破解日期，我有这方面的想法，但现在我想朝着提高模型稳定性概率的方向挖掘。
我写了一个基本的理解，没有它就根本不值得做任何事情。如果只是为了确认每一点的话（如果你第一次没有理解的话 🙂）
我对您的描述和方法总体上没有异议--我自己也在很久以前对其进行了本质上的描述，尽管实现方式不同。
我的人工实验表明，通常情况下，只要抽取出具有 10 个简单规律性的行（在我的案例中，就是预测值下降的量子段），整个样本的概率就会向 1 的方向移动 15-20%，而样本则会减少 35%。机器学习方法无法实现这一点。从本质上讲，这是对无用/矛盾数据的剔除。但我们想在更接近当前日期的情况下做到这一点，即不是通过统计了解历史，而是通过一些方法只选择虚假/矛盾的模式。
如果我们设定一个任务，根据这个任务，模型应该在任何仪器上都能工作，那么测试是可能的，但这样稳定的模式就更少了。而只是在历史中狂奔，或者更糟糕的是，进行合成--我不认为这是有效的。顶多是可以通过洗日的方式从每日增量中提取合成数据，但我还没有这种能力。您尝试过吗？
我完全不懂，但我想知道价格是否可以用图表来表示，与通常的二维表示法相比是否有任何优势。
您可以将曼德尔布罗特（Mandelbrot）的价格表示法视为三元树森林，其中每一步棋都分为三步（同方向的两步棋和两步棋之间的修正）。
这样做的好处是可以收集有关价格分形结构的统计数据。缺点是算法复杂，难以避免瞻前顾后。
这与我上面举的 "并行 "平台的矩阵和例子有什么关系？
例如，我从 keras 的链接中获取矩阵，并调用它们：
并得到零。
对照示例不适合。
分类交叉熵用于有两个以上类别的分类模型。而在 softmax 之后。Softmax 将一组值转换为一组概率，其总和为 1。
试试这样一个控制示例
pred: 0.1, 0.1, 0.2, 0.5, 0.1
true: 0, 0, 1, 0, 0, 0
最多，我们可以通过调整天数，从每日增量中提取合成数据--但我还无法做到这一点。你尝试过吗？
可以用关联规则来表示吗？
我没有想过这个问题，但我认为不太可能，因为运动的顺序对价格很重要。
为了以防万一，我想用一幅图来说明曼德布罗特的想法。如果可能的话，每个价格变动都会被分成三个变动（通过选择其中的最大修正），然后成为树的一个节点。如果运动中没有修正（或修正小于给定值），则成为树的叶子。