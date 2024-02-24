交易中的机器学习：理论、模型、实践和算法交易 - 页 124 1...117118119120121122123124125126127128129130131...3399 新评论 Andrey Dik 2016.08.26 00:58 #1231 阿列克谢-伯纳科夫。 这是对多变量出口的描述。我自己实施了它。增加了合体的机会。 它是否会增加？这很奇怪。对我来说，它减少了。像往常一样，显然，魔鬼就在细节中。 Dr. Trader 2016.08.26 01:25 #1232 桑桑尼茨-弗门科。主要的问题是过度训练，在未来的样本中，现有的树不能正确地预测类别，或者说它们预测的类别越来越差。这就是本主题所要解决的问题，即我们试图证明所获得的树会在未来出现，而且未来样本上的分类误差会与训练样本上的分类误差大致相同。虽然它是隐含的，但我还是想把它加进去，使之更清晰。通常情况下，模型中的过度学习会产生这样的效果：模型对训练实例的记忆非常准确。学习开始时，模型会推导出一些一般规则，即预测因子的目标值依赖性，但学习越深入，模型中的这些规则就越严格，最终导致完全记忆的例子，模型完全无法对新数据进行预测。这是通过交叉验证来处理的，当模型已经学会了一些广义的规则，但还没有开始学习具体的例子时，就停止训练，这将在新的数据上获得更好的预测性能。这在依赖性随时间变化而保持不变的数据上非常有效--例如，图像识别或声音识别。但外汇的不同之处在于，发现的许多依赖关系并不随时间推移而持续存在。问题是不仅要在不记忆训练实例的情况下学习，而且要以某种方式确保所发现的模式在未来仍然存在。任务更加完整：开发一种相对于目标变量估计预测因子的方法，保证预测因子和目标变量之间的关系是恒定的，并且在新数据上也会存在。使用哪种目标值（柱状颜色，或反转，或趋势），或哪种预测因素（价格，指标，指数）是细微差别。如果我们能够评估一组预测器及其对目标值的预测能力，以及这种预测能力在时间上的变化，那么我们甚至可以找到预测器和目标值的这种组合，它们具有最佳的估计效果。 然后我们可以采取任何模型，训练它（也许甚至有再训练控制，这对神经元学来说很重要），就有了圣杯。 СанСаныч Фоменко 2016.08.26 09:07 #1233 Dr.Trader:通常情况下，模型中的过度学习具有这样的效果：模型对训练实例的记忆非常准确。学习开始时，模型会推导出一些一般规则，即预测因子的目标值依赖性，但学习越深入，模型中的这些规则就越严格，最终导致完全记忆的例子，模型完全无法对新数据进行预测。看起来这里只有我们两个人，因为阿列克谢的立场对我来说并不完全清楚。剩下的就是那些在市场上呆了很久的人的经验。我相信他们是成功的交易者。我从文献中知道有些人多年来使用启发式方法获得了成功，但唯一的结果是令人沮丧的单调--失去了去处。任何启发式方法都不能回答再学习的问题，这就是为什么结局会到来：在一天、一个月、一年......。但总是出乎意料，极其不合时宜。PS。过度学习是科学的一个基本问题，在这个意义上，科学的主题是提取一些基本规律，从这些规律中可以解释许多特殊情况。例如，牛顿定律。拿一张纸--它必然会掉到地上。揉碎那张纸--它必然会掉下来，但速度更快。牛顿说，万物以相同的加速度下落。怎么说呢？就是这样，男人设法抛弃特殊的，也就是大量的，粗糙的现实，得到一个普遍的法律，如果它不起作用，那么这些偏差总是可以被解释的。这就是科学的运作方式。我们所做的是试图 "粗化 "商数，以模型的形式呈现这个商数，以便对所有未来的商数有一个概念。与过度训练作斗争是交易的一个基本问题。 mytarmailS 2016.08.26 09:08 #1234 Dr.Trader:这在依赖关系随时间变化而保持不变的数据上运行良好--例如图像识别或声音识别。但外汇的不同之处在于，发现的许多依赖关系并不随时间推移而持续存在。问题是不仅要在不记忆训练实例的情况下实现学习，而且要以某种方式确保所发现的模式在未来仍然存在。有点偏离主题，但只是一点信息......在语音识别中，特别是语音是一个问题，当一个人说了一个词--一个词的频谱模式反馈给算法 "HMM "或 "RNN" ...但麻烦的是，如果对方说同样的话，他至少会以不同的速度说出来，那些图案是相同的，但在时间上被拉长了，现在的比喻是--头肩部图案宽度为33根蜡烛，同样头肩部图案宽度为88根蜡烛，宽度不同，但图案是相同的.....。为了解决语音识别算法的问题，开发了一个动态时间扭曲 "DTW"。，该算法的任务是，它可以找到两个类似的向量，即使它们的长度不同。因此，当不同的人说同一个词时，这个词的光谱模式首先通过 "DTW"，然后到 "MO "算法，这个词被成功识别。我还没有使用它，所以我不能说什么，但我想我必须尝试一下，尽管如果你说市场上没有模式，那么这个算法当然不会起作用，我还没有决定与我的世界观......R包："DTW", "dtwclust" СанСаныч Фоменко 2016.08.26 09:09 #1235 阿列克谢-伯纳科夫。 这是对多变量退出交易的描述。我自己已经实施了。增加了获得合适的机会。安德烈-迪克该方法如下（以下所有内容同样适用于ML和经典的TS）。关键是要摆脱不确定性，这意味着一方面要摆脱训练和优化中的拟合，另一方面要毫不含糊地对系统提出 "软 "要求。进场时的TP和SL也是一个不确定因素，所以我们只在紧急出场时使用（这取决于工具的波动性，我们根据经验选择，所以100%的交易尽可能少触发止损，最好是永远不触发。预测整个交易，从进入到退出。我们认为有排除点差和佣金的利润的结果是成功的交易（系统操作是在检查点差和佣金是否被覆盖后确定的）。一旦收到进入信号，系统就会进入，然后等待一定数量的条形图（它是根据经验确定的，取决于预测器和仪器）。- 结束交易，如果是输了，我们再等一栏。有时我使用两个参数：最小和最大（如果一个交易在最大条数 之后没有被关闭--无论如何它都会被关闭），有时我只使用一个--最小条数。很多人会感到惊讶，但很多，甚至是看似无望的系统开始工作，包括魔杖上的TS，更不用说各种有ML的系统。诀窍是不要要求你自己和机器制定铁的TC规则，不要试图完全描述市场运动，并为ML给出那些非常 "软 "的规则。此外，我们摆脱了市场上重重尾巴的坏遗产（或者更准确地说，尾巴不再重要），BP缺乏静止性也不再重要--因为我们知道，市场形状可以纵向和横向扩展，而不改变其内部属性（这让鸸鹋的生活极其困难）。我在第四论坛上写过这个问题，我想是在Swinosaurs主题中，关于所有TS的两种类型（有确定的边界和不确定的边界），但这个想法在那里没有完成。现在一切都更加清晰可见，或者说......。一般来说，我在开发交易系统时使用我的规则：如果逻辑上的变化导致所有可能的变体中成功的参数份额增加，那么这是一个好的变化（无论我们如何改变参数，选择一个坏的变体进行交易的概率都会降低--我们将处于有利的一面）。这种方法允许在我的TS中增加这一份额。 在我看来，你所描述的一切都符合优化ARIMA模型的要求。在优化时，你选择建立模型的条数 mytarmailS 2016.08.26 09:16 #1236 阿列克谢-伯纳科夫：桑萨尼茨-福门科。用两个字回答并引用100行的对话者的野生习惯是什么????这个论坛有120页，如果你去掉这些不必要的引语，你可能还剩下60页有用的文字...尊重阅读它的人或将来会阅读它的人 mytarmailS 2016.08.26 09:55 #1237 安德烈-迪克该方法如下（以下所有内容同样适用于ML和经典的TS）....你能不能逐点描述一下，作为一种算法，该怎么做，因为我不太明白你建议怎么做？ Andrey Dik 2016.08.26 10:06 #1238 桑桑尼茨-弗门科。 在我看来，你所描述的一切都符合ARIMA模型的优化。在优化过程中，选择建立模型的条数 不是一个固定的条形值，而是 "从现在到现在 "的可能值 Andrey Dik 2016.08.26 10:19 #1239 mytarmailS: 你能不能逐点描述要做什么以及如何做，就像一个算法，因为我不太明白你建议如何做。你对价格数字在时间上的延伸是正确的。这就是我所说的，垂直和水平拉伸/缩放。但是，不仅是整体的数字被拉伸得不同，而且里面的单个烛台也是如此。这是一个额外的问题，我怀疑类似于DTW的前/后处理方法 可以充分应用。这些是以某种未知方式扭曲的市场形状。更确切地说：我们在当前的柱子上有买入信号，计算未来最少的柱子数，并检查交易是否有利可图，如果有利可图，就关闭它，如果没有，就再计算一个柱子，并再次检查。这样，我们就达到了最大的条数，并最终关闭了它们。这是一种学习机制。一般来说，市场数据的机器学习类似于以下情况：我们向机器展示图形的组合，圆形、正方形、三角形、梯形，不同大小和形状的图形。机器必须用一些形状来回应，一个三角形、一个正方形或一个圆形（夸张的）。我们把答案放在图案上，然后f*ck!- 答案中的形状与模板不他妈的吻合!而在学习过程中，由于某些原因，他们像一块该死的石头一样匹配。....这就是我们在这里要解决的问题。我说--没问题，我们可以把模式拉长一点，这样，即使在训练数据之外，答案也会变得正确。这是一个系统的基本 "鱼"，它自己已经在工作。但是没有人禁止在交易中加入TS和使用SL Breakeven这样的工具。该系统保持不变，但对于这一点，当市场向我们的方向移动时，我们将获得超出 "计划 "的额外利润，然后或者拖曳SL，或者开始部分平仓，这取决于与一定时期内的统计价格运动相比所覆盖的距离，等等。 Alexey Burnakov 2016.08.26 10:47 #1240 安德烈-迪克 它是否在增加？这很奇怪。但它会减少。像往常一样，显然，魔鬼就在细节中。你是根据历史来评估策略的表现，还是有一个长期的前进方向？魔鬼可能就在对历史的评价中。听着，我曾在MT4上自己写了一个100行的策略。我在2014年12月的资料中写到：https://www.mql5.com/ru/users/alexeymosc/page3?#userActions这是最新版本的样子，是在2015年1月整理出来的。然后我在真实的情况下，结合其他策略进行了尝试。我也到处写过他们。 这个和那个，手都抽干了。今天看到一个从优化结束到7月底的前进测试，设置相同。看。这一切都在那里。点差为30，手数为0.1。我也会在所有的虱子上试一试，以确保采取的措施效果更好。冲动时进入，在一些条件下通过OR 退出。原则上，这似乎是可行的。但是，如果我在高峰期进入，然后等待一年的时间从缩减中撤出... Alexey Burnakov www.mql5.com Профиль трейдера 1...117118119120121122123124125126127128129130131...3399 新评论 您错过了交易机会： 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符（不带空格） 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号，请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置，否则您将无法登录。 忘记您的登录名/密码？ 使用 Google 登录
这是对多变量出口的描述。我自己实施了它。增加了合体的机会。
主要的问题是过度训练，在未来的样本中，现有的树不能正确地预测类别，或者说它们预测的类别越来越差。这就是本主题所要解决的问题，即我们试图证明所获得的树会在未来出现，而且未来样本上的分类误差会与训练样本上的分类误差大致相同。
虽然它是隐含的，但我还是想把它加进去，使之更清晰。
通常情况下，模型中的过度学习会产生这样的效果：模型对训练实例的记忆非常准确。学习开始时，模型会推导出一些一般规则，即预测因子的目标值依赖性，但学习越深入，模型中的这些规则就越严格，最终导致完全记忆的例子，模型完全无法对新数据进行预测。这是通过交叉验证来处理的，当模型已经学会了一些广义的规则，但还没有开始学习具体的例子时，就停止训练，这将在新的数据上获得更好的预测性能。
这在依赖性随时间变化而保持不变的数据上非常有效--例如，图像识别或声音识别。但外汇的不同之处在于，发现的许多依赖关系并不随时间推移而持续存在。问题是不仅要在不记忆训练实例的情况下学习，而且要以某种方式确保所发现的模式在未来仍然存在。
任务更加完整：开发一种相对于目标变量估计预测因子的方法，保证预测因子和目标变量之间的关系是恒定的，并且在新数据上也会存在。
使用哪种目标值（柱状颜色，或反转，或趋势），或哪种预测因素（价格，指标，指数）是细微差别。如果我们能够评估一组预测器及其对目标值的预测能力，以及这种预测能力在时间上的变化，那么我们甚至可以找到预测器和目标值的这种组合，它们具有最佳的估计效果。
然后我们可以采取任何模型，训练它（也许甚至有再训练控制，这对神经元学来说很重要），就有了圣杯。
看起来这里只有我们两个人，因为阿列克谢的立场对我来说并不完全清楚。
剩下的就是那些在市场上呆了很久的人的经验。我相信他们是成功的交易者。我从文献中知道有些人多年来使用启发式方法获得了成功，但唯一的结果是令人沮丧的单调--失去了去处。任何启发式方法都不能回答再学习的问题，这就是为什么结局会到来：在一天、一个月、一年......。但总是出乎意料，极其不合时宜。
过度学习是科学的一个基本问题，在这个意义上，科学的主题是提取一些基本规律，从这些规律中可以解释许多特殊情况。
例如，牛顿定律。
拿一张纸--它必然会掉到地上。揉碎那张纸--它必然会掉下来，但速度更快。牛顿说，万物以相同的加速度下落。怎么说呢？就是这样，男人设法抛弃特殊的，也就是大量的，粗糙的现实，得到一个普遍的法律，如果它不起作用，那么这些偏差总是可以被解释的。
这就是科学的运作方式。
我们所做的是试图 "粗化 "商数，以模型的形式呈现这个商数，以便对所有未来的商数有一个概念。
与过度训练作斗争是交易的一个基本问题。
有点偏离主题，但只是一点信息......
在语音识别中，特别是语音是一个问题，当一个人说了一个词--一个词的频谱模式反馈给算法 "HMM "或 "RNN" ...但麻烦的是，如果对方说同样的话，他至少会以不同的速度说出来，那些图案是相同的，但在时间上被拉长了，现在的比喻是--头肩部图案宽度为33根蜡烛，同样头肩部图案宽度为88根蜡烛，宽度不同，但图案是相同的.....。
为了解决语音识别算法的问题，开发了一个动态时间扭曲 "DTW"。，该算法的任务是，它可以找到两个类似的向量，即使它们的长度不同。因此，当不同的人说同一个词时，这个词的光谱模式首先通过 "DTW"，然后到 "MO "算法，这个词被成功识别。我还没有使用它，所以我不能说什么，但我想我必须尝试一下，尽管如果你说市场上没有模式，那么这个算法当然不会起作用，我还没有决定与我的世界观......
R包："DTW", "dtwclust"
这是对多变量退出交易的描述。我自己已经实施了。增加了获得合适的机会。
该方法如下（以下所有内容同样适用于ML和经典的TS）。
关键是要摆脱不确定性，这意味着一方面要摆脱训练和优化中的拟合，另一方面要毫不含糊地对系统提出 "软 "要求。进场时的TP和SL也是一个不确定因素，所以我们只在紧急出场时使用（这取决于工具的波动性，我们根据经验选择，所以100%的交易尽可能少触发止损，最好是永远不触发。预测整个交易，从进入到退出。我们认为有排除点差和佣金的利润的结果是成功的交易（系统操作是在检查点差和佣金是否被覆盖后确定的）。一旦收到进入信号，系统就会进入，然后等待一定数量的条形图（它是根据经验确定的，取决于预测器和仪器）。- 结束交易，如果是输了，我们再等一栏。有时我使用两个参数：最小和最大（如果一个交易在最大条数 之后没有被关闭--无论如何它都会被关闭），有时我只使用一个--最小条数。
很多人会感到惊讶，但很多，甚至是看似无望的系统开始工作，包括魔杖上的TS，更不用说各种有ML的系统。诀窍是不要要求你自己和机器制定铁的TC规则，不要试图完全描述市场运动，并为ML给出那些非常 "软 "的规则。此外，我们摆脱了市场上重重尾巴的坏遗产（或者更准确地说，尾巴不再重要），BP缺乏静止性也不再重要--因为我们知道，市场形状可以纵向和横向扩展，而不改变其内部属性（这让鸸鹋的生活极其困难）。
我在第四论坛上写过这个问题，我想是在Swinosaurs主题中，关于所有TS的两种类型（有确定的边界和不确定的边界），但这个想法在那里没有完成。现在一切都更加清晰可见，或者说......。
一般来说，我在开发交易系统时使用我的规则：如果逻辑上的变化导致所有可能的变体中成功的参数份额增加，那么这是一个好的变化（无论我们如何改变参数，选择一个坏的变体进行交易的概率都会降低--我们将处于有利的一面）。这种方法允许在我的TS中增加这一份额。
该方法如下（以下所有内容同样适用于ML和经典的TS）....
你能不能逐点描述一下，作为一种算法，该怎么做，因为我不太明白你建议怎么做？
在我看来，你所描述的一切都符合ARIMA模型的优化。在优化过程中，选择建立模型的条数
你能不能逐点描述要做什么以及如何做，就像一个算法，因为我不太明白你建议如何做。
你对价格数字在时间上的延伸是正确的。这就是我所说的，垂直和水平拉伸/缩放。但是，不仅是整体的数字被拉伸得不同，而且里面的单个烛台也是如此。这是一个额外的问题，我怀疑类似于DTW的前/后处理方法 可以充分应用。这些是以某种未知方式扭曲的市场形状。
更确切地说：我们在当前的柱子上有买入信号，计算未来最少的柱子数，并检查交易是否有利可图，如果有利可图，就关闭它，如果没有，就再计算一个柱子，并再次检查。这样，我们就达到了最大的条数，并最终关闭了它们。这是一种学习机制。
一般来说，市场数据的机器学习类似于以下情况：我们向机器展示图形的组合，圆形、正方形、三角形、梯形，不同大小和形状的图形。机器必须用一些形状来回应，一个三角形、一个正方形或一个圆形（夸张的）。我们把答案放在图案上，然后f*ck!- 答案中的形状与模板不他妈的吻合!而在学习过程中，由于某些原因，他们像一块该死的石头一样匹配。....这就是我们在这里要解决的问题。我说--没问题，我们可以把模式拉长一点，这样，即使在训练数据之外，答案也会变得正确。
这是一个系统的基本 "鱼"，它自己已经在工作。但是没有人禁止在交易中加入TS和使用SL Breakeven这样的工具。该系统保持不变，但对于这一点，当市场向我们的方向移动时，我们将获得超出 "计划 "的额外利润，然后或者拖曳SL，或者开始部分平仓，这取决于与一定时期内的统计价格运动相比所覆盖的距离，等等。
它是否在增加？这很奇怪。但它会减少。
你是根据历史来评估策略的表现，还是有一个长期的前进方向？魔鬼可能就在对历史的评价中。
听着，我曾在MT4上自己写了一个100行的策略。我在2014年12月的资料中写到：https://www.mql5.com/ru/users/alexeymosc/page3?#userActions
这是最新版本的样子，是在2015年1月整理出来的。
然后我在真实的情况下，结合其他策略进行了尝试。我也到处写过他们。
这个和那个，手都抽干了。
今天看到一个从优化结束到7月底的前进测试，设置相同。看。
这一切都在那里。点差为30，手数为0.1。
我也会在所有的虱子上试一试，以确保采取的措施效果更好。
冲动时进入，在一些条件下通过OR 退出。原则上，这似乎是可行的。但是，如果我在高峰期进入，然后等待一年的时间从缩减中撤出...