交易中的机器学习:理论、模型、实践和算法交易 - 页 3171 1...316431653166316731683169317031713172317331743175317631773178...3399 新评论 Aleksey Vyazmikin 2023.08.16 20:00 #31701 Aleksey Vyazmikin #:如果在第一次迭代中随机选择价格,测试/考试样本的结果会有很大变化吗? 我自己回答--是的,会的。 我随机选择了第一个量子段,排除信号(字符串)1000 次。 这里有几张示例 gif,不同的随机第一量子迭代过程是如何进行的(可以是叶子)。 下面是中间迭代时刻的静态图片--选择和随机化的不同阶段。 可以得出什么结论? 1.你可能会很幸运,随机找到一个有效的模式:) 2. 2.如果不减少错误模式的数量,就很难仅利用贪婪原则建立模型。 3.您需要开发一些方法来估计在量子片段或薄片中观察到的规律性。 4.随机性并不能证明机器学习的成功。 5.成功需要一个逻辑上有效的模型。 6.测试样本的成功并不总是意味着考试样本的成功,反之亦然。 还能得出哪些结论? Andrey Dik 2023.08.16 22:30 #31702 Aleksey Vyazmikin #:... 可以得出什么结论?1.您可能会走运,随机找到一个工作模型:)2.如果不减少错误模式的数量,就很难仅仅利用 "贪婪 "原则建立模型。3. 您需要制定方法来估计在量子段或量子片中观察到的规律性。4.随机性并不能证明机器学习的成功。5.成功需要一个逻辑上有效的模型。6.测试样本的成功并不一定意味着考试样本的成功,反之亦然。还能得出哪些结论? 我在讨论过程中忽略了您的量化方法,抱歉,请提醒我。 时间序列的量化是非常重要的,例如,用 renko 方法量化价格,我们会得到 SB(至少在统计学上是相关的),所以 "量化它,不量化它,你还是会得到 xxx "这句话至少显得轻描淡写,因为如果有破坏信息的量化,那么就可能有提取信息的量化。当然,前提是蜱流中存在信息(我们热切地希望如此,否则 MO 的应用将毫无意义)。 Forester 2023.08.16 22:45 #31703 Andrey Dik #: 使用 renko 方法对价格进行量化,我们可以得到 SB(至少与统计相关) 我认为 SB 不会超过柱状图。Andrey Dik#: 当然,前提是刻度流中存在信息(我们热切希望如此,否则 MO 的使用将毫无意义)。 。 我认为还没有人在这里使用 MO 研究过 ticks。 Andrey Dik 2023.08.16 22:50 #31704 Forester #:我想,除了酒吧,没有比这更 SB 的了。 我认为 SB 要大得多,因为单杠的统计数据与 SB 的表现截然不同。 Forester#: 我不认为这里有人用 MO 探索过提基酒。 也许没有,至少没有对系列进行量化。 Andrey Dik 2023.08.16 22:54 #31705 也就是说,不是寻找规律性,而是寻找价格(tick)序列(我不想使用 "时间序列")的状态,而这些状态是永远无法实现的,也不会在历史上出现。 这样就可以利用边界条件来制定对交易者有利的策略。 Aleksey Vyazmikin 2023.08.16 23:05 #31706 Andrey Dik #:对不起,我在讨论过程中忽略了您的量化方法,请提醒我。 量化截点 "的概念很简单--它是预测因子的范围,在样本的每一行上都有一个数值。范围内的任何东西都成为一个单位。 划分范围的方法可以多种多样,我使用的既有 CatBoost 中内置的变体(在 bousting 中通常用于减少所需 RAM 和降低维度),也有我自己的一些变体,例如不同的数字序列。 在预测器以某种方式利用所获得的网格划分为不同范围后,我们会依次对每个区段的信息值进行评估。 如果属于某个类别的概率与样本平均值相比有 5%或更大的偏移,就会被视为有价值的信息,同时信号的数量及其在样本中的分布也会被考虑在内。 如果样本具有二进制目标,我们就会得到两组量子段,其中命中 0 或 1 的概率会相应地发生变化。 我们创建一个新的样本,其中每个量子段都有自己的一列--如果在该范围内有信号--则写 "1",如果没有--则写 "0"。 mytarmailS 2023.08.16 23:08 #31707 是什么阻碍了你像我在这里做的那样对数列进行转换/量化 https://www.mql5.com/ru/forum/86386/page3166#comment_48559717。或类似的方法。 Maxim Dmitrievsky 2023.08.17 06:00 #31708 Aleksey Vyazmikin #:答案是肯定的。我随机选择了第一个量子段,排除信号(字符串)1000 次。下面是几个 gifs 例子,说明了不同的随机第一量子段(可以是叶子)是如何进行的。 下面是中间迭代时刻的静态图片--选择和随机化的不同阶段。 可以得出什么结论?1.您可能会幸运地随机找到一个工作模型:)2.如果不减少错误模式的数量,就很难仅仅利用 "贪婪 "原则来建立模型。3. 您需要制定方法来估计在量子段或量子片中观察到的规律性。4.随机性并不能证明机器学习的成功。5.成功需要一个逻辑上有效的模型。6.测试样本的成功并不一定意味着考试样本的成功,反之亦然。还能得出什么结论? 你可以得出结论,你这几年一直在胡说八道。或者,你可能只是做了随机抽样,而你现在正在这样做。 Aleksey Nikolayev 2023.08.17 06:06 #31709 Aleksey Vyazmikin #:属于某个类别的概率与样本平均值的偏差达到或超过 5%,就会被认为是有价值的信息,信号的数量及其在样本中的分布也是如此。 在我看来,这就像是马克西姆最近写过的 "π-黑客"(pi-hacking)。除非使用一些统计测试来确定分配量子的重要性,否则这肯定是他干的。 我曾经举过一个简单的例子,在 SB 上选择一周中最适合交易的时间(这显然是不存在的)。虽然只有 5*24=120 个变量,但总能找到这样一个小时(我想时间间隔是半年)。这里也存在 "抽样稳定性"。 Maxim Dmitrievsky 2023.08.17 06:07 #31710 Andrey Dik #:即不是寻找规律性,而是寻找价格(刻度)序列(我不想使用 "时间序列")的状态,而这种状态是永远无法实现的,在历史上也不会出现。这样就可以利用边界条件来制定对交易者有利的策略。 在时间序列分析中,唯一有效的方法就是寻找规律,并通过各种手段排除异常值。如果它被定义为某个永恒的序列,或者根本不是一个序列,而是,比方说,一个堆栈或一堆,可能还有其他选择 😁。 1...316431653166316731683169317031713172317331743175317631773178...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
如果在第一次迭代中随机选择价格,测试/考试样本的结果会有很大变化吗?
我自己回答--是的,会的。
我随机选择了第一个量子段,排除信号(字符串)1000 次。
这里有几张示例 gif,不同的随机第一量子迭代过程是如何进行的(可以是叶子)。
下面是中间迭代时刻的静态图片--选择和随机化的不同阶段。
可以得出什么结论?
1.你可能会很幸运,随机找到一个有效的模式:) 2.
2.如果不减少错误模式的数量,就很难仅利用贪婪原则建立模型。
3.您需要开发一些方法来估计在量子片段或薄片中观察到的规律性。
4.随机性并不能证明机器学习的成功。
5.成功需要一个逻辑上有效的模型。
6.测试样本的成功并不总是意味着考试样本的成功,反之亦然。
还能得出哪些结论?
...
可以得出什么结论?
1.您可能会走运,随机找到一个工作模型:)
2.如果不减少错误模式的数量,就很难仅仅利用 "贪婪 "原则建立模型。
3. 您需要制定方法来估计在量子段或量子片中观察到的规律性。
4.随机性并不能证明机器学习的成功。
5.成功需要一个逻辑上有效的模型。
6.测试样本的成功并不一定意味着考试样本的成功,反之亦然。
还能得出哪些结论?
我在讨论过程中忽略了您的量化方法,抱歉,请提醒我。
时间序列的量化是非常重要的,例如,用 renko 方法量化价格,我们会得到 SB(至少在统计学上是相关的),所以 "量化它,不量化它,你还是会得到 xxx "这句话至少显得轻描淡写,因为如果有破坏信息的量化,那么就可能有提取信息的量化。当然,前提是蜱流中存在信息(我们热切地希望如此,否则 MO 的应用将毫无意义)。
Andrey Dik #:
使用 renko 方法对价格进行量化,我们可以得到 SB(至少与统计相关)
我认为 SB 不会超过柱状图。
。
我想,除了酒吧,没有比这更 SB 的了。
我认为 SB 要大得多,因为单杠的统计数据与 SB 的表现截然不同。
我不认为这里有人用 MO 探索过提基酒。
也许没有,至少没有对系列进行量化。
也就是说,不是寻找规律性,而是寻找价格(tick)序列(我不想使用 "时间序列")的状态,而这些状态是永远无法实现的,也不会在历史上出现。
这样就可以利用边界条件来制定对交易者有利的策略。
对不起,我在讨论过程中忽略了您的量化方法,请提醒我。
量化截点 "的概念很简单--它是预测因子的范围,在样本的每一行上都有一个数值。范围内的任何东西都成为一个单位。
划分范围的方法可以多种多样,我使用的既有 CatBoost 中内置的变体(在 bousting 中通常用于减少所需 RAM 和降低维度),也有我自己的一些变体,例如不同的数字序列。
在预测器以某种方式利用所获得的网格划分为不同范围后,我们会依次对每个区段的信息值进行评估。
如果属于某个类别的概率与样本平均值相比有 5%或更大的偏移,就会被视为有价值的信息,同时信号的数量及其在样本中的分布也会被考虑在内。
如果样本具有二进制目标,我们就会得到两组量子段,其中命中 0 或 1 的概率会相应地发生变化。
我们创建一个新的样本,其中每个量子段都有自己的一列--如果在该范围内有信号--则写 "1",如果没有--则写 "0"。
答案是肯定的。
我随机选择了第一个量子段,排除信号(字符串)1000 次。
下面是几个 gifs 例子,说明了不同的随机第一量子段(可以是叶子)是如何进行的。
下面是中间迭代时刻的静态图片--选择和随机化的不同阶段。
可以得出什么结论?
1.您可能会幸运地随机找到一个工作模型:)
2.如果不减少错误模式的数量,就很难仅仅利用 "贪婪 "原则来建立模型。
3. 您需要制定方法来估计在量子段或量子片中观察到的规律性。
4.随机性并不能证明机器学习的成功。
5.成功需要一个逻辑上有效的模型。
6.测试样本的成功并不一定意味着考试样本的成功,反之亦然。
还能得出什么结论?
属于某个类别的概率与样本平均值的偏差达到或超过 5%,就会被认为是有价值的信息,信号的数量及其在样本中的分布也是如此。
在我看来,这就像是马克西姆最近写过的 "π-黑客"(pi-hacking)。除非使用一些统计测试来确定分配量子的重要性,否则这肯定是他干的。
我曾经举过一个简单的例子,在 SB 上选择一周中最适合交易的时间(这显然是不存在的)。虽然只有 5*24=120 个变量,但总能找到这样一个小时(我想时间间隔是半年)。这里也存在 "抽样稳定性"。
即不是寻找规律性,而是寻找价格(刻度)序列(我不想使用 "时间序列")的状态,而这种状态是永远无法实现的,在历史上也不会出现。
这样就可以利用边界条件来制定对交易者有利的策略。