文章 "随机数生成器质量对优化算法效率的影响" - 页 6

 
Stanislav Korotky #:

因此,关键是要将原始数据集一分为二,通过对一半数据集进行优化,控制另一半数据集的质量。

等等。现在安德鲁的算法负责的正是 MT5-Tester 所执行的优化类型。在引文中,您谈到了优化算法的悬置问题。


在讨论中,你仍能感受到某种优化算法,它在形式上并非 MT5-Tester 算法的竞争对手,但解决的搜索任务却截然不同。在 Andrei 的系列文章中并没有此类算法。

 
Andrey Dik #:

那么,是否有办法从全面搜索结果中的所有可能参数中选出我们将用于陌生数据的参数集?我们已经进行了全面搜索,这里没有优化。

现在,回答这个问题非常重要。

是的,我们相信有办法。

有什么玄机?

 

术语上似乎有些混淆。

我把优化称为寻找最佳参数(这里指交易策略)的过程。而 "最佳 "参数就是那些能很好地通过前向分析的参数。

 
Andrey Khatimlianskii #:

术语似乎有些混淆。

我把优化称为寻找最佳参数(这里指交易策略)的过程。而 "最佳 "参数就是那些能很好地通过前向分析的参数。

显然,这确实是术语上的误解。

MT5-Tester 意义上的优化是寻找最高的 FF 值。

 
fxsaber #:

显然,这确实是一个术语上的误解。

MT5-Tester 意义上的优化 - 寻找最高 FF 值。

斯坦尼斯拉夫和我说的显然不是这个意思。

寻找最大值在文章中有所提及。但从实际角度来看,这并不总是有用的。

 
Andrey Khatimlianskii #:

在文章中寻找最大限度是很有启发性的。但从实用的角度来看,它并不总是有用的。

因此,这与关于解决经典 优化问题的不同方法的系列文章有些格格不入。


要想找到OOS的有趣之处,最直接的方法就是强行中断解决经典问题的优化算法。

例如,让 GA 解决问题 10,000 次。很明显,前 3000 次的最佳 100 结果比 10 000 次的最佳 100 结果包含更多的局部极值。

因此,在经过 3000 次求解后中断并查看最佳的 100 次求解结果,对于找到稳健的设置是合理的。

 
Andrey Khatimlianskii #:

有什么阴谋?

没有什么阴谋。我问了一个问题,在某种程度上是在测试大家对术语的理解,以及 "优化 "一词的含义。

最接近术语本意的是 fxsaber。

无论如何,这既不是坏事也不是好事,既不是错的也不是对的,它只是让你更容易实现目标,避免在没有意义的地方加上意义,反之亦然--它让你更关注真正影响需要实现的目标的方面。

在架构方面,内部测试人员和优化人员的结构方式,一切都做得非常正确,苍蝇和小虫子是分开的。这就是为什么我完全可以想象,当 Metaquotes 的开发人员在工作场所看到用户说 "内部优化器的优化很合适 "之类的话时,他们是如何在精神上主动使用脏话,甚至打手势的。

我将尝试澄清术语上的混淆。

 
Andrey Khatimlianskii #:

斯坦尼斯劳和我显然在谈论别的事情。

文章中揭示了对最大值的追求。但从实际角度来看,这未必总是有用的。

是的,你说的是别的东西。听起来像是 "披露了烤羊肉串的烹饪话题,但烤羊肉串可能并不健康"。没关系,我们一起解决,把苍蝇和肉块分开。

 
Stanislav Korotky #:

这是某种术语游戏吗?我提出了 3 种选择最佳组合的方法--它们也适用于所有可能组合的完整历史运行情况。

例如,这样一个众所周知的问题:有一个 NS(比方说,根据价格增量进行交易),而优化是用来找到这个网络的权重。如果我们直接使用您的算法,就会得到一个训练过度的 NS,它将无法处理新数据。因此,关键是要将原始数据集一分为二,在对一半数据集进行优化的同时,控制另一半数据集的质量。

请解释一下 "正面应用算法 "是什么意思?我很难理解优化算法会被滥用。过度训练 "和/或 "适合 "的概念并不适用于优化算法。

不,这不是一个术语游戏,而是我试图澄清一个长期存在的误解,这个误解一直围绕着优化,尤其是优化算法。

 
fxsaber #:

因此,这有点脱离了关于解决经典 优化问题的不同方法的系列文章的背景。

是的,没错,斯坦尼斯拉夫和安德烈谈论的是这一系列文章之外的事情。而且,这一系列文章并不是关于解决优化问题的,而是关于优化算法的。优化算法只是优化问题的一部分(从术语和算法间比较的角度来看都是如此,否则原则上就不可能比较算法),因此在本系列文章中我只考虑优化算法。

我会在下面的评论中说得更清楚。我真心希望这能帮助大家从不同角度看待熟悉的事物。