В подавляющем большинстве источников информации о нейронных сетях под «а теперь давайте обучим нашу сеть» понимается «скормим целевую функцию оптимизатору» лишь с минимальной настройкой скорости обучения. Иногда говорится, что обновлять веса сети можно не только стохастическим градиентным спуском, но безо всякого объяснения, чем же...
此外,为什么要引入函数的导数来解决类似上述例子的问题呢? 为了使函数的表面更加光滑。
我们来计算一下答案的数量。在这种情况下,最大值是 10。也就是说,这个问题的函数是离散的,有很多局部极值:
让我们计算一下答案的对错。0 是错的,1 是对的。
0 1 1 0 0 0 0 0 1 0 0 1 1 1 : 4 正确。
1 1 1 0 0 0 0 0 0 0 0 0 0 1 : 4 正确。
0 1 0 1 0 1 0 0 0 0 1 1 0 0 : 4 正确。
0 0 0 0 0 0 1 0 0 0 1 1 1 : 4 正确
0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 : 4 正确
.......................................
我们可以看到,网络给出的答案选项得分是 4 分。这是网络陷入困境的一个例子。
在这种情况下,问题被简化为误差最小化,最小值是全局 0,函数有很多极值,但现在它是平滑的,游戏被简化为冷、暖、热、热,这比单纯的 "是 "或 "否 "要 "平滑 "得多。
但遗憾的是,问题函数并不总是能转化为平滑函数。文章中提出的函数应视为已经转化,而原始函数的地形要复杂得多。因此,优化算法的效率在于找到函数导数极值的能力。
如果我是在其他网站上,那就没什么了不起的,但要和看过数百万测试结果的人讨论极端问题,那就无法用语言表达了。一种想法是,他们离婚了。
再次强调:没有极端!不,我们看到了极端,甚至按利益或其他因素排序,但没有极端。就像一枚硬币上的鹰向上掉落时并没有鹰,因为那不是鹰,而是鹰的概率。你所有的极端都是极端的概率。你可以从数学期望和置信区间 的角度来谈论极值,但这是不可能的,因为不存在数学期望,因为极值的值是非稳态的!
当您在一个区间内对智能交易系统进行优化时,您会得到一组参数和一组最优结果。如果换一个区间,通常只是增加区间,就会得到另一组结果不同的参数,而且可能会出现亏损。怎么,你们都没发现吗?而且这与优化算法毫无关系。你可以遗传,可以完成超采样,这可能会改善遗传,但在优化样本之外,结果将是一个,很可能是悲哀的。
当你在一个区间内优化智能交易系统时,你会得到一组参数和一组最佳结果,这种情况你已经见过很多次了。如果你换一个区间,通常只是增加区间,你会得到另一组结果不同的参数,而且可能会出现亏损。怎么,你们都没见过这种情况吗?而且这与优化算法毫无关系。你可以遗传,可以完成超采样,这可能会改善遗传,但在优化样本之外,结果将是一个,很可能是悲哀的。
这是一个不必要的例子)))所以我们对极值的理解是错误的。
这就是如何将原始问题转化为导数的例子。结果将是一个平滑的函数,而不是一个离散的平衡函数。
一般来说就是这样。并非每种算法都能找到 "安全 "的道路。搜索特性、收敛性和收敛速度都很重要。
在最简单的情况下,它将是一条绕山而上的螺旋曲线。很明显,由于山体并不平滑,道路建设至少有几种变体--这是一个满足特定标准的解的高原,而不是山体表面某处区域形式的高原。山体上的高原不是最优解。
顺便说一句,Tester 有一个复杂的优化标准,它是一个比单独的平衡、利润因素和其他标准更平滑的函数。
https://habr.com/ru/post/318970/
学习网络的特定算法不同于通用算法,对这两种算法进行比较测试就越有趣再说一遍:极值没有任何价值:一个不稳定的点,而且这个点并不存在,因为我们面对的是随机过程,而且是非稳态过程。
我们需要寻找一个高原,即使是图中所示的高原,只要它有利可图,即使它高于局部和全局最小值。从理论上讲,这种高原将显示 TS 盈利能力的上边界。而找到的极值根本不算什么--它们肯定不在未来,但有希望出现高原
这正是我想要实现的,只是在技术层面上....。
与其说是高原,不如说是真正的信号;与其说是极值,不如说是噪音......
如果我们想当然地认为优化面是有噪声的,那么我们就需要避开噪声,寻找真正的极值,它应该对新数据更加稳健....。因为从逻辑上讲,慢信号的时间变化比快噪声慢。
由于某些原因,在最新版本中删除了复杂标准:)
似乎还在)
最后得到自己的损失函数,导数表示为夏普、误差和权重的乘积。
is_max_optimal=False 表示该值是递减的,但由于我也乘以了-1,所以情况正好相反。
是否有办法通过梯度将平衡或其他因素输入 boost.....
这是原理图:
我们在图表上标记完美交易(在极值下跌时买入,在极值上涨时卖出),然后创建一个虚假的完美交易。
我称之为完美平衡
接下来,我们计算一下贸易平衡的推动力
然后,在目标函数中,我们只需计算促进贸易平衡与理想平衡之间的误差。
这样,我们就得到了对理想平衡的调整,也就是说,这不是在寻找一个抽象的利润最大值,而是对利润平衡所体现的理想贸易的调整。
蓝色为理想平衡,黑色为跟踪和模型试验。
我想我知道)。