Dmitriy Gizlyk - DNG - 交易者的个人资料 - 第14页

Dmitriy Gizlyk

4.4 (50)

信息

12+ 年经验	0 产品	0 演示版
134 工作	0 信号	0 订阅者

任何的MT4和MT5複雜專業寫作計劃。

好友 2124

Dmitriy Gizlyk 2023.03.01

已发布文章神经网络变得轻松（第三十六部分）：关系强化学习

在上一篇文章中讨论的强化学习模型中，我们用到了卷积网络的各种变体，这些变体能够识别原始数据中的各种对象。卷积网络的主要优点是能够识别对象，无关它们的位置。与此同时，当物体存在各种变形和噪声时，卷积网络并不能始终表现良好。这些是关系模型可以解决的问题。

1541

Dmitriy Gizlyk 2022.12.06

已发布文章神经网络变得轻松（第三十五部分）：内在好奇心模块

我们继续研究强化学习算法。到目前为止，我们所研究的所有算法都需要创建一个奖励政策，从而令代理者能够每次从一个系统状态过渡到另一个系统状态的转换中估算其每个动作。然而，这种方式人为因素相当大。在实践中，动作和奖励之间存在一些时间滞后。在本文中，我们将领略一种模型训练算法，该算法可以操控从动作到奖励的各种时间延迟。

· 2 1858

Dmitriy Gizlyk 2022.11.29

已发布文章神经网络变得轻松（第三十四部分）：全部参数化的分位数函数

我们继续研究分布式 Q-学习算法。在之前的文章中，我们研究了分布式和分位数 Q-学习算法。在第一种算法当中，我们训练了给定数值范围的概率。在第二种算法中，我们用给定的概率训练了范围。在这两个发行版中，我们采用了一个先验分布知识，并训练了另一个。在本文中，我们将研究一种算法，其允许模型针对两种分布进行训练。

· 2 1695

Dmitriy Gizlyk 2022.11.17

已发布文章神经网络变得轻松（第三十三部分）：分布式 Q-学习中的分位数回归

我们继续研究分布式 Q-学习。今天我们将从另一个角度来看待这种方式。我们将研究使用分位数回归来解决价格预测任务的可能性。

· 3 1542

Dmitriy Gizlyk 2022.11.08

已发布文章神经网络变得轻松（第三十二部分）：分布式 Q-学习

我们在本系列的早期文章中领略了 Q-学习方法。此方法均化每次操作的奖励。 2017 年出现了两篇论文，在研究奖励分配函数时展现出了极大的成功。我们来研究运用这种技术解决我们问题的可能性。

· 2 1797

Abdulrahman F 2023.01.20

Mm am hmm mm

Dmitriy Gizlyk 2022.10.21

已发布文章神经网络变得轻松（第三十一部分）：进化算法

在上一篇文章中，我们开始探索非梯度优化方法。我们领略了遗传算法。今天，我们将继续这个话题，并将研究另一类进化算法。

· 4 1593

Dmitriy Gizlyk 2022.09.23

已发布文章神经网络变得轻松（第三十部分）：遗传算法

今天我想给大家介绍一种略有不同的学习方法。我们可以说它是从达尔文的进化论中借鉴而来的。它可能比前面所讨论方法的可控性更低，但它允许训练不可微分的模型。

· 5 1489

Dmitriy Gizlyk 2022.09.16

已发布文章神经网络变得轻松（第二十九部分）：优势扮演者-评价者算法

在本系列的前几篇文章中，我们见识到两种增强的学习算法。它们中的每一个都有自己的优点和缺点。正如在这种情况下经常发生的那样，接下来的思路是将这两种方法合并到一个算法，使用两者间的最佳者。这将弥补它们每种的短处。本文将讨论其中一种方法。

· 7 1340

Darius Sadauskas 2022.09.21

Hello, what I'm doing wrong ? I get error on compiling : 'vae' - undeclared identifier on NeuroNet.mqh line: 4130

xuebutayan 2023.02.03

666

Dmitriy Gizlyk 2022.09.08

已发布文章神经网络变得轻松（第二十八部分）：政策梯度算法

我们继续研究强化学习方法。在上一篇文章中，我们领略了深度 Q-学习方法。按这种方法，已训练模型依据在特定情况下采取的行动来预测即将到来的奖励。然后，根据政策和预期奖励执行动作。但并不总是能够近似 Q-函数。有时它的近似不会产生预期的结果。在这种情况下，近似方法不应用于功用函数，而是应用于动作的直接政策（策略）。其中一种方法是政策梯度。

· 8 1002

Dmitriy Gizlyk 2022.08.30

已发布文章神经网络变得轻松（第二十七部分）：深度 Q-学习（DQN）