2012.03.0201:15:10 Tester-512_Test_001 (EURUSD,M1) СPU time = 7223 ms
2012.03.0201:15:10 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.01871 at 49 pass
2012.03.0201:15:03 Tester-512_Test_001 (EURUSD,M1) GPU time = 312 ms
2012.03.0201:15:03 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.01871 at 49 pass
2012.03.0201:15:02 Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.0201:26:59 Tester-512_Test_001 (EURUSD,M1) СPU time = 7238 ms
2012.03.0201:26:59 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.80004 at 320 pass
2012.03.0201:26:51 Tester-512_Test_001 (EURUSD,M1) GPU time = 281 ms
2012.03.0201:26:51 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.80004 at 320 pass
2012.03.0201:26:51 Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.0201:26:48 Tester-512_Test_001 (EURUSD,M1) СPU time = 7270 ms
2012.03.0201:26:48 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.48404 at 207 pass
2012.03.0201:26:41 Tester-512_Test_001 (EURUSD,M1) GPU time = 281 ms
2012.03.0201:26:41 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.48404 at 207 pass
2012.03.0201:26:41 Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
25次以上。 甚至是非常aha。:)
那是一个8入口的神经元。 现在来看看16人的那个。
2012.03.0201:32:32 Tester-512_Test_001 (EURUSD,M1) СPU time = 14618 ms
2012.03.0201:32:32 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.22936 at 78 pass
2012.03.0201:32:18 Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.0201:32:18 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.22936 at 78 pass
2012.03.0201:32:17 Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.0201:32:01 Tester-512_Test_001 (EURUSD,M1) СPU time = 14618 ms
2012.03.0201:32:01 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.21085 at 143 pass
2012.03.0201:31:46 Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.0201:31:46 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.21085 at 143 pass
2012.03.0201:31:46 Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.0201:45:04 Tester-512_Test_001 (EURUSD,M1) СPU time = 29282 ms
2012.03.0201:45:04 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==0.73802 at 802 pass
2012.03.0201:44:35 Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.0201:44:35 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==0.73802 at 802 pass
2012.03.0201:46:36 Tester-512_Test_001 (EURUSD,M1) СPU time = 29265 ms
2012.03.0201:46:36 Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.58618 at 821 pass
2012.03.0201:46:06 Tester-512_Test_001 (EURUSD,M1) GPU time = 328 ms
2012.03.0201:46:06 Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.58618 at 821 pass
2012.03.0201:46:06 Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
是的,你在吹嘘你的GPGPU计算。有无加速?
笔记本的加速度是怎么来的?拷贝到缓冲区比计算需要更多时间。
这只是一次试运行。当计算相对较重时,会有加速度。
我只是添加了一个脚本来计算整个历史上与一组给定模式(512个模式并行)的相关性,我认为会有百倍的收益(通过估计)。尸检将显示它到底会如何。
总之,我不是在吹牛,我在普及OpenCL。在那里!:)
这也很有趣。
怎么样--有加速吗?
这是由yazzy提供的!!!。
结果是一样的(有效性检查),但时间却非常不同。 在这种情况下,23倍的差异。无论如何--这是很值得的。
我让一个单层感知器通过144000条的历史记录,一次性运行512次。 我喜欢它。;)
那是相当酷的。
事实证明,典型的时间甚至稍好。下面我们来看看重播的情况。
25次以上。 甚至是非常aha。:)
那是一个8入口的神经元。 现在来看看16人的那个。
那是45倍的差异。
这就对了--计算量越大,恒定的开销(来回发送数组)就越小。
而这是1024个并行的通道。
注意--在GPU上完全没有区别(有1280个核心,即整个任务适合于一次完成)。
当然,对CPU的检查是按顺序进行的。
因此,所要求的百倍实际上已经达到了:差异是89.5474倍(!)。
是的,重度内循环计算是OpenCL的最佳选择。
你或你认识的人难道没有一台基于A8-3850的计算机躺在身边吗?顺便说一句,它有400条图形管线(集成)!这是个很好的例子。
你或你认识的人身边难道没有一台基于A8-3850的计算机吗?顺便说一句,它有400个GPU(集成)!这是很好的。
是否有任何混淆? 这里是http://kazan.kompiko.info/priceshop.php?desc_id=111255
似乎没有什么特别之处,只有四个核心,没有关于传送带的任何消息。
你可以在这里 阅读关于这块石头的描述。我非常怀疑这块石头(或者说其GPU部分)不支持OpenCL。
从CPU的角度来看,这块石头不是很好。但它有很好的集成视频,在 "好 "的情况下,你可以指望在不使用任何独立视频怪物的情况下获得几十倍的速度。这不是一台经济的超级计算机吗,嗯?
而 "五 "就是这样,事实证明,多核石的力量几乎是无用的。当然,这还不算优化:如果优化必须每天24小时运行,那么你有多少个核心,4个还是6个,这对你来说有什么区别呢?就这一点而言,即使在一个不是最快的诚实的双核赛扬G530上运行云计算...
P.S. 我不是AMD的粉丝,如果有的话。我只是想计算一下所有这些AMD的混乱最终会导致什么结果。
Volodya,请运行这个脚本并报告结果。
感谢MQL5 的帮助。