对于世界上的阴谋策划者和完全的偏执狂,或者仅仅是那些喜欢控制价格的人,欢迎你们的到来!;) - 页 7

 
Mathemat:
是的,你在吹嘘你的GPGPU计算。有无加速?

笔记本的加速度是怎么来的?拷贝到缓冲区比计算需要更多时间。

这只是一次试运行。当计算相对较重时,会有加速度。

我只是添加了一个脚本来计算整个历史上与一组给定模式(512个模式并行)的相关性,我认为会有百倍的收益(通过估计)。尸检将显示它到底会如何。

 

总之,我不是在吹牛,我在普及OpenCL。在那里!:)

这也很有趣。

 
Mathemat:

怎么样--有加速吗?

这是由yazzy提供的!!!。

2012.03.02 01:15:10     Tester-512_Test_001 (EURUSD,M1) СPU time = 7223 ms
2012.03.02 01:15:10     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.01871 at 49 pass
2012.03.02 01:15:03     Tester-512_Test_001 (EURUSD,M1) GPU time = 312 ms
2012.03.02 01:15:03     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.01871 at 49 pass
2012.03.02 01:15:02     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

结果是一样的(有效性检查),但时间却非常不同。 在这种情况下,23倍的差异。无论如何--这是很值得的。

我让一个单层感知器通过144000条的历史记录,一次性运行512次。 我喜欢它。;)

 
MetaDriver: 在这种情况下,23倍的差异。无论如何,这是很值得的。
那很好啊!
 
Mathemat:
那是相当酷的。

事实证明,典型的时间甚至稍好。下面我们来看看重播的情况。

2012.03.02 01:26:59     Tester-512_Test_001 (EURUSD,M1) СPU time = 7238 ms
2012.03.02 01:26:59     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.80004 at 320 pass
2012.03.02 01:26:51     Tester-512_Test_001 (EURUSD,M1) GPU time = 281 ms
2012.03.02 01:26:51     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.80004 at 320 pass
2012.03.02 01:26:51     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.02 01:26:48     Tester-512_Test_001 (EURUSD,M1) СPU time = 7270 ms
2012.03.02 01:26:48     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.48404 at 207 pass
2012.03.02 01:26:41     Tester-512_Test_001 (EURUSD,M1) GPU time = 281 ms
2012.03.02 01:26:41     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.48404 at 207 pass
2012.03.02 01:26:41     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

25次以上。 甚至是非常aha。:)

那是一个8入口的神经元。 现在来看看16人的那个。

2012.03.02 01:32:32     Tester-512_Test_001 (EURUSD,M1) СPU time = 14618 ms
2012.03.02 01:32:32     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.22936 at 78 pass
2012.03.02 01:32:18     Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.02 01:32:18     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.22936 at 78 pass
2012.03.02 01:32:17     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.02 01:32:01     Tester-512_Test_001 (EURUSD,M1) СPU time = 14618 ms
2012.03.02 01:32:01     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.21085 at 143 pass
2012.03.02 01:31:46     Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.02 01:31:46     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.21085 at 143 pass
2012.03.02 01:31:46     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

那是45倍的差异。

这就对了--计算量越大,恒定的开销(来回发送数组)就越小。

 

而这是1024个并行的通道。

2012.03.02 01:45:04     Tester-512_Test_001 (EURUSD,M1) СPU time = 29282 ms
2012.03.02 01:45:04     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==0.73802 at 802 pass
2012.03.02 01:44:35     Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.02 01:44:35     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==0.73802 at 802 pass
2012.03.02 01:46:36     Tester-512_Test_001 (EURUSD,M1) СPU time = 29265 ms
2012.03.02 01:46:36     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.58618 at 821 pass
2012.03.02 01:46:06     Tester-512_Test_001 (EURUSD,M1) GPU time = 328 ms
2012.03.02 01:46:06     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.58618 at 821 pass
2012.03.02 01:46:06     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

注意--在GPU上完全没有区别(有1280个核心,即整个任务适合于一次完成)。

当然,对CPU的检查是按顺序进行的。

因此,所要求的百倍实际上已经达到了:差异是89.5474倍(!)。

 

是的,重度内循环计算是OpenCL的最佳选择。

你或你认识的人难道没有一台基于A8-3850的计算机躺在身边吗?顺便说一句,它有400条图形管线(集成)!这是个很好的例子。

 
Mathemat:

你或你认识的人身边难道没有一台基于A8-3850的计算机吗?顺便说一句,它有400个GPU(集成)!这是很好的。

是否有任何混淆? 这里是http://kazan.kompiko.info/priceshop.php?desc_id=111255

似乎没有什么特别之处,只有四个核心,没有关于传送带的任何消息。

 

你可以在这里 阅读关于这块石头的描述。我非常怀疑这块石头(或者说其GPU部分)不支持OpenCL。

从CPU的角度来看,这块石头不是很好。但它有很好的集成视频,在 "好 "的情况下,你可以指望在不使用任何独立视频怪物的情况下获得几十倍的速度。这不是一台经济的超级计算机吗,嗯?

而 "五 "就是这样,事实证明,多核石的力量几乎是无用的。当然,这还不算优化:如果优化必须每天24小时运行,那么你有多少个核心,4个还是6个,这对你来说有什么区别呢?就这一点而言,即使在一个不是最快的诚实的双核赛扬G530上运行云计算...

P.S. 我不是AMD的粉丝,如果有的话。我只是想计算一下所有这些AMD的混乱最终会导致什么结果。

 

Volodya,请运行这个脚本并报告结果。

感谢MQL5 的帮助。

附加的文件: