对于世界上的阴谋策划者和完全的偏执狂，或者仅仅是那些喜欢控制价格的人，欢迎你们的到来!;)

Vladimir Gomonov 2012.03.01 17:59 #61

Mathemat:
是的，你在吹嘘你的GPGPU计算。有无加速？

笔记本的加速度是怎么来的？拷贝到缓冲区比计算需要更多时间。

这只是一次试运行。当计算相对较重时，会有加速度。

我只是添加了一个脚本来计算整个历史上与一组给定模式（512个模式并行）的相关性，我认为会有百倍的收益（通过估计）。尸检将显示它到底会如何。

Vladimir Gomonov 2012.03.01 19:04 #62

总之，我不是在吹牛，我在普及OpenCL。在那里!:)

这也很有趣。

Vladimir Gomonov 2012.03.01 21:20 #63

Mathemat:

怎么样--有加速吗？

这是由yazzy提供的！！！。

2012.03.02 01:15:10     Tester-512_Test_001 (EURUSD,M1) СPU time = 7223 ms
2012.03.02 01:15:10     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.01871 at 49 pass
2012.03.02 01:15:03     Tester-512_Test_001 (EURUSD,M1) GPU time = 312 ms
2012.03.02 01:15:03     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.01871 at 49 pass
2012.03.02 01:15:02     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

结果是一样的（有效性检查），但时间却非常不同。在这种情况下，23倍的差异。无论如何--这是很值得的。

我让一个单层感知器通过144000条的历史记录，一次性运行512次。我喜欢它。;)

Sceptic Philozoff 2012.03.01 21:25 #64

MetaDriver: 在这种情况下，23倍的差异。无论如何，这是很值得的。

那很好啊!

Vladimir Gomonov 2012.03.01 21:29 #65

Mathemat:
那是相当酷的。

事实证明，典型的时间甚至稍好。下面我们来看看重播的情况。

2012.03.02 01:26:59     Tester-512_Test_001 (EURUSD,M1) СPU time = 7238 ms
2012.03.02 01:26:59     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.80004 at 320 pass
2012.03.02 01:26:51     Tester-512_Test_001 (EURUSD,M1) GPU time = 281 ms
2012.03.02 01:26:51     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.80004 at 320 pass
2012.03.02 01:26:51     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.02 01:26:48     Tester-512_Test_001 (EURUSD,M1) СPU time = 7270 ms
2012.03.02 01:26:48     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.48404 at 207 pass
2012.03.02 01:26:41     Tester-512_Test_001 (EURUSD,M1) GPU time = 281 ms
2012.03.02 01:26:41     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.48404 at 207 pass
2012.03.02 01:26:41     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

25次以上。甚至是非常aha。:)

那是一个8入口的神经元。现在来看看16人的那个。

2012.03.02 01:32:32     Tester-512_Test_001 (EURUSD,M1) СPU time = 14618 ms
2012.03.02 01:32:32     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.22936 at 78 pass
2012.03.02 01:32:18     Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.02 01:32:18     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.22936 at 78 pass
2012.03.02 01:32:17     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!
2012.03.02 01:32:01     Tester-512_Test_001 (EURUSD,M1) СPU time = 14618 ms
2012.03.02 01:32:01     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.21085 at 143 pass
2012.03.02 01:31:46     Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.02 01:31:46     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.21085 at 143 pass
2012.03.02 01:31:46     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

那是45倍的差异。

这就对了--计算量越大，恒定的开销（来回发送数组）就越小。

Vladimir Gomonov 2012.03.01 21:48 #66

而这是1024个并行的通道。

2012.03.02 01:45:04     Tester-512_Test_001 (EURUSD,M1) СPU time = 29282 ms
2012.03.02 01:45:04     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==0.73802 at 802 pass
2012.03.02 01:44:35     Tester-512_Test_001 (EURUSD,M1) GPU time = 327 ms
2012.03.02 01:44:35     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==0.73802 at 802 pass
2012.03.02 01:46:36     Tester-512_Test_001 (EURUSD,M1) СPU time = 29265 ms
2012.03.02 01:46:36     Tester-512_Test_001 (EURUSD,M1) Result on Cpu МахResult==1.58618 at 821 pass
2012.03.02 01:46:06     Tester-512_Test_001 (EURUSD,M1) GPU time = 328 ms
2012.03.02 01:46:06     Tester-512_Test_001 (EURUSD,M1) Result on Gpu МахResult==1.58618 at 821 pass
2012.03.02 01:46:06     Tester-512_Test_001 (EURUSD,M1) OpenCL init OK!

注意--在GPU上完全没有区别（有1280个核心，即整个任务适合于一次完成）。

当然，对CPU的检查是按顺序进行的。

因此，所要求的百倍实际上已经达到了：差异是89.5474倍（！）。

Sceptic Philozoff 2012.03.01 21:55 #67

是的，重度内循环计算是OpenCL的最佳选择。

你或你认识的人难道没有一台基于A8-3850的计算机躺在身边吗？顺便说一句，它有400条图形管线（集成）！这是个很好的例子。

Vladimir Gomonov 2012.03.01 22:24 #68

Mathemat:

你或你认识的人身边难道没有一台基于A8-3850的计算机吗？顺便说一句，它有400个GPU（集成）！这是很好的。

是否有任何混淆？这里是http://kazan.kompiko.info/priceshop.php?desc_id=111255

似乎没有什么特别之处，只有四个核心，没有关于传送带的任何消息。

Sceptic Philozoff 2012.03.01 23:50 #69

你可以在这里阅读关于这块石头的描述。我非常怀疑这块石头（或者说其GPU部分）不支持OpenCL。

从CPU的角度来看，这块石头不是很好。但它有很好的集成视频，在 "好 "的情况下，你可以指望在不使用任何独立视频怪物的情况下获得几十倍的速度。这不是一台经济的超级计算机吗，嗯？

而 "五 "就是这样，事实证明，多核石的力量几乎是无用的。当然，这还不算优化：如果优化必须每天24小时运行，那么你有多少个核心，4个还是6个，这对你来说有什么区别呢？就这一点而言，即使在一个不是最快的诚实的双核赛扬G530上运行云计算...

P.S. 我不是AMD的粉丝，如果有的话。我只是想计算一下所有这些AMD的混乱最终会导致什么结果。

Andrey Dik 2012.03.02 03:45 #70

Volodya，请运行这个脚本并报告结果。

感谢MQL5 的帮助。

附加的文件：

1_mlp_mql_compiler.mq5 15 kb

对于世界上的阴谋策划者和完全的偏执狂，或者仅仅是那些喜欢控制价格的人，欢迎你们的到来!;) - 页 7