OpenCl和它的工具。评论和印象。 - 页 27 1...20212223242526272829 新评论 Renat Fatkhullin 2012.03.06 11:37 #261 这些都是OpenCL 1.0时代未经证实的吓人故事。感觉像是2009-2010年的文字。 [删除] 2012.03.08 03:40 #262 Renat: 这些都是OpenCL 1.0时代未经证实的吓人故事。感觉像是2009-2010年的文本。 你在说什么,Rinat? 催化剂驱动程序11.7 WHQL和11.8预览版已经可以下载,AMD已经将其用于加速OpenCL的APP-SDK转移到了中国。 应用到2.5版,现在终于通过cl_khr_fp64支持双精度/双数/FP64/watchamacallit。 但需要注意的是:它只包括基于Cypress的GPU,不包括Cayman,也不包括能够进行64位精确计算的旧芯片。 http://www.gpu-tech.org/content.php/167-AMD-Catalyst-Driver-11.7-AMD-APP-SDK-2.5-bring-double-precision-for-Cypress-AVX-for-CPUs Radeon HD 6990/6970/6950(基于Cayman)。 - 以1/4速度的双精度 Radeon HD 6870/6850/6790(基于Barts)。- 没有双精度支持 Radeon HD 6 770/6750(基于Juniper,为OEM使用而重新命名)。 - 没有双精度支持 Radeon HD 6670/6650(基于Turks)。- 没有双精度支持 Radeon HD 6450(基于Caicos)。- 没有双精度支持 Radeon HD 5970(基于赛普拉斯)。- 以1/5的速度进行双精度 Radeon HD 5870/5850/5830(基于赛普拉斯)。- 以1/5的速度进行双精度 Radeon HD 5 770/5750(基于Juniper)。 - 没有双精度支持 Radeon HD 5670/5650/5570(基于Redwood)。- 没有双精度支持 Radeon HD 5450(基于雪松)。 - 没有双精度支持 Radeon HD 4890/4870/4850/4830/4730(基于RV770/790)。- 以1/5的速度进行双精度 Radeon HD 4770(基于RV740)。- 以1/5的速度进行双精度 Radeon HD 4670/4650(基于RV730)。- 没有双精度支持 Radeon HD 4550/4350(基于RV710)。-没有双精度支持 Radeon HD 3870/3850(基于RV670)。- 双精度(以1/5的速度) Radeon HD 3650(基于RV635)。- 没有双精度支持 Radeon HD 3470/3450(基于RV615)。-没有双精度支持 Radeon HD 2900 XT/Pro/GT/OEM(基于R600)。-没有双精度支持 Radeon HD 2600 XT/Pro(基于RV630)。- 没有双精度支持 Radeon HD 2400 XT/Pro(基于RV610):- DirectX 10(虽然没有Compute Shader)和更低。 - 没有双精度支持 http://developer.download.nvidia.com/compute/cuda/4_1/rel/toolkit/docs/CUDA_Toolkit_Release_Notes_And_Errata.txt //forums.nvidia.com/index.php?showtopic=34744Windows 2003 Server尚未经过测试,也没有资格与CUDA一起使用。 Rinat,请告诉我们,怎么可能在无意中 编写一个Win32程序,使其在WinXP、Win Server 2008、Vista-Win7上运行,同时在Win Server 2003上不工作? nVidia CUDA SDK的任何3+版本的安装程序甚至不能 在Server 2003上安装(不会解压!),愚蠢地写入无效的单元格引用,像在Win 3.1中一样。 OpenCl and the tools [删除] 2012.03.08 04:54 #263 在GPU上有很多关于结构精度的问题,FIXED软件的程序员需要非常非常小心,好比说甚至来自Nvidia本身。 http://developer.nvidia.com/content/precision-performance-floating-point-and-ieee-754-compliance-nvidia-gpus 4.7 与x86的区别 英伟达GPU与x86架构的区别在于,舍入模式被编码在每个发泡点指令中,而不是动态地使用发泡点控制字。不支持浮点异常的陷阱处理程序。在GPU上,没有状态标志来指示计算何时溢出、不足或涉及不精确的算术。像SSE一样,每个GPU操作的精度都在指令中编码(对于x87,精度由浮点控制字动态控制)。 研究CUDA和OpenCL有时会给人一种超自然的感觉,即铁匠们决定用他们的 "革命 "和营销上的哗众取宠来最终杀死数学--当他们人为地制造出MY计算机到底应该做什么和怎么做的错误感觉时。提出的不是精确和可预测的数学计算,而是他们狂热的以游戏者为中心的速度。 程序员必须非常注意计算的准确性,并决定是否在CPU或GPU上进行计算。此外,硬件拥有者和微软一起偷偷摸摸地在CPU上制造了一个讨厌的混乱。 嗯,我有工作要做。再见。 Alexey Subbotin 2012.03.08 13:21 #264 似乎还没有被讨论过...... 相关链接:AMD C++ AMP库集成在Visual Studio 11中http://blogs.amd.com/developer/2012/03/01/amd-and-the-visual-studio-11-beta/ 据我所知,该测试版已经可以下载。 Andrey Dik 2012.03.08 14:15 #265 alsu: 似乎还没有被讨论过...... 相关链接:AMD C++ AMP库集成在Visual Studio 11中http://blogs.amd.com/developer/2012/03/01/amd-and-the-visual-studio-11-beta/ 据我所知,该测试版已经可以下载。 特别有趣的是这一点。 自动矢量化 在Visual Studio 11中,C++的新功能还有一个自动矢量器,它是默认开启的。 编译器将在可能的情况下对循环进行矢量化,以提高使用处理器上的矢量指令(如SSE2和SSE4.x)的性能。 以下面的代码片断为例。 float A[1000], B[1000], C[1000] 。 for (i = 0; i < 1000; i++) { A[i] = B[i] + C[i]。 } C++编译器可以对这个循环进行矢量处理,以便同时执行多个迭代,利用现代处理器上的指令大大改善性能。 除了矢量器之外,自动并行器将在系统中的多个CPU处理器上执行循环,从而使底层硬件得到更好的有效利用。 并行器需要程序员的输入来指示那些应该被并行化的循环,也可以和自动矢量器一起使用。 Alexey Subbotin 2012.03.08 14:24 #266 我想知道的是,这些东西有多少会包括AMD64支持...不想在英特尔问题上纠缠不清 Vladimir Gomonov 2012.03.08 14:43 #267 joo: 特别有趣的是这一点。 自动矢量化 在Visual Studio 11中,C++的新功能还有一个自动矢量器,它默认是打开的。 编译器将在可能的情况下对循环进行矢量化,以提高使用处理器上的矢量指令(如SSE2和SSE4.x)的性能。 以下面的代码片断为例。 float A[1000], B[1000], C[1000] 。 for (i = 0; i < 1000; i++) { A[i] = B[i] + C[i]。 } C++编译器可以对这个循环进行矢量处理,以便同时执行多个迭代,利用现代处理器上的指令大大改善性能。 除了矢量器之外,自动并行器将在系统中的多个CPU处理器上执行循环,从而使底层硬件得到更好的有效利用。 并行器需要程序员的输入来指示那些应该被并行化的循环,也可以和自动矢量器一起使用。 这很强。 真的很强。 计算技术向并行化的演进简直就在我们眼前发生。 Renat Fatkhullin 2012.03.08 15:42 #268 AlexEro: 你在说什么,Rinat? 催化剂驱动程序11.7 WHQL和11.8预览版已经可以下载,AMD已经将其用于加速OpenCL的APP-SDK转移到了中国。 我的观点是,你假装没有今天,并试图发出公然的错误结论。 例如,通过发布最老版本的显卡作为证据,并顽固地忽略了7XXX型号和Catalyst 12.x驱动程序 从你对Windows 2003的陈述来看,你是 "他们必须支持所有 "的支持者,在违反这样一个神圣条件的基础上(在你看来),世界应该承认它的无价值并去祈祷宽恕。世界只是在继续前进,不断发展并发布新的和更好的产品。 你不知道如何编写不兼容的软件,因为你不开发这种非常大规模生产的软件,你不知道技术问题和必要的妥协是什么。要求显卡制造商支持Windows 2003的旧服务器 版本是消费者的极端主义。软件制造商乐于忘记旧操作系统的动物园,把它当作一个坏梦。而司机师傅们只是在做梦。 P.S.:没有必要跳到一个琐碎的比较方法 "他们为什么支持2008年 "来取代对根本原因的真正理解。 syl: 停止使用Windows 2003服务器的破损版本--它是2012年的。 [删除] 2012.03.08 17:56 #269 Renat: 我的意思是,你假装今天并不存在,并试图得出坦率的错误结论。 例如,把最老版本的显卡作为证据贴出来,而顽固地忽略了7XXX型号和Catalyst 12.x驱动程序。 从你对Windows 2003的陈述来看,你是 "他们必须支持所有 "的支持者,在违反这样一个神圣条件的基础上(在你看来),世界应该承认它的无价值,去祈祷宽恕。世界只是在继续前进,不断发展并发布新的和更好的产品。 你不知道不兼容的软件如何编写,因为你不开发这种最大量生产的软件,你不知道技术问题和必要的权衡是什么。要求显卡制造商支持Windows 2003的旧服务器 版本是消费者的极端主义。软件制造商乐于忘记旧操作系统的动物园,把它当作一个坏梦。而司机师傅们只是在做梦。 因此,没有必要跳到 "那他们为什么支持2008年 "这种平庸的比较方法,来代替对根本原因的真正理解。 syl: 停止使用Windows 2003服务器的破损版本--它已经是2012年了 好吧,我完全理解你的答案。哈哈,我希望其他人也这样做。 就是这样,我可能会听从你的建议,这和我的意图完全一样。所以我将把你们留在这里一段时间--一年或两年。 再见。 Andrey Dik 2012.03.09 03:20 #270 AlexEro: 好吧,我非常理解你的回答。哈哈,我希望其他人也是如此。 我告诉你,我要听从你的建议,它与我的意图相吻合。所以我将把你们留在这里一段时间--一年或两年。 再见。 你永远不会从一个帖子中猜到,它的作者是the topicstarter....。他为什么要发起这个话题还不清楚。 1...20212223242526272829 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
这些都是OpenCL 1.0时代未经证实的吓人故事。感觉像是2009-2010年的文本。
你在说什么,Rinat?
催化剂驱动程序11.7 WHQL和11.8预览版已经可以下载,AMD已经将其用于加速OpenCL的APP-SDK转移到了中国。
应用到2.5版,现在终于通过cl_khr_fp64支持双精度/双数/FP64/watchamacallit。
但需要注意的是:它只包括基于Cypress的GPU,不包括Cayman,也不包括能够进行64位精确计算的旧芯片。
http://www.gpu-tech.org/content.php/167-AMD-Catalyst-Driver-11.7-AMD-APP-SDK-2.5-bring-double-precision-for-Cypress-AVX-for-CPUs
Radeon HD 6990/6970/6950(基于Cayman)。
Radeon HD 2400 XT/Pro(基于RV610):- DirectX 10(虽然没有Compute Shader)和更低。
- 没有双精度支持
http://developer.download.nvidia.com/compute/cuda/4_1/rel/toolkit/docs/CUDA_Toolkit_Release_Notes_And_Errata.txt
(不会解压!),愚蠢地写入无效的单元格引用,像在Win 3.1中一样。在GPU上有很多关于结构精度的问题,FIXED软件的程序员需要非常非常小心,好比说甚至来自Nvidia本身。
http://developer.nvidia.com/content/precision-performance-floating-point-and-ieee-754-compliance-nvidia-gpus
4.7 与x86的区别 英伟达GPU与x86架构的区别在于,舍入模式被编码在每个发泡点指令中,而不是动态地使用发泡点控制字。不支持浮点异常的陷阱处理程序。在GPU上,没有状态标志来指示计算何时溢出、不足或涉及不精确的算术。像SSE一样,每个GPU操作的精度都在指令中编码(对于x87,精度由浮点控制字动态控制)。
研究CUDA和OpenCL有时会给人一种超自然的感觉,即铁匠们决定用他们的 "革命 "和营销上的哗众取宠来最终杀死数学--当他们人为地制造出MY计算机到底应该做什么和怎么做的错误感觉时。提出的不是精确和可预测的数学计算,而是他们狂热的以游戏者为中心的速度。
程序员必须非常注意计算的准确性,并决定是否在CPU或GPU上进行计算。此外,硬件拥有者和微软一起偷偷摸摸地在CPU上制造了一个讨厌的混乱。
嗯,我有工作要做。再见。
似乎还没有被讨论过......
相关链接:AMD C++ AMP库集成在Visual Studio 11中http://blogs.amd.com/developer/2012/03/01/amd-and-the-visual-studio-11-beta/ 据我所知,该测试版已经可以下载。
似乎还没有被讨论过......
相关链接:AMD C++ AMP库集成在Visual Studio 11中http://blogs.amd.com/developer/2012/03/01/amd-and-the-visual-studio-11-beta/ 据我所知,该测试版已经可以下载。
特别有趣的是这一点。
自动矢量化
在Visual Studio 11中,C++的新功能还有一个自动矢量器,它是默认开启的。 编译器将在可能的情况下对循环进行矢量化,以提高使用处理器上的矢量指令(如SSE2和SSE4.x)的性能。 以下面的代码片断为例。
float A[1000], B[1000], C[1000] 。
for (i = 0; i < 1000; i++) {
A[i] = B[i] + C[i]。
}
C++编译器可以对这个循环进行矢量处理,以便同时执行多个迭代,利用现代处理器上的指令大大改善性能。
除了矢量器之外,自动并行器将在系统中的多个CPU处理器上执行循环,从而使底层硬件得到更好的有效利用。 并行器需要程序员的输入来指示那些应该被并行化的循环,也可以和自动矢量器一起使用。
特别有趣的是这一点。
自动矢量化
在Visual Studio 11中,C++的新功能还有一个自动矢量器,它默认是打开的。 编译器将在可能的情况下对循环进行矢量化,以提高使用处理器上的矢量指令(如SSE2和SSE4.x)的性能。 以下面的代码片断为例。
float A[1000], B[1000], C[1000] 。
for (i = 0; i < 1000; i++) {
A[i] = B[i] + C[i]。
}
C++编译器可以对这个循环进行矢量处理,以便同时执行多个迭代,利用现代处理器上的指令大大改善性能。
除了矢量器之外,自动并行器将在系统中的多个CPU处理器上执行循环,从而使底层硬件得到更好的有效利用。 并行器需要程序员的输入来指示那些应该被并行化的循环,也可以和自动矢量器一起使用。
你在说什么,Rinat?
催化剂驱动程序11.7 WHQL和11.8预览版已经可以下载,AMD已经将其用于加速OpenCL的APP-SDK转移到了中国。
我的观点是,你假装没有今天,并试图发出公然的错误结论。
例如,通过发布最老版本的显卡作为证据,并顽固地忽略了7XXX型号和Catalyst 12.x驱动程序
从你对Windows 2003的陈述来看,你是 "他们必须支持所有 "的支持者,在违反这样一个神圣条件的基础上(在你看来),世界应该承认它的无价值并去祈祷宽恕。世界只是在继续前进,不断发展并发布新的和更好的产品。
你不知道如何编写不兼容的软件,因为你不开发这种非常大规模生产的软件,你不知道技术问题和必要的妥协是什么。要求显卡制造商支持Windows 2003的旧服务器 版本是消费者的极端主义。软件制造商乐于忘记旧操作系统的动物园,把它当作一个坏梦。而司机师傅们只是在做梦。
P.S.:没有必要跳到一个琐碎的比较方法 "他们为什么支持2008年 "来取代对根本原因的真正理解。
syl: 停止使用Windows 2003服务器的破损版本--它是2012年的。
我的意思是,你假装今天并不存在,并试图得出坦率的错误结论。
例如,把最老版本的显卡作为证据贴出来,而顽固地忽略了7XXX型号和Catalyst 12.x驱动程序。
从你对Windows 2003的陈述来看,你是 "他们必须支持所有 "的支持者,在违反这样一个神圣条件的基础上(在你看来),世界应该承认它的无价值,去祈祷宽恕。世界只是在继续前进,不断发展并发布新的和更好的产品。
你不知道不兼容的软件如何编写,因为你不开发这种最大量生产的软件,你不知道技术问题和必要的权衡是什么。要求显卡制造商支持Windows 2003的旧服务器 版本是消费者的极端主义。软件制造商乐于忘记旧操作系统的动物园,把它当作一个坏梦。而司机师傅们只是在做梦。
因此,没有必要跳到 "那他们为什么支持2008年 "这种平庸的比较方法,来代替对根本原因的真正理解。
syl: 停止使用Windows 2003服务器的破损版本--它已经是2012年了
好吧,我完全理解你的答案。哈哈,我希望其他人也这样做。
就是这样,我可能会听从你的建议,这和我的意图完全一样。所以我将把你们留在这里一段时间--一年或两年。
再见。
好吧,我非常理解你的回答。哈哈,我希望其他人也是如此。
我告诉你,我要听从你的建议,它与我的意图相吻合。所以我将把你们留在这里一段时间--一年或两年。
再见。