불도저는 하이퍼스레딩을 열심히 구현한 것과 같습니다. 분명히 부족한 FPU가 있는 8개의 언더코어로 리소스를 놓고 싸우기도 합니다.
놀랍게도 Boole은 멀티스레딩에서도 평균적으로 Thuban x6보다 약간 더 나은 성능을 보였습니다. 잘 병렬화된 정수 작업에서는 빠르게 계산되지만(i7에 조금 도달하지 않음) 다른 모든 항목에서는 i7을 병합하고 결과적으로 평균적으로 i5-2400 수준으로 나타납니다. 한마디로 데스크탑용 서버 프로세서입니다. 그리고 Trinity에서는 이러한 상황이 수정될 가능성이 거의 없습니다. 핵심은 불도저입니다.
В конце января 2012 года компания-разработчик терминала MetaTrader 5 анонсировала нативную поддержку OpenCL в MQL5. В статье на конкретном примере изложены основы программирования на OpenCL в среде MQL5 и приведены несколько примеров "наивной" оптимизации программы по быстродействию.
C++ Accelerated Massive Parallelism (C++ AMP) accelerates execution of C++ code by taking advantage of data-parallel hardware such as a graphics processing unit (GPU) on a discrete graphics card. By using C++ AMP, you can code multi-dimensional data algorithms so that execution can be accelerated by using parallelism on heterogeneous hardware...
Mathemat : 터미널 개발자를 위한 질문: 작업 그룹 크기를 OpenCL API에 설정하는 기능을 추가할 계획입니까? 아주 좋을 것입니다. 내가 이해하는 것처럼 아마도 CLExecute() 함수에 있을 것입니다.
CLExecute (cl_krn,work_dim,offset, work ) - 그렇지 않습니까?
bool CLExecute(
int kernel, // хендл на кернел OpenCL программыuint work_dim, // размерность пространства задач constuint & global_work_offset[], // начальное смещение в пространстве задачconstuint & global_work_size[] // общее количество задач
);
ATI는 6년 전인 2006년에 인수되었습니다.
유일한 아쉬움은 Intel의 경쟁자들이 아직 비슷한 기술을 가지고 있지 않다는 점입니다.
불도저는 하이퍼스레딩을 열심히 구현한 것과 같습니다. 분명히 부족한 FPU가 있는 8개의 언더코어로 리소스를 놓고 싸우기도 합니다.
놀랍게도 Boole은 멀티스레딩에서도 평균적으로 Thuban x6보다 약간 더 나은 성능을 보였습니다. 잘 병렬화된 정수 작업에서는 빠르게 계산되지만(i7에 조금 도달하지 않음) 다른 모든 항목에서는 i7을 병합하고 결과적으로 평균적으로 i5-2400 수준으로 나타납니다. 한마디로 데스크탑용 서버 프로세서입니다. 그리고 Trinity에서는 이러한 상황이 수정될 가능성이 거의 없습니다. 핵심은 불도저입니다.
ixbt에 따르면 ,
CPU 성능 향상은 29%에 달하며 이는 코드명 Piledriver의 새로운 프로세서 코어의 장점입니다.
그래서 내가 틀렸다. 어떤 응용 프로그램이 이것을 할 것인지 궁금합니다.
에너지 효율성 면에서는 여전히 더 나쁩니다. 4개의 물리적 코어가 8개의 독립적인 정보 스트림을 실행할 때보다 각 물리적 코어의 작업에 얼마나 많은 에너지가 소비되는지 ..
/나는 귀하의 답변에서 인용문을 분리하기 위해 게시물을 편집했습니다. 인용문 외부에 답변을 입력하려면(작동하지 않는 경우) 왼쪽의 HTML 버튼을 누르고 마크업의 맨 끝에 몇 글자를 쓰고 시각적 모드인 Mathemat/로 돌아갑니다.
https://www.mql5.com/ru/articles/405 - 이 기사를 읽은 후 프로그래머는 아니지만 GPU에서 컴퓨팅하는 주제에 관심이 있었지만 이 기사에서 http 링크를 발견했습니다. http://www.ixbt.com/video3/rad2.shtml 이 기사를 끌어 들인 ://www.ixbt.com/video3/rad.shtml . 이 주제는 복잡한 작업으로 전략 테스터를 최적화하는 성능을 높이는 옵션을 설명하기 때문에 이 프로젝트의 개발자에게 흥미로울 수 있습니다. 아마도 이것은 프로젝트 개발에 어떻게 든 도움이 될 것입니다.
Ps 나는 이 기사를 끝까지 읽지 않았다.
관심을 가져주셔서 감사합니다....
그리고 여기 사람들은 Microsoft가 VS11을 위해 구현한 C++ AMP에 대해 어떻게 생각합니까?
http://msdn.microsoft.com/en-us/library/hh265136(v=vs.110).aspx
우리는 2011년 6월 AMD Fusion Developer Summit에서 이 기술을 발표했습니다 . 동시에 사양을 공개할 계획을 발표했으며 다른 컴파일러 공급업체와 협력하여 그들이 컴파일러(모든 플랫폼에서)에서 지원할 수 있도록 하고 있습니다. .
MS는 이 언어 확장이 오픈 소스가 되기를 원합니다. 나는 VS11에서 그것을 시도했고 나는 그것이 훌륭한 것이라고 말해야합니다. 별도의 .cu에 있는 부피가 큰 CUDA SDK 코드 대신 동일한 .cpp에 몇 줄만 있습니다.
MQL5에도 같은 가능성이 있었다면 좋았을 텐데. OpenCL로 작업한 적은 없지만 거기에서 프로그래밍하는 것도 어렵다고 들었습니다.
OpenMP는 이미 요청되었습니다. 주지 마.
터미널 개발자를 위한 질문: 작업 그룹 크기를 OpenCL API에 설정하는 기능을 추가할 계획입니까? 아주 좋을 것입니다. 내가 이해하는 것처럼 아마도 CLExecute() 함수에 있을 것입니다.
CLExecute (cl_krn,work_dim,offset, work ) - 그렇지 않습니까?
아니요, 이는 글로벌 작업 공간의 크기일 뿐입니다.
그러나 로컬 작업 그룹의 크기는 터미널 개발자의 구현에 없습니다. 하지만 당신은해야합니다.
본격적인 OpenCL API에는 CLExecute()와 유사한 clEnqueueNDRangeKernel() 함수가 있습니다. 다음은 여섯 번째 인수인 const size_t * local_work_size이며 필요합니다.