У кого есть опыт работы с Open CL? - страница 4

 
Alexey Volchanskiy:
Андрей, это реально круто! Это на ителловской либе или как-то самосотятельно?

Дрова OCL ставлю для процессоров Intell, больше ничего. Никаких вызовов dll, весь код работает не вылезая из MQL5. У меня Core i5-2500, то есть 4 ядра, получалось получить ускорение для внутренней оптимизации советника в 3-3,5 раза. И это получил я, непрофессиональный программист, профи бы приблизился к ~4-х кратному ускорению. Для видеокарт кратное ядрам ускорение получить значительно труднее, я писал об этом выше и нужно иметь это ввиду.   

 

Про "интеловский с++ рвет, автопараллелизм" - это жутчайшее мифотворчество в режиме "слышал где-то, читал" десятилетней давности.

На самом деле это слившийся аутсайдер с дико глючным компилятором, а автопарралелизмом/конвееризацией там и не пахнет в реальности. Наши многократные проверки на больших проектах это показывают. Речь о самых последних коммерческих версиях интеловского компилятора.

Он просто слился и его давно уже обогнали остальные компиляторы.

 
Renat Fatkhullin:

...

Как считаете, что будет быстрее, стойка из 8 процессоров Intell Xeon 8 ядер (8*8=64 ядер), или 8 процессоров AMD Opteron 16 ядер (8*16=128 ядер) для оптимизации на агентах? И, если можно, ссылочку где можно заказать подобный суперкомп.
 
Andrey Dik:
Как считаете, что будет быстрее, стойка из 8 процессоров Intell Xeon 8 ядер (8*8=64 ядер), или 8 процессоров AMD Opteron 16 ядер (8*16=128 ядер) для оптимизации на агентах? И, если можно, ссылочку где можно заказать подобный суперкомп.

Конечно 128 в любом случае выиграют, если разница в частоте не в 2 раза будет.

Вместо ксеонов по 8 ядер лучше взять более частотные старые дешевые i7 - мощность на доллар будет изумительная.

Если строить расчетную ферму, то один из вариантов дешевого подхода:

  • самые дешевые материнки с минимумом функционала и встроенным видео
  • самые дешевые SSD 128Gb (на 64Gb, если найдете)
  • дешевая память на 8 Gb
  • дешевые 8 ядерные (4 core + 4 ht) Intel i7 gen 2 (2011-2012 года) с высокой частотой
  • кустарное шасси на N слотов

В общем, путь как у майнеров, только все дешевле и без видеокарт.

Или использовать MQL5 Cloud Network - все будет работать гораздо быстрее, без геморроя, но в долгий срок дороже.

Еще вариант - использовать офисную сеть, оставив вычисления на ночь.

 
Renat Fatkhullin:

Вместо ксеонов по 8 ядер лучше взять более частотные старые дешевые i7 - мощность на доллар будет изумительная.

Спасибо.

Но вроде как для многопроцессорных систем подходят только ксеоны и соответсвенно оптероны?

ЗЫ. полазил по сайтам конфигураторам супер пк, максимум предлагают 8-и процессорные решения, ценовой минимум чего либо сколь нибудь серъёзного 0,5 млн руб., а лучше иметь 2-5 млн. руб.

ЗЗЫ. Если нужно быстро и безгеморойно что то оптить сравнительно недорого - облако идеальное решение, но если что то нужно оптить дённо и ночно, то придется раскошелится на многопроцессорную систему - в итоге получится дешевле чем облако. Решения на базе суперкомпов на GPU типа Tesla я перестал рассматривать, в виду сложности написания эффективного кода для GPU, проще и во многих случаях производительнее использовать всё таки OCL и агенты на ядрах CPU. Естественно говорим учитывая специфику нашего форума.

 
Andrey Dik:

Спасибо.

Но вроде как для многопроцессорных систем подходят только ксеоны и соответсвенно оптероны?

ЗЫ. полазил по сайтам конфигураторам супер пк, максимум предлагают 8-и процессорные решения, ценовой минимум чего либо сколь нибудь серъёзного 0,5 млн руб., а лучше иметь 2-5 млн. руб.

Если есть где размещать железо, то на авито много интересного продают - серверные мат платы за 15к можно купить на 4 ксеона,и соответственно ксеоны пучками раздают. Я думал замарочиться на этот счет, но гемороем оказались куллера - их трудно найти по дешевой цене, да и корпуса для серверов под высокочастотные камни должны охлаждаться в стойке, а для шкафа нужно отдельное место... Можно брать сервера под апгрейд - их распродает и часто не  разделе ПК.

Под Opteron сложно найти мать б.у... 

Весной я купил 3 ПК 6 ядерных за 24к - phenom II и очень доволен покупкой - дела по разработке АТС реально пошли быстрей - я работаю с MT4.

 
-Aleks-:

Если есть где размещать железо, то на авито много интересного продают - серверные мат платы за 15к можно купить на 4 ксеона,и соответственно ксеоны пучками раздают. Я думал замарочиться на этот счет, но гемороем оказались куллера - их трудно найти по дешевой цене, да и корпуса для серверов под высокочастотные камни должны охлаждаться в стойке, а для шкафа нужно отдельное место... Можно брать сервера под апгрейд - их распродает и часто не  разделе ПК.

Под Opteron сложно найти мать б.у... 

Весной я купил 3 ПК 6 ядерных за 24к - phenom II и очень доволен покупкой - дела по разработке АТС реально пошли быстрей - я работаю с MT4.

Ну да, как вариант можно купить несколько отдельных ПК, объединить в сеть, сеть использовать для агентов. Получится очень дёшево и очень сердито, но задачи OCL раздать на компы в сеть не получится. Именно поэтому я рассматриваю вариант с многопроцессорной системой, а не с группой отдельных ПК объединённых в сеть.
 
Andrey Dik:
Ну да, как вариант можно купить несколько отдельных ПК, объединить в сеть, сеть использовать для агентов. Получится очень дёшево и очень сердито, но задачи OCL раздать на компы в сеть не получится. Именно поэтому я рассматриваю вариант с многопроцессорной системой, а не с группой отдельных ПК объединённых в сеть.

Если не секрет, Вам это нужно для работы в реальном времени или для одиночного прохода в тестере?

Всё ж рекомендую посмотреть бу серверное - куда разумней по фондоотдаче будет. 

 
-Aleks-:

Если не секрет, Вам это нужно для работы в реальном времени или для одиночного прохода в тестере?

Всё ж рекомендую посмотреть бу серверное - куда разумней по фондоотдаче будет. 

По моим прикидкам можно получить х20 кратное и больше ускорение на многопроцессорных решениях. Не сутки ждать, а всего 1 час, не 20 минут, а 1 минуту, не 20 секунд, а 1 секунду. Там где реалтайм оптимизация была невозможной - станет возможной. Правда у меня пока нет таких задач на сегодняшний день, просто хочу ускорить свои оптимизации.
 
Andrey Dik:

Спасибо.

Но вроде как для многопроцессорных систем подходят только ксеоны и соответсвенно оптероны?

ЗЫ. полазил по сайтам конфигураторам супер пк, максимум предлагают 8-и процессорные решения, ценовой минимум чего либо сколь нибудь серъёзного 0,5 млн руб., а лучше иметь 2-5 млн. руб.

ЗЗЫ. Если нужно быстро и безгеморойно что то оптить сравнительно недорого - облако идеальное решение, но если что то нужно оптить дённо и ночно, то придется раскошелится на многопроцессорную систему - в итоге получится дешевле чем облако. Решения на базе суперкомпов на GPU типа Tesla я перестал рассматривать, в виду сложности написания эффективного кода для GPU, проще и во многих случаях производительнее использовать всё таки OCL и агенты на ядрах CPU. Естественно говорим учитывая специфику нашего форума.

Если хотите собрать числодробило, то только путь максимальной дешевизны с кишками наружу и без ксеонов как я указал.

Варианты с попыткой на одну мать поставить несколько процессоров выйдут слишком дорого, особенно если брать 20-24 (10-12 + HT) ядерные процессоры по 2000-2500 евро за штуку.

Причина обращения: