OpenCl и инструменты для него. Отзывы и впечатления. - страница 20

 

Почитываю старые архивы ixbt.com ("фанатские" ветки), относящиеся ко времени слияния AMD и ATI. Вот накопал такой пост (выдержка оттуда):

Думаю, что в основе лежит идея АТИ использовать графический процессор для решения физических задач. Если такой комбинированный спецпроцессор оснастить двухканальным контроллером памяти и ХайперТранспортом, его можно ставить в АМД4х4. Получится домашний суперкомпьютер. Благодаря НТ сильно уменьшатся задержки между CPU и графическим адаптером, что ускорит игры. Также всякие расчёты будут идти в несколько раз быстрее, чем на универсальном процессоре.

Этот пост был опубликован 5.5 лет назад, и о камнях Llano (и об OpenCL) тогда не могли знать. Но мы-то знаем: покупка ATI оказалась стратегическим решением AMD.

А теперь - смотрим на CPU AMD А8-3850 и в особенности на характеристики его графического ядра (вот тут - кратко):

В результате чего под единую крышку теплорассеивателя удалось запихать аж 400 (в семействе А8) или 320 (А6) графических конвееров. Первое — уже уровень Radeon HD 5570; только тактовая частота на 50 МГц меньше.

Ниже в таблице той же статьи графическое ядро процессора A8 указано как Radeon HD 6550D.

Конечно, конвейеров не 1280, как в HD 6930, но и 400 тоже совсем неплохо в сравнении с интегрированной графикой Intel HD 2000.

Вот и интересно, а стоит ли овчинка выделки - если попробовать запустить код OpenCL на встроенной графике APU без всяких дискретных видюх? Правда, память там будет DDR3, а не GDDR5, да и ширина шины... неизвестно какая. Но все же сильно сомневаюсь, что AMD не подумала о таком применении своих камней, когда делала Llano.

P.S. Откровенно говоря, никогда не интересовался CPU от AMD, но вот в свете последнего поворота Metaquotes к расчетам на GPGPU как-то и призадумался.

P.P.S. Приятная новость: Следующее поколение процессоров Intel будет поддерживать OpenCL.

 

Сиё означает, что нет смысла покупать видяхи с OpenСL, т.к. медленная шина передачи данных от CPU к GPU и обратно, во многих случаях, сводит на нет производительность вычислений. Если GPU будет сидеть на высокоскоростной шине с CPU, то этот недостаток будет устранен.

Более того, скорее всего, видеокарты станут пустышками, т.е. не будут вообще комплектоваться GPU, как в свое время было с так называемыми софтовыми модемами, т.е. беспроцессорными устройствами. Предположительно, видяхи будут встроенными в материнскую плату, чтобы все шло напрямую без дополнительных слотов.

В общем фиг его знает, но затариваться видяхами с GPU я не спешу, т.к. в игры не играю, а в МT5 пока ничего кроме фрактала Мандельброта нарисовать пока невозможно:

1. Тестер не поддерживает вообще никаких OpenCL, т.е. повысить скорость оптимизации за счет наращивания GPU-шного железа невозможно, а можно только за счет CPU и тактовой частоты OЗУ

2. Разработчики пока ставят под сомнение возможность ускорения вычислений для индикаторов и осцилляторов ТА, т.к. векторные вычисления имеют свои особенности и не все задачи можно выполнять с их помощью.

 
Reshetov:

Сиё означает, что нет смысла покупать видяхи с OpenСL, т.к. медленная шина передачи данных от CPU к GPU и обратно, во многих случаях, сводит на нет производительность вычислений. Если GPU будет сидеть на высокоскоростной шине с CPU, то этот недостаток будет устранен.

Более того, скорее всего, видеокарты станут пустышками, т.е. не будут вообще комплектоваться GPU, как в свое время было с так называемыми софтовыми модемами, т.е. беспроцессорными устройствами. Предположительно, видяхи будут встроенными в материнскую плату, чтобы все шло напрямую без дополнительных слотов.

http://www.thg.ru/cpu/amd_apu_llano_a8_3500m/amd_apu_llano_a8_3500m-01.html - серьезный обзор планов и текущих возможностей AMD APU.

И все-таки, Юра, я бы не был настолько категоричным. Я и сам в игры не играю, а на AMD APU делать себе десктоп пока не собираюсь. И что мне делать? Покупать видяху.

Пофантазируем. В будущем у AMD будет APU с более-менее конкурентным CPU и реально мощным интегрированным GPU на уровне не ниже современных HD 68хх-7ххх, а память GDDR5... внешняя. На DDR3 далеко не уедешь, даже на самой быстрой.

Да и Intel никуда не денется: конкуренция не исчезла, а просто сместилась в другую область. Сейчас у AMD очень мало шансов нагнать Intel по CPU - при их финансовых возможностях и технологическом отставании. Но вот по интегрированному GPU они точно впереди. А чтобы сделать графику со вменяемым рассеянием тепла (не современными 300 W на мощных видяхах, а хотя бы раз в 5 меньше), потрудиться еще придется.

 
Mathemat:

Скажите, Киса, мне, как художник художнику, а вы рисовать умеете? (с) Ильф и Петров


Самый главный вопрос, а для чего покупать видяху, кроме как для игр?

1. Фракталы рисовать в 100 раз быстрее? Они мне нафиг не нужны.

2. Изучать OpenCL, который не поддерживается тестером стратегий? Это мне тоже не надо.


Ответьте на этот вопрос для чего видяха в автотрейдинге и все станет ясно и понятно.

 
Reshetov:

2. Изучать OpenCL, который не поддерживается тестером стратегий? Это мне тоже не надо.

Пока не поддерживается. Это скоро изменится.
 
Reshetov:

Сиё означает, что нет смысла покупать видяхи с OpenСL, т.к. медленная шина передачи данных от CPU к GPU и обратно, во многих случаях, сводит на нет производительность вычислений. Если GPU будет сидеть на высокоскоростной шине с CPU, то этот недостаток будет устранен.

Есть много расчетных задач, где надо затратно и много посчитать. Пересылка туда/обратно лишь исходных данных и результатов. Собственной памяти GPU, да еще и DDR5 достаточно для внутренних нужд.


В общем фиг его знает, но затариваться видяхами с GPU я не спешу, т.к. в игры не играю, а в МT5 пока ничего кроме фрактала Мандельброта нарисовать пока невозможно:

1. Тестер не поддерживает вообще никаких OpenCL, т.е. повысить скорость оптимизации за счет наращивания GPU-шного железа невозможно, а можно только за счет CPU и тактовой частоты OЗУ

В тестере просто одним условием отключили поддержку, так как в то время в MQL5 Cloud Network не учитывался статус наличия OpenCL у агентов.

В следующем билде включим - никаких проблем нет. Необходимые изменения в клауд уже внесли.

2. Разработчики пока ставят под сомнение возможность ускорения вычислений для индикаторов и осцилляторов ТА, т.к. векторные вычисления имеют свои особенности и не все задачи можно выполнять с их помощью.

Да, это большая проблема - подавляющее большинство алгоритмов нельзя ускорить на GPU принципиально.

Но самое главное - это мощный тренд универсализации в разработках производителей GPU. Если 2 года назад это не было видно, год назад были сомнения в их целях, то сегодня цели и усилия светят прожектором в лицо.

Нельзя пропускать это направление.

 
Mathemat:

Да и Intel никуда не денется: конкуренция не исчезла, а просто сместилась в другую область. Сейчас у AMD очень мало шансов нагнать Intel по CPU - при их финансовых возможностях и технологическом отставании. Но вот по интегрированному GPU они точно впереди. А чтобы сделать графику со вменяемым рассеянием тепла (не современными 300 W на мощных видяхах, а хотя бы раз в 5 меньше), потрудиться еще придется.

Очень хорошо, что производители начали разогреваться в конкуренции на новом поле. Иначе технологическое развитие и конкуренция в зоне CPU уже много лет стагнирует.

Если реально CPU от Intel начнут поддерживать OpenCL нативно, то это означает быстрый приход OpenCL в обычный софт.

 

Кстати, мы сделали огромный рывок в универсализации задач для агентов и всего MQL5 Cloud Network. В ближайших билдах увидите изменения.

Фактически MetaTrader 5 превратился (ждать 2-3 билда для финализации) в универсальную расчетную платформу с неограниченным масштабированием. Это изменение тоже из той же области перехода GPU на универсальные расчеты. Многие люди будут говорить, что это не нужно, но нам цель ясна и дело сделано. Смотрите на эффекты в следующие 5-10 лет.

 
Reshetov: Ответьте на этот вопрос для чего видяха в автотрейдинге и все станет ясно и понятно.

Делаю сейчас советник. Вычисления на самом деле можно делать на каждом тике (очень небольшие), но только за счет того, что в init() я вынес самое тяжелое.

На довольно шустром i3-2120 эти расчеты выполняются примерно за 10 секунд. Там простой, очень простой цикл с большим количеством итераций (примерно миллион). Есть надежда, что на OpenCL будет прирост скорости. А на этапе постоянных перекомпиляций от init() никуда не денешься. Все ж приятнее ждать не 10, а, скажем, только 0.2 секунды.

Для торговли именно эта оптимизация ни к чему (разочек 10 секунд при запуске советника можно и потерпеть), но на этапе разработки - вполне приличная экономия времени и нервов.

 
Mathemat:Там простой, очень простой цикл с большим количеством итераций (примерно миллион).

прям по Элдеру: "Торговая система должна умещаться на обратной стороне почтовой марки", да не тот уже нынче тех.анализ, тики пора на кванты разбивать ))))

Причина обращения: