Тестирование производительности ПК плюс сравнение производительности терминалов МТ4 и МТ5 - страница 5

 

Кстати во время теста рекомендую посмотреть загрузку ядер(не путать с загрузкой процессора),

заметно, что MT в некоторых стуациях параллелит код. 

 
-Aleks-:

А будет ли MT5 работать с этим чудом Intel Xeon Phi Coprocessor 3100 ?

http://www.amazon.com/Intel-Xeon-3120A-Heptapentaconta-core-Coprocessor/dp/B00D6020KO/ref=sr_1_5?s=pc&ie=UTF8&qid=1446463939&sr=1-5&keywords=Xeon

http://www.thg.ru/cpu/obzor_intel_xeon_phi/obzor_intel_xeon_phi-01.html#_intel_xeon_phi_

Форум по трейдингу, автоматическим торговым системам и тестированию торговых стратегий

Мы запускаем облачный сервис MQL5 Cloud Network!

Renat Fatkhullin, 2014.10.24 13:43

Что я лично думаю о Xeon Phi в массовом рынке - у них нет ни единого шанса:

  1. Пара серверных процов суммарно 40 ядрами (по 20 ядер) легко уделывают все версии Xeon Phi по скорости, частоте (у Phi там все по 1Ghz), памяти и энергозатратам

    Постаточно посмотреть реальные бенчмарки, чтобы увидеть, что преимущества дай бог в 2.5 раза по сравнению со слабым одиночным Xeon процом

  2. По простоте написания кода у Phi нет шансов - это не базовые ядра и к ним доступ особенный.

    Да, по сравнению с OpenCL/CUDA это огромная разница в легкости написания. Но нет - в массы не прокатит.

  3. По специализированной мощности чистые GPU процессоры далеко впереди.

    Если задача жестко требует расчетной мощности и имеет шансы на векторизацию, то ее можно выжать из GPU карт.

  4. Совершенно злостные цены.

    Мало кто решится платить по 2000 - 3000 долларов за абсолютно неликвидную железку без шансов нормального использования.


Самое важное, что за последние 2 года никакого развития Xeon Phi не получил. Все умерло на тестовых полигонах и тестовых суперкомпьютерах.

Интересная была попытка, но Intel зафейлил. Не получилось у него сделать рывок, так как снизу обычные процы уже догнали.


Для примера, у нас рабочий блейд Dell M1000 содержит 320 ядер Xeon E5-2670v2 (2.5Ghz до 3.3Ghz) с 2 террабайтами оперативки. Вот на нем можно посчитать все что угодно без каких-либо напрягов.


 
sigma7i:

Кстати во время теста рекомендую посмотреть загрузку ядер(не путать с загрузкой процессора),

заметно, что MT в некоторых стуациях параллелит код. 

Вы просто включите колонку "Threads" в диспетчере задач и посмотрите сколько потоков у МТ4/МТ5.

Все там с параллельностью очень хорошо, особенно в МТ5, где мы специально разработали новую архитектуру, которая эффективно работает на многоядерных процессорах.

 
sigma7i:

Конечно википедия не истина в последней инстанции, но все же.

https://ru.wikipedia.org/wiki/Intel_MIC раздел Характеристики. 

К томуже сам по себе чистый код не будет параллелиться, если программист явно не укажет(ну или использует спецальные библиотеки).

посмотрите вот этот тест  64 ядра и 256 гигов оперативы не дало огромной производительности,

а вот обычный комп с меньшим количеством ядер, но более высокой тактовой частотой был быстрее.

Так что можно сделать небольшой вывод, что 57 ядер  Xeon Phi не дадут колосального прироста.

Про OpenCL - да вижу, как возможность. Вообще, из той статьи, что я привел, речь идет об удобстве для программистов, так как кроме распараллеливания, как для обычных ЦПУ, ничего делать практически не надо.

Да и потом, я так понимаю, что потребность в скорости работы в режиме оптимизации.

 
Renat Fatkhullin:

Спасибо за высказанное профессиональное мнение.
 

Т.к. эти тесты не сильно нагружают процессор, думаю нужно их включать с постоянной частотой процессора - отключить в биосе снижение частоты, а то получается меряется не производительность, а технология переключения процессора при низких нагрузках.

Тут ещё программа захвата видео значительно нагружает процессор, но и так это заметно. 

 

 

На тест результат теста "Test Canvas" сильно влияет размер окна, на котором работает скрипт.

 

Вот тесты с одинаковой частотой 3.70GHz и 4-х окон с инструментами расположенные мозайкой. 

2015.11.03 03:28:37.265 Terminal Windows 7 Ultimate (x64 based PC), IE 11.00, UAC, Intel Core i7-4820K  @ 3.70GHz, RAM: 60728 / 65474 Mb, HDD: 49146/ 103128 Mb, GMT+05:00

 

===TERMINAL INFO=== MT4 MT5 Optimize=0 MT5 Optimize=1 MT4 vs MT5Opt=0 MT5 vs MT5 Opt=1 MT4 vs MT5 Opt=1
TERMINAL_BUILD 902 1210 1210
TERMINAL_CPU_CORES 8 8 8
TERMINAL_DISK_SPACE 48470 48550 49146
TERMINAL_MEMORY_PHYSICAL 65474 65474 65474
TERMINAL_MEMORY_TOTAL 4095 130948 130948
TERMINAL_MEMORY_AVAILABLE 3800 130472 130489
TERMINAL_MEMORY_USED 295 476 459
===TEST=== 0 0 0
Test Ackermann 3136 2792 0 1,12 абс абс
Test Ackermann OOP 3120 3027 0 1,03 абс абс
Test Arrays 14539 2480 172 5,86 14,42 84,53
Test Arrays OOP 2371 2465 187 0,96 13,18 12,68
Test BubbleSort 10468 2403 577 4,36 4,16 18,14
Test BubbleSort OOP 2527 2574 578 0,98 4,45 4,37
Test Call 842 826 0 1,02 абс абс
Test Call OOP 827 843 0 0,98 абс абс
Test Fibo 2403 1139 0 2,11 абс абс
Test Fibo OOP 2589 1419 0 1,82 абс абс
Test Float 2325 2325 0 1,00 абс абс
Test Float OOP 2308 2340 0 0,99 абс абс
Test Matrix 14945 4539 358 3,29 12,68 41,75
Test Matrix OOP 4400 4540 359 0,97 12,65 12,26
Test Moments 5226 4212 3916 1,24 1,08 1,33
Test Moments OOP 5085 4212 3947 1,21 1,07 1,29
Test NestedLoop 6381 6521 0 0,98 абс абс
Test NestedLoop OOP 6333 6521 0 0,97 абс абс
Test PiCalculate 4743 3088 1607 1,54 1,92 2,95
Test PiCalculate OOP 4711 3089 1591 1,53 1,94 2,96
Test QuickSort 8923 3619 2075 2,47 1,74 4,30
Test QuickSort OOP 8924 1888 1154 4,73 1,64 7,73
Test Random 2106 1622 374 1,30 4,34 5,63
Test Random OOP 2106 1623 390 1,30 4,16 5,40
Test Sieve 11606 3728 609 3,11 6,12 19,06
Test Sieve OOP 11638 3713 593 3,13 6,26 19,63
Test StrCat 31 484 483 0,06 1,00 0,06
Test StrCat OOP 15 577 577 0,03 1,00 0,03
Test String 172 312 375 0,55 0,83 0,46
Test String OOP 172 312 390 0,55 0,80 0,44
Test StrPrep 3978 3931 2075 1,01 1,89 1,92
Test StrPrep OOP 3947 3838 2090 1,03 1,84 1,89
Test StrRev 4274 4337 3884 0,99 1,12 1,10
Test StrRev OOP 4321 4243 3885 1,02 1,09 1,11
Test StrSum 5382 3385 3510 1,59 0,96 1,53
Test StrSum OOP 5367 3385 3526 1,59 0,96 1,52
Test ObjectCreate 46 125 124 0,37 1,01 0,37
Test ObjectMove 16 140 141 0,11 0,99 0,11
Test ObjectDelete 390 110 93 3,55 1,18 4,19
Test ObjectCreate OOP 31 124 125 0,25 0,99 0,25
Test ObjectMove OOP 16 234 141 0,07 1,66 0,11
Test ObjectDelete OOP 390 16 93 24,38 0,17 4,19
Test CopyRates 0 0 0 0,00 0,00 0,00
Test Canvas 18096 10296 10280 1,76 1,00 1,76
Test Print(Hello, world!!!) 889 2684 2730 0,33 0,98 0,33
Test Final  192115 116814 53025 1,64 2,20 3,62





 

 

 

Надо еще уточнить, что канвас и принт слабо относятся к тестированию языка.

Ну и интегральный показатель сильно портят.

 
unreal:


Вот тесты с одинаковой частотой 3.70GHz и 4-х окон с инструментами расположенные мозайкой. 

2015.11.03 03:28:37.265 Terminal Windows 7 Ultimate (x64 based PC), IE 11.00, UAC, Intel Core i7-4820K  @ 3.70GHz, RAM: 60728 / 65474 Mb, HDD: 49146/ 103128 Mb, GMT+05:00

Как Вам удалось вставить такую большую таблицу? У меня высвечивалось уведомление, что символов много...
 
Renat Fatkhullin:
Для примера, у нас рабочий блейд Dell M1000 содержит 320 ядер Xeon E5-2670v2 (2.5Ghz до 3.3Ghz) с 2 террабайтами оперативки. Вот на нем можно посчитать все что угодно без каких-либо напрягов.
А сколько стоит подобный компьютер сейчас? Примерно 2'500'000 рублей, я прав?
 
Joo Zepper:
А сколько стоит подобный компьютер сейчас? Примерно 2'500'000 рублей, я прав?

В рублях нам обошелся по нынешнему курсу в 11 млн рублей. Там же не россыпь из процов и плашек памяти.

Причина обращения: