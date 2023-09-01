Оцениваем ядра CPU для оптимизации - страница 6
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
BMI2 (дополнение к BMI1).
Так как MPX и SGX - это про защиту, то рискну предположить, что компилятор активно использует инструкции/технологии BMI2 и есть эффект от TSX, что менее вероятно.
OpenCL на карте в априори будет намного эффективнее нескольких процессоров.
И забить на этот геморой выявления сравнений процессоров.
Но да, надо разобраться как писать код под OpenCL.
Ренат где то писал статью об этом, сам я не читал её и на сколько она информативна не могу сказать, всё сам не как не доберусь её почитать.
Алексей, мне кажется более эффективнее будет изучить как писать код под OpenCL, и прикупить для этого хорошую карточку.
OpenCL на карте в априори будет намного эффективнее нескольких процессоров.
И забить на этот геморой выявления сравнений процессоров.
Но да, надо разобраться как писать код под OpenCL.
Ренат где то писал статью об этом, сам я не читал её и на сколько она информативна не могу сказать, всё сам не как не доберусь её почитать.
На OpenCL не так то просто писать, я немного изучал теорию, легче сделать агент с технологией OpenCL, а не как сейчас, легче в плане для потребителей.
И потом, не всегда OpenCL эффективен, так я сравнивал на ПО от Яндекс (CatBoost) карту 1060 и процессор FX-8350 - оказалось, что процессор в два раза быстрей, а если такая тенденция, то экономически выгодней купить мощный процессор, чем пяток 1080i, от которых будет конечно эффект, но дорого ж... в общем не однозначно и не для всех решение.И потом, я думаю, что в компиляторе можно просто отключить поддержку новейших технологий и для старичков все заработает быстрей, опцией сделать отключение.
На OpenCL не так то просто писать, я немного изучал теорию, легче сделать агент с технологией OpenCL, а не как сейчас, легче в плане для потребителей.
И потом, не всегда OpenCL эффективен, так я сравнивал на ПО от Яндекс (CatBoost) карту 1060 и процессор FX-8350 - оказалось, что процессор в два раза быстрей, а если такая тенденция, то экономически выгодней купить мощный процессор, чем пяток 1080i, от которых будет конечно эффект, но дорого ж... в общем не однозначно и не для всех решение.
Для математических вычислений зелёные не особо подходят.
Для математики лучше красные, у них даже в стандарте зашит режим математических вычислений, который настраивается через официальное приложение.
У меня старушка Radeon 7970 референс, до сих пор тащит майнинг. Это не к тому, что майню на одной карте, нет это не выгодно, а к тому что она тащит вычисления.
Для математических вычислений на карте, нужно смотреть на количество шейдеров, чем их больше тем лучше, остальное фпс и т.д. не важно, главное шейдерные блоки.
Для математических вычислений зелёные не особо подходят.
Для математики лучше красные, у них даже в стандарте зашит режим математических вычислений, который настраивается через официальное приложение.
У меня старушка Radeon 7970 референс, до сих пор тащит майнинг. Это не к тому, что майню на одной карте, нет это не выгодно, а к тому что она тащит вычисления.
Для математических вычислений на карте, нужно смотреть на количество шейдеров, чем их больше тем лучше, остальное фпс и т.д. не важно, главное шейдерные блоки.
На сколько я знаю, красные просто умеют работать с double, а зеленые нет - это я знаю. Но, в машинном обучение (CatBoost) там заточка на операции сравнения, которые по идеи должны работать так же быстро как у красных и зеленых. А красные не поддерживаются CatBoost, увы.
В любом случае, я сам это не осилю, а исполнителей найти оказалась не так то просто за адекватную цену и пониманием дела.
Мне подсказали, что код можно ускорить за счет применения перечисления switch.
Было так:
А стало теперь так:
По первым прикидкам, FX-8350 стал работать быстрей процентов на 30, а вот процессоры линейки Phenom II стали работать примерно в 3 раза быстрей! Тесты для сравнения сделаю чуть позже, когда машины освободятся от оптимизации.
Прикладываю новую версию советника Tree_Brut_TestPL, добавил "_Fast" в названии, прошу и его протестировать - очень интересно на каких архитектурах какой будет прирост. Есть надежда, что данные исследования помогут улучшить компилятор ME.
Мне поступили дополнительные данные от участника форума Fast528 (сейчас у него нет возможности писать на форуме)
Ryzen 2700 без разгона, память 3333
Tree_Brut_TestPL 8 ядер 16 потоков
Tree_Brut_TestPL_F 8 ядер 16 потоков
Данный тест не полный, так как нужен вариант и с 8 ядрами и 8 потоками за счет активации 8 агентов, а кроме того на вкладке "Оптимизация" следует указать 16 проходов - по числу потоков (Старт 0, Шаг 1, Стоп 15).
При проведении повторного теста не забывайте чистить кэш, который находится ..\Tester\cache
Промежуточные результаты добавлю в таблицу пока как 8 ядер / 8 агентов.
К сожалению редактировать первое сообщение уже не могу, поэтому рейтинг тут размещаю
Вот результат fx8320e частота 4ГГц, память 1866 2 канала, 2 ранг.
Tree_Brut_TestPL_F_Fast
4 агента 8 проходов
8 агентов 8 проходов
на 8 агентах почти в 2 раза быстрее
Вот результат fx8320e частота 4ГГц, память 1866 2 канала, 2 ранг.
Tree_Brut_TestPL_F_Fast
4 агента 8 проходов
8 агентов 8 проходов
на 8 агентах почти в 2 раза быстрее
Спасибо, но добавьте для оценки результаты Tree_Brut_TestPL_F и Tree_Brut_TestPL !