OpenCL: pruebas de implementación interna en MQL5

Vladimir Gomonov 2012.04.22 22:18 #591

Mathemat:

Sí, MD, no te va muy bien con una CPU desnuda. Sin embargo, Intel está por todas partes...

Oh, vamos, tienes una gran tarjeta gráfica.

Me da miedo tocarlo. Una vez lo desinstalé y me encontré en una oscuridad casi total: Windows lo enganchó con algún driver inapropiado. Tuve que volver a insertar el SDK de AMD APP en condiciones de visibilidad del 1%. Fue divertido... :))) Pulse todos los botones por centésima vez...................

[¡Archivo!] Cualquier pregunta de FOREX - Tendencias, previsiones Discusión sobre el artículo

Sceptic Philozoff 2012.04.22 22:21 #592

MetaDriver: Sí. Me estoy rascando la cabeza. Pero tal vez el conductor está torcido. Tengo miedo de tocarlo.

Es curioso: incluso los controladores nativos están torcidos, tanto para Intel como para AMD. Esperemos que sólo sea un problema de crecimiento.

hrenfx 2012.04.22 22:37 #593

Amigos, ¿podrían informar si este OpenCL en una CPU pura da esa aceleración sólo en MQL5 o también en otros lenguajes?

¿Has hecho la siguiente comparación: MQL5 + OpenCL VS C++ + Optimización completa del compilador?

Sospecho que no es OpenCL lo que mola sino la falta de optimizaciones en el propio MQL5.

P.D. Tengo un i7 2700K, intentaré (cuando llegue) probarlo con una CPU limpia.

Discusión sobre el artículo Esto es lo que Interés y Humor

Vladimir Gomonov 2012.04.22 22:37 #594

Mathemat:
Es curioso: incluso los controladores nativos están torcidos, tanto para Intel como para AMD. Esperemos que sólo sea un problema de crecimiento.

Bueno, espero que en un par de años esto no ocurra, todo funcionará bien. De momento tengo otros problemas: aprender a programar bien estas cosas... :)

Vladimir Gomonov 2012.04.22 22:42 #595

hrenfx:

Amigos, ¿podrían informar si este OpenCL en una CPU pura da esa aceleración sólo en MQL5 o también en otros lenguajes?

¿Has hecho la siguiente comparación: MQL5 + OpenCL VS C++ + Optimización completa del compilador?

Sospecho que no es OpenCL lo que mola sino la falta de optimizaciones en el propio MQL5.

P.D. Tengo un i7 2700K e intentaré (cuando llegue) probarlo con una CPU limpia.

No, no lo hicimos.

¡Adelante! Buen material.

Básicamente, el código se porta a C++ en diez minutos como máximo (en una CPU desnuda que cuente). Cómo usar OpenCL en C++ sólo lo he visto en una cartilla y nunca lo he probado. En realidad, me gustaría haberlo hecho.

[¡AVISO CERRADO!] Cualquier pregunta ¿Existen niveles de soporte ¿Cómo puedo determinar si

Sceptic Philozoff 2012.04.22 22:46 #596

hrenfx: Tengo la sospecha de que no es OpenCL lo que mola sino la falta de optimizaciones en el propio MQL5.

Sí, es lógico. Hace poco tuve una discusión en el foro de ixbt con un analista de CPU que comparte la misma opinión. La discusión comenzó aquí (mi nick es tamehtaM). Por favor, no me des una patada por mi incompetencia. Pero tengo la impresión de que Felid también se excede: habla con demasiada frecuencia de la IGP, incluso cuando ésta, la IGP, está ausente o es demasiado débil.

Mi primer post en este hilo fue escrito cuando aún no sabía cómo instalar correctamente el runtime de Intel OpenCL. De hecho, todavía no estoy seguro de que se haya configurado correctamente. Pero ya es unas tres veces mejor que en el SDK de AMD APP.

Las cifras de aceleración son dolorosamente grandes, eso es seguro. Y, obviamente, deberían ser menores cuando aparezcan las optimizaciones.

Lo interesante es que incluso sin estas optimizaciones la quinta es más rápida que la cuarta.

Y la aceleración en sí no es lo principal. Lo principal son las cifras absolutas de tiempo de ejecución. Definitivamente no van a empeorar. Para ser más precisos, no deberían empeorar.

¿El más exitoso? una estrategia de negociación ¿Por qué no leo

Sergey 2012.04.23 16:44 #597

Mathemat:

Evidentemente, se trata de una tarjeta discreta, no de una CPU: esos aumentos de velocidad son difícilmente alcanzables en emulación. Y el número de dispositivos ya es de 5, lo que es realmente espeluznante.

Si no te importa ejecutar un código ligeramente modificado, por favor, y publicar el resultado aquí. En el código, los cálculos para los distintos dispositivos OpenCL se ponen en un bucle (deberían ser rápidos) mientras que el cálculo en x86, el más largo, se ejecuta sólo una vez. Será largo, pero el script en sí se ejecuta una vez.

Me doy cuenta de que ya te estoy aburriendo. Pero en cualquier caso será una buena información para el equipo de soporte.

Aquí está el resultado.

2012.04.23 21:42:58 ParallelTester_00-01x_cycle (EURUSD,H1) CpuTime/GpuTime = 439.0727802037846

2012.04.23 21:42:58 ParallelTester_00-01x_cycle (EURUSD,H1) Resultado en Cpu MachResult==1.41575 a 7544 pass

2012.04.23 21:42:58 ParallelTester_00-01x_cycle (EURUSD,H1) Indicadores sociales = 16; Recuento de barras históricas = 144000; Recuento de pasadas = 12800

2012.04.23 21:42:58 ParallelTester_00-01x_cycle (EURUSD,H1) Tiempo de CPU = 301643 ms

2012.04.23 21:37:56 ParallelTester_00-01x_cycle (EURUSD,H1) Resultado en Gpu MachResult==1.41575 a 7544 pass

2012.04.23 21:37:56 ParallelTester_00-01x_cycle (EURUSD,H1) Indicadores sociales = 16; Recuento de barras históricas = 144000; Recuento de pasadas = 12800

2012.04.23 21:37:56 ParallelTester_00-01x_cycle (EURUSD,H1) Tiempo GPU = 687 ms

¡2012.04.23 21:37:55 ParallelTester_00-01x_cycle (EURUSD,H1) OpenCL init OK! Número de dispositivo = 4

2012.04.23 21:37:55 ParallelTester_00-01x_cycle (EURUSD,H1) Resultado en Gpu MachResult==1.41575 a 7544 pass

2012.04.23 21:37:55 ParallelTester_00-01x_cycle (EURUSD,H1) Recuento de indicadores = 16; Recuento de barras históricas = 144000; Recuento de pasadas = 12800

2012.04.23 21:37:55 ParallelTester_00-01x_cycle (EURUSD,H1) Tiempo GPU = 234 ms

¡2012.04.23 21:37:55 ParallelTester_00-01x_cycle (EURUSD,H1) OpenCL init OK! Número de dispositivo = 3

2012.04.23 21:37:55 ParallelTester_00-01x_cycle (EURUSD,H1) Resultado en Gpu MachResult==1.41575 a 7544 pass

2012.04.23 21:37:55 ParallelTester_00-01x_cycle (EURUSD,H1) Recuento de indicadores = 16; Recuento de barras históricas = 144000; Recuento de pasadas = 12800

2012.04.23 21:37:55 ParallelTester_00-01x_cycle (EURUSD,H1) Tiempo GPU = 234 ms

¡2012.04.23 21:37:54 ParallelTester_00-01x_cycle (EURUSD,H1) OpenCL init OK! Número de dispositivo = 2

2012.04.23 21:37:54 ParallelTester_00-01x_cycle (EURUSD,H1) Resultado en Gpu MachResult==1.41575 a 7544 pass

2012.04.23 21:37:54 ParallelTester_00-01x_cycle (EURUSD,H1) Recuento de indicadores = 16; Recuento de barras históricas = 144000; Recuento de pasadas = 12800

2012.04.23 21:37:54 ParallelTester_00-01x_cycle (EURUSD,H1) Tiempo GPU = 234 ms

¡2012.04.23 21:37:54 ParallelTester_00-01x_cycle (EURUSD,H1) OpenCL init OK! Número de dispositivo = 1

2012.04.23 21:37:54 ParallelTester_00-01x_cycle (EURUSD,H1) Resultado en Gpu MachResult==1.41575 a 7544 pass

2012.04.23 21:37:54 ParallelTester_00-01x_cycle (EURUSD,H1) Recuento de indicadores = 16; Recuento de barras históricas = 144000; Recuento de pasadas = 12800

2012.04.23 21:37:54 ParallelTester_00-01x_cycle (EURUSD,H1) Tiempo GPU = 234 ms

¡2012.04.23 21:37:54 ParallelTester_00-01x_cycle (EURUSD,H1) OpenCL init OK! Número de dispositivo = 0

OpenCL: internal implementation tests Nuevo terminal de cliente New MetaTrader 4 Client

Sceptic Philozoff 2012.04.23 17:01 #598

casinonsk: