OpenCL : tests de l'implémentation interne dans MQL5 - page 21
Vous manquez des opportunités de trading :
- Applications de trading gratuites
- Plus de 8 000 signaux à copier
- Actualités économiques pour explorer les marchés financiers
Inscription
Se connecter
Vous acceptez la politique du site Web et les conditions d'utilisation
Si vous n'avez pas de compte, veuillez vous inscrire
Ouais, je pense que j'ai compris, tu n'es pas satisfaite avec
1. la complication des algorithmes et les dépassements de mémoire dus à leur utilisation
2. et vous voulez être en mesure de compenser au stade de la copie.
Il n'est donc pas nécessaire de copier 100 000 éléments et d'effectuer 998 000 décalages.
3. mais nous devrions laisser la variante avec offset, que nous avons maintenant, parce qu'elle nous permet de ne pas copier plusieurs fois les mêmes données, mais de les prendre pour une nouvelle tâche à partir d'un tampon CL déjà existant avec un nouvel offset.
1. non. Je n'aime pas perdre du temps à faire des copies supplémentaires. Cependant, si nous utilisons la marge, nous devrons de toute façon copier dans l'espace.
2. Oui.
3. Oui.
Premières crêpes : https://www.mql5.com/ru/forum/138292/page7#601897
Joli. Impressionnant. Des crêpes délicieuses.
//---
Y aura-t-il un article sur OpenCL? Je ne me suis pas encore approché de ce sujet en pratique, mais il serait très intéressant de le lire en perspective. Ou au moins quelques exemples de scripts dans l'aide sur la façon de l'utiliser. Il n'y a pas assez d'informations pour tout le monde.
J'ai réussi à obtenir une augmentation de vitesse de x200x sur ma carte par rapport à un seul cœur de CPU.
Veuillez tester et poster les résultats.
Si la carte ne tire pas la mémoire, réduisez l'historique (CountBars) ou le nombre de passes (CountPass), ce qui est moins souhaitable.
Remorque du testeur multicanaux
Mon résultat, une accélération de 133 fois :
Il est étonnant de constater que sur un seul cœur, l'i7 est deux fois plus rapide que le X6 1100T - à des fréquences comparables (l'i7 est à environ 3,8 GHz, le 1100T à 3,7). Il est compréhensible qu'il s'agisse d'une telle informatique, mais la différence de vitesse du processeur sur un fil faible est monstrueuse.
J'ai beaucoup réfléchi, lu sur Google.
Je me suis gratté la tête.
Soit ils ont le mql-compilateur-optimiseur le plus avancé clampé pour eux-mêmes et ne nous le donnent pas, soit je ne sais plus.
Ça ne marche pas comme ça. "Je n'y crois pas !" (c) KSS.
Et très probablement, ils ont un générateur de code optimisé pour Intel.
C'est un scandale de toute façon ! Je vais me plaindre à l'ONU.
Je n'ai pas pu trouver de ligne sur le CPU dans les journaux pour une raison quelconque.
Intel Celeron G530 2.4GHz
C'est là que je ne comprends pas :
J'ai une GeForce GT 440 avec OpenCL 1.1 (2 unités, 1660 MHz, 1024 Mb, version 295.73) Temps GPU = 1513 ms
J' ai une GeForce GT 520 avec OpenCL 1.1 (1 unités, 1620 MHz, 512 Mb, version 285.62) Temps GPU = 234 ms
Comment cela est-il possible ?
Voici les spécifications comparées de la GeForce GT 440 et de la GeForce GT 520. La mienne est supérieure à tous les paramètres, mais le temps d'exécution est 6,5 fois supérieur.