Diskussion zum Artikel "OpenCL: Die Brücke zu parallelen Welten"

MetaQuotes 2016.04.29 16:02

Neuer Artikel OpenCL: Die Brücke zu parallelen Welten :

Ende Januar 2012 kündigte die Softwareentwicklungsfirma, die hinter der Entwicklung von MetaTrader 5 steht, die native Unterstützung von OpenCL in MQL5 an. Dieser Beitrag legt anhand eines anschaulichen Beispiels die Programmiergrundsätze für OpenCL in der MQL5-Umgebung dar und liefert einige Beispiele für die "naive" Optimierung des Programms, um die Betriebsgeschwindigkeit zu erhöhen.

Der Schreibbefehl (Host -> Device) initialisiert ein Speicherobjekt nach Daten und platziert das Objekt gleichzeitig im Device-Speicher.

Denken Sie daran, dass die Gültigkeit von Speicherobjekten, die im Device bereitgestellt werden, nicht in den Open-CL-Spezifikationen festgelegt ist, da sie vom Hersteller der dem Device entsprechenden Hardware abhängig ist. Seien Sie deshalb vorsichtig, wenn Sie Speicherobjekte erstellen.

Nachdem die Speicherobjekte initialisiert und in Devices geschrieben wurden, sieht das Bild etwa so aus:

Abb. 7. Ergebnis der Initialisierung der OpenCL-Speicherobjekte

Autor: Sceptic Philozoff

Andrey Dik 2012.05.16 17:50 #1

Herzlichen Dank!

Ich habe schon lange auf einen Artikel über OpenCL gewartet.

Ich werde ihn jetzt lesen. :)

Rustamzhan Salidzhanov 2012.05.16 18:11 #2

Eine Menge von bukaf :) Aber bukaf sehr notwendig und nützlich, ich werde auf diesem Granit kauen. Ich danke Ihnen!

Sceptic Philozoff 2012.05.16 20:06 #3

joo: Ich habe schon lange auf einen Artikel über OpenCL gewartet.

Ich werde ihn lesen. :)

Sie brauchen ihn wahrscheinlich nicht allzu sehr. Ihr solltet das alles schon wissen.

Im nächsten Artikel wird es ernst, es wird viel über Hardware geben.

Konstantin Grebenshikov 2012.05.17 14:31 #4

Ja. Es ist wirklich noch zu früh, um sie einzubeziehen, aber natürlich ist es notwendig, diesen Standard für die Spezialisierung anzupassen. Vielleicht wird es möglich sein, dies in der nächsten Version der sechsten thester zu tun, ich würde diese Funktionalität gerne früher haben....

EURUSD - Trends, Prognosen Erstellen einer grafischen Benutzeroberfläche FOREX - Trends, Prognosen

Sceptic Philozoff 2012.05.17 14:49 #5

GKS: Ja. Es ist wirklich noch zu früh, um sie einzuschalten.

Was ist zu früh zu aktivieren, bitte klären. Wenn OpenCL - es ist bereits aktiviert. Alle Experimente wurden direkt in MetaEditor 5 durchgeführt.

P.S. Die Hauptsache ist, dass der Programmierer durch OCL tatsächlich Zugang zu etwas hat, zu dem er vorher keinen Zugang hatte. Diese sind:

- (S)SSEx, das in Visual Studio eingebunden werden kann, aber ohne OCL nicht in MQL5 eingebunden werden kann (dlls nicht mitgerechnet).

- Zugang zu Berechnungen auf diskreten GPUs, was zusätzlich beschleunigt, was auf einem einzelnen Kern in MQL5 ohne dll-ähnliche Tricks erledigt werden kann.
.

MetaTrader 5 Strategie-Tester und Erstellen Sie Ihre eigene Wünsche für MQL5

Andrey Dik 2012.05.17 15:39 #6

Mathemat:

1. Sie brauchen es wahrscheinlich nicht allzu sehr. Sie sollten bereits wissen, wie Sie all diese Dinge tun können.

2. Im nächsten Artikel wird es ernst, es wird eine Menge über Hardware geben.

1. Ich brauche es.

2. Großartig!

Die Frage bleibt für mich unklar: Warum nennen Sie die Ausführung des OCL-Programms auf der CPU "Emulation"? Die CPU ist nur eines der Geräte, neben der GPU, mit denen das OCL-Programm arbeiten kann, wenn es einen entsprechenden Treiber für das Gerät gibt und alle Prozessorkerne geladen sind.

Документация по MQL5: Программы MQL5 / Выполнение программ

www.mql5.com

Программы MQL5 / Выполнение программ - Документация по MQL5

DirectX OpenCL: interne Implementierungstests in Diskussion zum Artikel "Neuronale

Sceptic Philozoff 2012.05.17 15:49 #7

joo: Die Frage bleibt für mich unklar: Warum nennen Sie die Ausführung eines OCL-Programms auf der CPU "Emulation"?

Weil Emulation genau das ist: langsame Emulation. Bei CPUs (dank Intel gibt es einen intelligenten Compiler, der nach Vektorisierung sucht, wenn man sie nicht explizit verbietet) erfolgt die Parallelisierung durch (S)SSEx-Befehle und vielleicht Abhängigkeitsanalysen, während GPUs viel mehr Möglichkeiten in Bezug auf SIMD-Engines haben. Außerdem gibt es breitere Busse und schnelleren Speicher - insbesondere lokalen und privaten Speicher.

Zur Hardware. Die wichtigsten Empfehlungen gelten für AMD-Hardware. Aber viele von ihnen gelten mit einer leicht abgewandelten Terminologie auch für NVidia-Hardware.

Diskussion über den Hochfrequenzhandel Diskussion zum Artikel "Genetische HAMA PAD - Ein

Andrey Dik 2012.05.17 16:17 #8

Mathemat:

Weil es sich um eine Emulation handelt, eine langsame Emulation. Bei CPUs (dank Intel gibt es einen intelligenten Compiler, der nach Vektorisierung sucht, wenn man sie nicht ausdrücklich verbietet) erfolgt die Parallelisierung durch (S)SSEx-Befehle und möglicherweise durch die Analyse von Abhängigkeiten, während GPUs viel mehr Möglichkeiten in Verbindung mit SIMD-Engines haben. Außerdem gibt es breitere Busse und schnelleren Speicher - insbesondere lokalen und privaten Speicher.

Zur Hardware. Die wichtigsten Empfehlungen gelten für AMD-Hardware. Aber viele von ihnen gelten mit einer leicht modifizierten Terminologie auch für NVidia-Hardware.

OpenCL (Open Computing Language) ist ein offener, lizenzfreier Standard für die allgemeine parallele Programmierung von CPUs, GPUs und anderen Prozessoren, der Softwareentwicklern einen portablen und effizienten Zugriff auf die Leistung dieser heterogenen Verarbeitungsplattformen ermöglicht.

Siehe - es gibt keine Erwähnung von OCL für GPUs und Emulationsmodus für andere Geräte. OpenCL ist eine universelle Programmiersprache zur Organisation paralleler Berechnungen auf allen Geräten, die mehr als einen Rechenkern haben und OCL unterstützen. Es handelt sich nicht um CUDA oder ATI Stream, die speziell für GPUs entwickelt wurden.

Außerdem sind Parallelisierung und OCL-Berechnungen auf CPUs in einigen Fällen sogar schneller als auf GPUs. Jetzt mache ich es zur Pflicht, in den Einstellungen meiner Programme ein Gerät auszuwählen, denn die Geschwindigkeit der Berechnungen hängt direkt von der Menge der verarbeiteten Daten und der "Schwere" der Berechnungen ab (hängt auch von den Eingabeeinstellungen ab) - manchmal ist es auf der GPU schneller, manchmal auf der CPU.

Diskussion zum Artikel "Algorithmen OpenCL im Handel Hier sehen Sie, was

Sceptic Philozoff 2012.05.17 17:27 #9

joo:

OpenCL (Open Computing Language) ist ein offener, lizenzgebührenfreier Standard für die allgemeine parallele Programmierung von CPUs, GPUs und anderen Prozessoren, der Softwareentwicklern einen portablen und effizienten Zugriff auf die Leistung dieser heterogenen Verarbeitungsplattformen ermöglicht.

Vielleicht haben Sie in mancher Hinsicht Recht, da die CPU als Gerät betrachtet wird. Aber einige Daten deuten darauf hin, dass es sich eher um eine Emulation handelt. Zum Beispiel gibt es solche Vermutungen, dass das Schreiben eines Puffers in den Gerätespeicher CLBufferWrite() im Falle der CPU nur "für einen Tick" erfolgt, weil die CPU nur einen globalen Speicher hat. Allerdings hat die CPU auch einen Cache, aber ich weiß nicht, was mit diesem passiert und wie er funktioniert.

Außerdem sind in einigen Fällen Parallelisierung und OCL-Berechnungen auf der CPU sogar schneller als auf der GPU.

Ja, es gibt solche Fälle, in denen z. B. das Skalarprodukt von dot( ) auf der CPU schneller ist. Aber ich würde nicht darüber spekulieren, was schneller wäre, wenn der Vergleich zwischen einem Core 2 Duo und einer leistungsfähigeren Grafikkarte als der im Link genannten stattfinden würde. Vor allem, wenn man sich um die Optimierung des Algorithmus kümmert. Es ist ein Unterschied zwischen CPU und GPU, egal was du sagst.

OpenCL: interne Implementierungstests in Genau der gleiche EA, mt5 strategie tester ticks

Konstantin Grebenshikov 2012.05.17 17:37 #10

Mathemat:

Was ist früh zu aktivieren, bitte klären. Wenn OpenCL - es ist bereits aktiviert. Alle Experimente wurden direkt in MetaEditor 5 durchgeführt.

P.S. Die Hauptsache ist, dass der Programmierer durch OCL tatsächlich Zugang zu etwas hat, zu dem er vorher keinen Zugang hatte. Diese sind:

- (S)SSEx, das in Visual Studio eingebunden werden kann, aber ohne OCL nicht in MQL5 eingebunden werden kann (dlls nicht mitgerechnet).

- Zugang zu Berechnungen auf diskreten GPUs, was zusätzlich beschleunigt, was auf einem einzelnen Kern in MQL5 ohne irgendwelche dll-artigen Tricks getan werden kann.
.

Ich meinte die Anpassung für Cloud Computing, wenn man sich vorstellt, dass jeder Prozessorkern von vielen "hungrigen Bienen" von Grafikbeschleunigern unterstützt wird, die mit vielen Computern vernetzt sind, wird es wirklich cool und schnell sein.

Die Hälfte der Arbeit ist getan, jetzt geht es nur noch darum, es für die Cloud einzuschalten....

Fragen von Neueinsteigern zu Ichimoku EA OOP vs. prozedurale Programmierung

1 2 3

Neuer Kommentar