OpenCl und die dazugehörigen Werkzeuge. Bewertungen und Eindrücke. - Seite 20

 

Ich habe alte ixbt.com-Archive ("Fan"-Threads) gelesen, die sich auf die Zeit der Fusion von AMD und ATI beziehen. Hier ist ein solcher Beitrag (Auszug daraus):

Думаю, что в основе лежит идея АТИ использовать графический процессор для решения физических задач. Если такой комбинированный спецпроцессор оснастить двухканальным контроллером памяти и ХайперТранспортом, его можно ставить в АМД4х4. Получится домашний суперкомпьютер. Благодаря НТ сильно уменьшатся задержки между CPU и графическим адаптером, что ускорит игры. Также всякие расчёты будут идти в несколько раз быстрее, чем на универсальном процессоре.

Dieser Beitrag wurde vor 5,5 Jahren veröffentlicht, und damals konnte noch niemand etwas über Llano-Steine (und OpenCL) wissen. Aber wir wissen: Der Kauf von ATI war eine strategische Entscheidung von AMD.

Und nun - schauen wir uns die AMD A8-3850 CPU und insbesondere die Eigenschaften ihres Grafikkerns an(hier - kurz):

So gelang es ihnen, bis zu 400 (in der A8-Familie) bzw. 320 (A6) Grafikprozessoren unter eine einzige Kühlkörperabdeckung zu packen. Die erste ist bereits auf dem Niveau der Radeon HD 5570, nur die Taktfrequenz ist 50 MHz niedriger.

Unten in der Tabelle desselben Artikels ist der Grafikkern des A8-Prozessors als Radeon HD 6550D aufgeführt.

Natürlich gibt es keine 1280 Übertragungen wie bei der HD 6930, aber 400 ist nicht schlecht im Vergleich zur integrierten Intel HD 2000 Grafik.

Es stellt sich also die Frage, ob es sich lohnen würde, OpenCL-Code auf der integrierten APU-Grafikeinheit ohne diskrete Grafikkarten auszuführen. Allerdings wäre der Speicher eher DDR3 als GDDR5 und die Busbreite ist... ...wir wissen nicht, welche Art von Busbreite. Dennoch bezweifle ich sehr, dass AMD bei der Herstellung von Llano nicht an diese Art der Verwendung ihrer Steine gedacht hat.

P.S. Ehrlich gesagt habe ich mich nie für CPUs von AMD interessiert, aber angesichts der jüngsten Hinwendung von Metaquotes zu GPGPU-Berechnungen habe ich irgendwie nachgedacht.

P.P.S. Gute Nachrichten: Die nächste Generation von Intel-Prozessoren wird OpenCL unterstützen.

 

Das bedeutet, dass es keinen Sinn macht, Grafikkarten mit OpenCL zu kaufen, da der langsame Datentransferbus von der CPU zur GPU und zurück in vielen Fällen die Leistung der Berechnungen zunichte macht. Wenn die GPU an einem Hochgeschwindigkeitsbus mit der CPU sitzt, wird dieser Nachteil beseitigt.

Außerdem ist es wahrscheinlich, dass die Grafikkarten leer sein werden, d.h. sie werden überhaupt nicht mit GPUs ausgestattet sein, wie es früher bei den so genannten Software-Modems, d.h. prozessorlosen Geräten, der Fall war. Vermutlich werden die Grafikkarten in das Motherboard eingebaut, so dass alles direkt ohne zusätzliche Steckplätze geht.

Wie auch immer, wer weiß, aber ich habe es nicht eilig, GPU-kompatible Grafikkarten zu kaufen, weil ich keine Spiele spiele und in MT5 kann ich im Moment nichts außer Mandelbrot-Fraktalen zeichnen:

1. Das Testgerät unterstützt kein OpenCL, d.h. es ist nicht möglich, die Optimierungsgeschwindigkeit durch Aufrüstung der GPU-Hardware zu erhöhen, sondern nur durch die Taktfrequenz von CPU und RAM.

2. Die Entwickler stellen immer noch die Möglichkeit in Frage, die Berechnungen für TA-Indikatoren und Oszillatoren zu beschleunigen, da die Vektorberechnungen ihre eigenen Merkmale haben und nicht alle Aufgaben mit ihnen durchgeführt werden können.

 
Reshetov:

Das bedeutet, dass es keinen Sinn macht, Grafikkarten mit OpenCL zu kaufen, da der langsame Datentransferbus von der CPU zur GPU und zurück in vielen Fällen die Leistung der Berechnungen zunichte macht. Wenn die GPU an einem Hochgeschwindigkeitsbus mit der CPU sitzt, wird dieser Nachteil beseitigt.

Außerdem ist es wahrscheinlich, dass die Grafikkarten leer sein werden, d.h. sie werden überhaupt nicht mit GPUs ausgestattet sein, wie es früher bei den so genannten Software-Modems, d.h. prozessorlosen Geräten, der Fall war. Vermutlich werden die Grafikkarten in das Motherboard eingebaut, so dass alles direkt ohne zusätzliche Steckplätze geht.

http://www.thg.ru/cpu/amd_apu_llano_a8_3500m/amd_apu_llano_a8_3500m-01.html ist eine ernsthafte Überprüfung von AMDs APU-Plänen und aktuellen Fähigkeiten.

Trotzdem, Jura, ich würde nicht so kategorisch sein. Ich spiele selbst keine Spiele, und ich werde mir auch keinen Desktop mit AMD APU bauen. Was soll ich also tun? Kaufen Sie eine Grafikkarte.

Fantasie. In Zukunft wird AMD eine APU mit einer mehr oder weniger wettbewerbsfähigen CPU und einer wirklich leistungsstarken integrierten GPU auf einem Niveau, das nicht unter dem der heutigen HD 68xx-7xxx liegt, und GDDR5-Speicher anbieten... extern. Mit DDR3 kommen Sie nicht weit, auch nicht mit dem schnellsten Modell.

Und Intel geht nirgendwo hin: Die Konkurrenz ist nicht verschwunden, sie hat sich nur in einen anderen Bereich verlagert. Jetzt hat AMD angesichts seiner finanziellen Möglichkeiten und seines technologischen Rückstands kaum eine Chance, Intel bei CPUs zu überholen. Aber bei den integrierten GPUs haben sie definitiv die Nase vorn. Und um Grafiken mit vernünftiger Wärmeableitung herzustellen (nicht mit den derzeitigen 300 W bei leistungsstarken Grafikkarten, sondern mindestens 5 Mal weniger), werden sie hart arbeiten müssen.

 
Mathemat:

Sag mir, Kisa, von Künstler zu Künstler, kannst du zeichnen? (c) Ilf und Petrov


Die wichtigste Frage ist: Wofür kauft man ein Videospiel, wenn nicht zum Spielen?

1. Um Fraktale 100 Mal schneller zu zeichnen? Ich brauche sie nicht in der Hölle.

2. um OpenCL zu erlernen, was von Strategy Tester nicht unterstützt wird? Ich brauche es auch nicht.


Beantworten Sie diese Frage: Was ist der Zweck der Grafikkarte im Autotrading und alles wird klar.

 
Reshetov:

2. OpenCL erlernen, was von dem Strategietester nicht unterstützt wird? Das brauche ich auch nicht.

Sie wird noch nicht unterstützt. Das wird sich bald ändern.
 
Reshetov:

Das bedeutet, dass es keinen Sinn macht, OpenCL-Grafikkarten zu kaufen, da der langsame Datenbus von der CPU zur GPU und zurück in vielen Fällen die Rechenleistung beeinträchtigt. Wenn die GPU an einem Hochgeschwindigkeitsbus mit der CPU sitzt, wird dieser Nachteil beseitigt.

Es gibt viele Berechnungsaufgaben, bei denen man eine Menge Berechnungen durchführen muss. Es werden nur Eingabedaten und Ergebnisse hin- und hergeschickt. Der GPU-eigene Speicher und sogar DDR5 sind für den internen Bedarf ausreichend.


Im Allgemeinen weiß ich es nicht, aber ich habe es nicht eilig, GPU-Grafikkarten zu kaufen, weil ich keine Spiele spiele und es in MT5 bisher unmöglich ist, etwas anderes als Mandelbrot-Fraktale zu zeichnen:

1. Das Testgerät unterstützt kein OpenCL, d. h. es ist nicht möglich, die Optimierungsgeschwindigkeit durch Aufrüstung der GPU-Hardware zu erhöhen; dazu können nur die CPU und die RAM-Taktfrequenz verwendet werden.

Im Tester wurde die Unterstützung einfach durch eine Bedingung deaktiviert, da das MQL5 Cloud Network zu diesem Zeitpunkt den OpenCL-Status der Agenten nicht berücksichtigte.

Im nächsten Build werden wir es aktivieren - ohne Probleme. Wir haben die notwendigen Änderungen in der Cloud bereits vorgenommen.

2. Die Entwickler stellen noch immer die Möglichkeit in Frage, die Berechnungen für TA-Indikatoren und Oszillatoren zu beschleunigen, da Vektorberechnungen ihre eigenen Merkmale haben und nicht alle Aufgaben mit ihnen durchgeführt werden können.

Ja, das ist ein großes Problem - die große Mehrheit der Algorithmen kann im Prinzip nicht auf GPUs beschleunigt werden.

Vor allem aber gibt es einen starken Trend zur Universalisierung bei der Entwicklung von GPU-Anbietern. Was vor zwei Jahren noch nicht sichtbar war, vor einem Jahr noch Zweifel an den Zielen aufkommen ließ, wird heute im Scheinwerferlicht der Ziele und Bemühungen sichtbar.

Wir dürfen diese Richtung nicht verlassen.

 
Mathemat:

Und Intel geht nirgendwo hin: Die Konkurrenz ist nicht verschwunden, sondern hat sich nur in einen anderen Bereich verlagert. Jetzt hat AMD angesichts seiner finanziellen Möglichkeiten und seines technologischen Rückstands kaum eine Chance, Intel bei CPUs zu überholen. Aber bei den integrierten GPUs haben sie definitiv die Nase vorn. Und um Grafiken mit vernünftiger Wärmeableitung herzustellen (nicht mit den derzeitigen 300 W bei leistungsstarken Grafikkarten, sondern mindestens 5 Mal weniger), müssen sie hart arbeiten.

Es ist sehr gut, dass die Hersteller begonnen haben, sich auf den Wettbewerb in diesem neuen Bereich einzustellen. Ansonsten stagniert die technologische Entwicklung und der Wettbewerb im CPU-Bereich seit Jahren.

Wenn die CPUs von Intel tatsächlich beginnen, OpenCL nativ zu unterstützen, würde dies eine schnelle Verbreitung von OpenCL in gängiger Software bedeuten.

 

Übrigens haben wir einen großen Durchbruch bei der Universalisierung von Aufgaben für Agenten und das gesamte MQL5 Cloud Network erzielt. Sie werden die Änderungen in den nächsten Builds sehen.

In der Tat ist MetaTrader 5 eine universelle Berechnungsplattform mit unbegrenzter Skalierung geworden (warten Sie auf 2-3 Builds für die Fertigstellung). Diese Änderung stammt ebenfalls aus dem Bereich des Übergangs der GPU zu universellen Berechnungen. Viele werden sagen, dass das unnötig ist, aber für uns ist das Ziel klar und der Punkt ist gemacht. Schauen Sie sich die Auswirkungen in den nächsten 5-10 Jahren an.

 
Reshetov: Beantworten Sie die Frage, was der Zweck von Video/Audio beim Autotrading ist, und alles wird klar und verständlich.

Ich mache jetzt einen EA. Die Berechnungen können tatsächlich bei jedem Tick durchgeführt werden (sehr klein), aber nur aufgrund der Tatsache, dass ich den schwierigsten Teil in init() gesetzt.

Auf einem recht schnellen i3-2120 sind diese Berechnungen in etwa 10 Sekunden erledigt. Es gibt eine einfache, sehr einfache Schleife mit vielen Iterationen (etwa eine Million). Man hofft auf einen Geschwindigkeitsschub bei OpenCL. Und in der Phase der ständigen Neukompilierung gibt es kein escaping init(). Trotzdem sollten Sie lieber nur 0,2 Sekunden statt 10 Sekunden warten.

Für den Handel ist diese Optimierung nicht von Bedeutung (ich kann einmal 10 Sekunden tolerieren, wenn ich einen EA starte), aber in der Entwicklungsphase ist es eine ordentliche Ersparnis an Zeit und Nerven.

 
Mathemat: Es gibt einen einfachen, sehr einfachen Zyklus mit vielen Iterationen(etwa eine Million).

genau wie Elder: "Das Handelssystem sollte auf die Rückseite einer Briefmarke passen", aber die technische Analyse ist nicht mehr das, was sie einmal war, es ist an der Zeit, die Ticks in Quanten zu zerlegen )))).

Grund der Beschwerde: