Heterogén rendszerarchitektúra - Mi az, hogy valójában Hardwareluxx
Az AMD folyamatosan említi a HSA-t, de mi az a HSA? A heterogén rendszerarchitektúrát az AMD hivatalosan bejelentette a 2011. évi AFDS-en (AMD Fusion Developer Summit) azzal a céllal, hogy felgyorsítsa a jövőbeni szoftvereket a grafikus egység és a CPU egyidejű használatával. Vannak olyan feladatok, amelyeket a CPU hatékonyabban vállalhat, és vannak olyan feladatok, amelyeket a GPU jobban teljesít. Azóta sok minden történt, mivel az AMD négy generációval előzi meg az APU-t (Accelerated Processing Unit). A "Llano" és a "Bobcat" chipek az APU-k első generációjához tartoznak, amelyek klasszikus értelemben egyszerűen CPU és GPU ugyanazon a kockán. Ezeknek vannak vagy nem voltak HSA jellemzői. Mindezek ellenére fontos lépés volt az AMD számára.

A második generáció a "Triled" és a "Richland" APU-kból áll, amelyek a "Piledriver" magokon alapulnak. Ezek már egyszerű HSA funkciókat kínálnak, de még mindig nem értek véget a történetnek. Csak a "Jaguar" és a HUMA technológia, a GCN grafikus részével együtt érte el a következő magasabb szintet. A GCN árnyékolók a C ++ használatával programozhatók, ezért időhatékonyabban programozhatók, mintha a szoftvermérnököknek bonyolult shader nyelveket kellene használniuk. A "Kaveri" és a "Jaguar" utódja, a "Puma" révén az AMD elérte a jelenlegi fejlettségi szintet a HSA funkciókészlet területén.
A HSA Foundation a világ minden tájáról származó chipgyártók, mikrochip-fejlesztők és szoftverfejlesztők szövetsége. A legismertebb nevek közé tartozik természetesen a kaliforniai Advanced Micro Devices (AMD) alapító, az angliai ARM Limited, az ugyancsak kaliforniai ARM nehézsúlyú Qualcomm és más, elsősorban az ARM-re támaszkodó cégek, mint a Samsung és a MediaTek.
Ezzel az alapítvánnyal az AMD és a többi tag tovább akarja optimalizálni saját zsetonjait közös know-how-val, és mint nagy nehézsúlyú ember arra ösztönzi a szoftveripart, hogy optimalizálja a HSA-t. Mindenekelőtt erre van szükség egyrészt az AMD-re, másrészt lehetőségre is, mivel az Intel processzorai egyértelműen felülmúlják a tiszta x86-os számítási teljesítményt. A vállalatok számos egyetemmel is együttműködnek, akik know-how-val támogatják őket.
A HSA Alapítvány közösen kifejlesztett fejlesztői eszközöket próbál használni annak érdekében, hogy az építészeti megközelítés programozása a fejlesztők számára a lehető legegyszerűbb és platformokon átívelőbb legyen. Amikor az eszközök teljesen kifejlesztettek, nem számít, hogy a programot később fordítják-e ARM architektúrával rendelkező processzorokhoz, vagy x86 architektúrájú APU-khoz. Ezután a fordító elvégzi az architektúra-specifikus optimalizációkat. Ezen túlmenően, feltételezve a megfelelő utasításkészleteket, a RISC utasításokat közvetlenül el lehet küldeni a magokhoz, mert az összetett CISC utasításkészletet sok generáció óta, még az x86 processzorokban is, RISC utasításkészletgé fordítják a többé-kevésbé gyors dekóderek. Ez a lépés elhagyható, és ezáltal először is egyszerűsíti az ARM és az x86 CPU-k egyidejű programozását, és a dekóderen keresztüli fordításhoz szükséges idő megszűnik.
A hUMA egy olyan technológia, amely lehetővé teszi a CPU és a GPU számára, hogy azonos memóriaterülethez jussanak. Előtte ez nem volt lehetséges, mert a CPU és a GPU mindegyike lefoglalt egy memóriaterületet a RAM-ban, és ez már nem volt elérhető a másik egység számára. A hUMA segítségével lehetséges, hogy a CPU és a GPU ugyanazokhoz a fájlokhoz férhet hozzá, anélkül, hogy az adatok időigényes oda-vissza másolása történne, és kétség esetén egy kicsit nagyobb teljesítmény kerül kiküszöbölésre. Ez csak akkor történhet meg, ha a szoftver ezt kifejezetten támogatja. Csak a hUMA révén vált lehetségessé az olyan absztrakciós rétegek leküzdése, mint a DirectCompute vagy az OpenCL, és a programozás közvetlenül a C ++ magas szintű nyelvvel.
Az olyan programok, mint a Photoshop, vagy általában a renderelési folyamatokkal vagy a grafikával foglalkozó programok óriási hasznot húzhatnak ebből a technológiából, mert itt azokat a feladatokat, amelyeket egy árnyékoló valóban jobban képes elvégezni, mint egy CPU mag, nem kizárólag a CPU-nak kellene kezelnie. Ma már elérhetők az Adobe Photoshop szűrők, amelyeket az OpenCL vagy a CUDA gyorsít a grafikus kártyán. De nem mindegyik, mivel az Adobe szerint az adatok másolása tönkreteszi azt az (idő) nyereséget, amelyet a grafikus kártyán történő számítással érnek el.
[h3] hQ (heterogén sorbanállás) [/ h3]
A hQ-t csak nemrég jelentette be az AMD. Ez a technológia, amelyet csak a januárban megjelenő "Kaveri" processzorokban fognak használni, lehetővé teszi a CPU és a GPU számára, hogy a feladatokat egyenlő alapon dolgozzák fel. Korábban a CPU mindig a GPU-hoz rendelte a feladatokat. Tehát ő volt a mester a két egység között. A szoftvernek itt is támogatnia kell a hQ-t, mert az operációs rendszer közvetlen intézkedése nélkül osztja szét a feladatokat. Az úgynevezett feladatsorokat a program közvetlenül felhasználói módban hajtja végre, ami mindenekelőtt lerövidíti azt az időt, amelyre akkor lenne szükség, ha a feladatokat csak az operációs rendszeren keresztül, kernel módban hajtanák végre. Maga a Microsoft is rendelkezik hasonló interfésszel a hüvelyében, mégpedig a C ++ AMP-vel, de ez a DirectCompute-on keresztül fut, és a Microsoft majdnem leállította a további fejlesztéseket.
Az AMD stratégiája egyértelmű: még akkor is, ha a jelenlegi APU-k első ránézésre kevésbé gyorsnak tűnnek, mint a verseny, bizonyos feladatokra inkább alkalmasak, mint amilyennek látszik. Csak a megfelelően optimalizált szoftverek képesek teljes mértékben kiaknázni ezt a potenciált, és itt az AMD megpróbálja a különböző technológiákat jobban piacra hozni azáltal, hogy kölcsönhatásba lépnek a vállalkozás más méreteivel. Az időnek meg kell határoznia, hogy ez sikerül-e.
A jelenlegi Intel és AMD processzorokkal kapcsolatos vásárlási tanácsok segítenek abban, hogy ne veszítsen nyomot. Itt megmutatjuk, hogy mely processzorok a legjobb választás - függetlenül attól, hogy a tiszta teljesítményről vagy az ár-teljesítmény arányról van szó.