GPU gyorsított objektum-felismerés neurális konvolúciós hálózatokkal - PDF ingyenes letöltés
Rheinische Friedrich-Wilhelms-Universität Bonni Számítástudományi Intézet VI. Dominik Scherer GPU-gyorsított objektumfelismerés neurális konvolúciós hálózatokkal 2009. június 8. Diplomamunka Első lektor: Prof. Sven Behnke Második bíráló: Prof. Dr. Joachim K. megközelítés

2.4. Párhuzamos hardver 2.16. Ábra: SIMT architektúra: Több, a chipbe integrált megosztott memóriával rendelkező multiprocesszor ([Nvi08c] -ről, szerkesztve) A 16 KB-os megosztott memória, amelyhez a blokk összes szála hozzáférhet, szinte ugyanolyan gyors, de valamivel rugalmasabb. A grafikus kártya legnagyobb kapacitása 1 GB az eszköz memóriájában, amelyet az összes multiprocesszor használhat. Mivel azonban ennek a memóriának viszonylag nagy késleltetési ideje van, minden multiprocesszor 64 KB állandó memóriával rendelkezik, amely csak olvasható. Egy másik különlegesség a textúramemória, amelyet kétdimenziós hozzáférésre optimalizáltak, és amelynek címzését egy speciális textúraegység vezérli. A gazdagép csak az eszköz memóriájához férhet hozzá, az összes többi memóriaterület csak a GPU-n érhető el. Számos algoritmus számítási sebességét a rendelkezésre álló memória korlátozza. Azoknak a blokkoknak a száma, amelyeket egy multiprocesszor egyszerre képes feldolgozni, elsősorban két tényezőtől függ: Egyrészt attól, hogy egy szál hány regisztrációt igényel, másrészt pedig a megosztott memória méretétől, amelyet egy blokk 33
4.4. Bemenet és kimenet (a) színes kép (b) függőleges élszűrő (c) vízszintes élszűrő (d) fénysűrűség-komponens Y (e) színkomponens U (f) színkomponens V-komponens Elhelyezés (c) Függőleges helyzet koordinátája a szürkeárnyalatos kódolásban (d) Az él pixelek folytatása (e) Az élből való elhalványulás (f) A folytonos él pixelek elhalványulása 4.8 ábra: Alternatív lehetőségek a bemeneti szinthez túl kicsi kép kezeléséhez. 55