Mély tanulás a futball számára Számítógépes látás (I. rész)

Ebben a cikksorozatban megnézhetjük, hogy a mély tanulást hogyan használják a futballban. Ahelyett, hogy egyszerűt csinálna.

Ebben a cikksorozatban meglátjuk, hogy a mély tanulást hogyan használják a futballban. Ahelyett, hogy egyszerű katalógust készítenénk arról, hogy mi történik, fel fogjuk tenni a kezünket, és felépítünk egy valódi teljesítményelemző rendszert. Az első két cikk egy olyan rendszer kiépítésével foglalkozik, amely számítógépes látási technikákkal fedezi fel a mezőny szereplőit.

A számítógépes látás vagy a számítógépes látás a gépi tanulás egyik fő felhasználási területe.

Az e téren elért haladás 2017-ig lenyűgöző volt. Az elmúlt évek visszaesése ellenére már vannak olyan rendszereink, amelyek sok érdekes dolog elvégzését teszik lehetővé. Ebben a cikkben bemutatom a YOLO-t: Csak egyszer nézel.

Bevezetés az automatikus tárgyfelismerésbe: számítógépes látás

Az emberi szem számára a képen lévő tárgyak felismerése nagyon egyszerű művelet, a számítógép számára a feladat sokkal összetettebb. Egészen a közelmúltig az objektum detektálást képgradiens módszerekkel végezték. Kivéve, hogy ezek a módszerek nagyon drágák és sokkal kevésbé megbízhatóak, az eredmény lassú és nem túl használható rendszerek.

A mély tanulás megjelenése és az olyan modellek megjelenése, mint a konvolúciós ideghálózatok, új dimenzióba helyezték a számítógépes látást.

Sőt, a számítógépes látás az autonóm autó egyik alapvető eleme. Ez az egyik alkalmazás, amely segített fenntartani a lelkesedést e tér iránt.

Ma a számítógépes látórendszerek magasan fejlettek és lenyűgöző teljesítményt értek el. Így az AI-k meghaladták az orvosok rákdiagnosztikai teljesítményét.

Még akkor is, ha az elmúlt évek a számítógépes látás fennsíkjának tűnnek, kevés főbb felfedezéssel, a kutatás még mindig nagyon aktív, és nagyon robusztus eszközeink vannak. A YOLO a tökéletes példa.

Hogyan működik a YOLO ?

A YOLO egy nyílt forráskódú számítógépes látórendszer, amely 2016-os létrehozásakor innovatív megközelítést kínált a problémára. Lehetővé teszi egy képen vagy videóban a jelen lévő tárgyak és a hely felismerését.

Videó elemzése esetén a képsorozatot több képre bontják. Az ötlet ezután a kép elemzése neurális hálózattal. A képet ezután több kis régióra vágják, és minden alkalommal alkalmazzák az érzékelő rendszert.

A rendszer keretezi a régiót, címkét ad neki a vizsgált edzésadatokból, és kiszámítja az előrejelzés magabiztossági pontszámát.

Hogyan működik a YOLO a képen lévő objektumok detektálásához

A YOLO elengedhetetlenné vált, különösen teljesítményének és sebességének köszönhetően. Ez lehetővé teszi a képek elemzését azonnal.

Sőt, ez a megközelítés lehetővé teszi az alkalmazott konvolúciós hálózatok teljesítményének optimalizálását is. Ahelyett, hogy az objektumokat egymás után külön edzésadatokkal dolgoznánk fel minden alkalommal (ahogy a Fashion MNIST esetében tettük), globálisabban közelítjük meg a problémát.

A YOLO egy olyan projekt, amelyet sok mérnök és gépi tanulás kutató követ. Ez biztosítja az ismétlődő frissítéseket. Valójában nemrég jelent meg az 5-ös verzió, amely lehetővé teszi, hogy még gyorsabban haladjon anélkül, hogy elveszítené a hatékonyságot! Meddig fogunk menni ?