A neurális hálózatok megértése - az IA áttekintése

Az emberi agyhoz hasonlóan, amely Fédéric Lenoir számára, a 21. század felderítetlen kontinensének tekinthető, a mesterséges intelligencia is feltáratlan tudomány.

Az emberi agyhoz hasonlóan, amely Fédéric Lenoir számára, a 21. század felderítetlen kontinensének tekinthető, a mesterséges intelligencia is a 21. század feltáratlan tudománya. És az összehasonlítás ezzel még nem ér véget. Mint az emberi intelligencia esetében, a mesterséges intelligenciában is beszélünk ideghálózatok.

Az emberi agy olyan összetett, hogy még a legnagyobb neurológusok sem tudják teljes mértékben leírni. Azonban amivel tudunk, valami nagyot fel tudunk építeni. Olyan technológia, amelyen a legjobb AI-k alapulnak: mesterséges ideghálózatok.

Ezt a technológiát az agyunk idegrendszerének működése ihlette. Több száz oldalra lenne szükség a mélységes megértéséhez, de mivel nagyon jó vagy, elég lesz néhány szó 🙂

Az emberi idegsejtektől a mesterséges ideghálózatokig

Mielőtt mesterséges neuronokról beszélhetnénk, írjuk le, hogyan működik az emberi neuron.

A biológiai idegsejt egy olyan sejt, amelyet több komponens jellemez. A szinapszisok a neuronok közötti kapcsolódási pontok. A dendritek az idegsejtek, az axonok pedig más idegsejtek kimenetei.

A sejttest felelős a neuron többé-kevésbé aktiválásáért, a gerjesztő jelek elektromos intenzitásától függően. Ez az aktiváció akkor következik be, amikor az idegsejt akciós potenciálja meghaladja egy bizonyos küszöbértéket, amelyet "aktivációs potenciálnak" neveznek.

Egy emberi idegsejt diagramja

A biológiai idegsejtek egyszerű modellezésére a neurológusok az 1940-es években bevezették a formális idegsejt matematikai fogalmát.

Vázlatosan egy formális neuronnak több bemenete és egy kimenete van. Megkülönböztetjük a szinapszisok aktiválását és a szinapszisok gátlását.

Matematikailag az eredetileg javasolt neuronok bináris idegsejtek, amelyek kimenete 0 vagy 1. Ezt a kimenetet az idegsejt számítja ki, bemeneteinek súlyozott összegének felhasználásával. Ezután egy aktiválási függvényt alkalmaznak erre az összegre. Ha az eredmény nagyobb, mint egy "aktiválási küszöb", akkor a kimenet 1, különben 0 lesz.

Mi az a neurális hálózat ?

A mesterséges intelligenciában az ideghálózatok több neuronréteg együttesei. Több száz különböző típusú neurális hálózat létezik. Az elv mindig ugyanaz, az architektúra minden alkalommal más és más.

A neurális hálózatok architektúrája az alkalmazástól függően eltér

Általánosságban elmondható, hogy a neurális hálózatok neuronok összessége, több rétegben szerveződve és összekapcsolva. Az első réteget bemeneti rétegnek, az utolsó kimeneti rétegnek, a köztük lévő rétegeket pedig rejtett rétegeknek nevezzük. Az alkalmazási területtől függően nagyon sok lehet belőlük.

Ideghálózatok osztályozáshoz

A gyakorlatban az első réteg idegsejtjei egyszerű információt továbbítanak a következő réteg idegsejtjeihez. Ami befolyásolja az aktiválás mértékét és így tovább. Az utolsó réteg ezután információt nyújt számunkra az eredményről.

Például egy számfelismerő rendszer esetében a bemenet a kép pixeleinek szürke szintje lesz. Az eredmény annak a valószínűsége, hogy egy adott számot bevittek bemenetként. Ha az 5. számot ábrázoló képet adott meg, akkor az 5-ös számmal nagyobb valószínűséggel számolhat. És hogy a többi szám 0-hoz közeli valószínűséggel társul.

Alapvető tétel

Ez az "egyszerű" műveletek sorozatán alapuló módszer nagyon összetett funkciókat képes megközelíteni. McCulloch és Pitts ezt azzal bizonyították, hogy egy formális ideghálózatnak ugyanolyan számítási ereje van, mint egy Turing-gépnek. Részben ennek köszönhető, hogy ez a technológia a gépi tanulás egyik meghatározó módszerévé vált.

A neurális hálózatok igazolják az alapvető univerzális közelítési tételt. Ez biztosítja számunkra egy idegháló létezését, amely egy adott függvényhez olyan apró hibával ad számunkra egy függvényt, amennyit csak akarunk. Ez nagyon erős eredmény !

A gyakorlatban minden idegsejtnek két paramétere van, az elfogultság és a súly. Az ötlet tehát a hálózat összes neuronjának paraméterezése, amely minimalizálja a közelíteni kívánt funkció és a hálózat által modellezett funkció közötti különbséget. Ennek a paraméterezésnek a létezésére az előző tétel következtet.

Sajnos sok funkció esetében lehetetlen megtalálni a paramétereit, csak azt tudja, hogy léteznek. Óriási számítási időbe telik, hogy megtalálják őket.

A gyakorlatban a neurális hálózat képzése optimalizálási gyakorlat

A neurális hálózatok a felügyelt tanulás módszerei. Ezért vannak kezdeti adataink, amelyekhez ismerjük a hálózat kimenetét.

A hálózati paramétereinken végzett munkánk célja a várható kimenet és a tényleges (az ideghálózat által biztosított) kimenet közötti különbség minimalizálása. Ez az eltérés kiszámítható a legkisebb négyzetek hibájával vagy a hiba egyéb mutatóival, veszteségfüggvényről beszélünk. Megpróbáljuk optimalizálni ezt a veszteségfüggvényt. A hálózati képzés olyan elfogultságok és súlyok keresése, amelyek minimalizálják a veszteség funkciót.

A matematikában és pontosabban az optimalizálásban nagyon sok módszer létezik a függvények minimalizálására. A gyakran használt gradiens süllyedési módszer. Ehhez a módszerhez a veszteségfüggvény parciális deriváltjainak kiszámítása szükséges.