1,2 másodperc a Rubik-kocka elhaladásához ... AI - Sciences et Avenirrel

Feladva: 2019.07.26., 10 óra.

Az Irvine-i Kaliforniai Egyetem kutatócsoportjának projektje megerősítő tanulási algoritmust használt. A módszer nagyon népszerű a játékra szánt mesterséges intelligenciák programozására.

Valószínűleg meg kellett történnie. Az irvine-i Kaliforniai Egyetem informatikai és statisztikai kutatói a rejtvényben egy mesterséges intelligenciával (AI) szembesültek, több mint 43 kvintillió (10 30) kombinációval, amelyek csak egy megoldást eredményeztek: egyszínű négyzetek. A projektet részletező cikket 2019 júliusában tették közzé a Nature folyóiratban. A DeepCubeA nevű algoritmus átlagosan 1,2 másodperc alatt sikerült, amikor a legfrissebb hírek szerint a rekord az ember számára 3,47 másodperc.

Az AI megpróbálja újraindítani, amíg javul

Ez egy algoritmus, amely ötvözi a "mély tanulást" és a tanulást megerősítéssel. Az első módszer lehetővé teszi a hozzá benyújtott adatok egymást követő rétegek szerinti elemzését. A másodikat széles körben használják, amikor AI-t akarunk "játszani". A DeepMind Go játékára tervezett AlphaGo Zero-t például megerősítő tanulással képezték ki. Az autonóm járművek világa kezd elhatalmasodni.

Az alapelv az, hogy próbával és hibával folytassuk. Az algoritmus megkísérli a megoldást, és egy pozitív (úgynevezett jutalom) vagy negatív jel kerül vissza. A kapott visszajelzések alapján kezdődik elölről, új jelet kap stb., Amíg fokozatosan javul és el nem éri a kívánt eredményt. Az algoritmus tehát önmagában halad.