AI Függetlenül Megtanulta Sakkjátékot Emberfeletti Szinten Egy Nap Alatt. Alternatív Nézet

AI Függetlenül Megtanulta Sakkjátékot Emberfeletti Szinten Egy Nap Alatt. Alternatív Nézet
AI Függetlenül Megtanulta Sakkjátékot Emberfeletti Szinten Egy Nap Alatt. Alternatív Nézet

Videó: AI Függetlenül Megtanulta Sakkjátékot Emberfeletti Szinten Egy Nap Alatt. Alternatív Nézet

Videó: AI Függetlenül Megtanulta Sakkjátékot Emberfeletti Szinten Egy Nap Alatt. Alternatív Nézet
Videó: Polgár Judit -- Sakkjátszótér - Applikáció 2024, Április
Anonim

Az AlphaZero algoritmus, emberi tanár nélkül, 24 órán belül elsajátította a sakkot és a shogi játékot, hogy legyőzze más bajnoki programokat, amelyek korábban feltétel nélkül legyőzték az embereket.

A Deep Mind, a mesterséges intelligencia (AI) algoritmusait fejlesztő társaság adatokat közölt az sajt és shogi játékhoz használt AlphaGo algoritmus átképzésének eredményeiről. Korábban az AlphaGo képes volt legyőzni a világbajnokokat a játék során. A mesterséges intelligencia még gyorsabban tudta elsajátítani az új játékokat. A megfelelő munkát a Cornell University preprint szerverén teszik közzé.

Az AlphaZero megerősítő tanulási módszert alkalmazott. Ez egy mély gépi tanulás altípusa, amely nem emberi tanárt használ, hanem kizárólag két AI közötti játékokat. Bár az elején mindkét AI nagyon gyengén játszik, nagy sebességük miatt (összehasonlítva egy emberi tanárral) hatalmas számú játékot tudnak játszani rövid idő alatt, és jól bevált mozdulatokat és sorozatokat választhatnak a tábla bizonyos pozícióiban, ami az algoritmusok képessége, hogy rendkívül gyorsan növeljék szintüket.

Ebben az esetben az AlphaZero mindössze 24 órán belül minden embernél magasabb játékszintet ért el. Aztán engedték, hogy játsszon Stockfish, a rendelkezésre álló legjobb sakkjátékos, és Elmo, a legjobb shogi játékos (egy nagyon módosított sakkkészlet a korai középkori Japánban) mellett.

A nagyon rövid edzésidő ellenére az AlphaZero 28 alkalommal verte meg a Stockfish-et, és további 72 alkalommal húzott. 90 alkalommal sikerült megnyernie az Elmo ellen, nyolcszor veszített és kétszer húzott. Ezek rendkívül magas eredmények. A sakk és a shogi egyaránt nagyon különböznek mind az AlphaGo eredetileg létrehozásának útján, mind egymástól. Például a "japán sakk" rendkívül egzotikus lehetőségeket von maga után, például az ellenség "megett" darabjainak lejátszását. A Go számára létrehozott algoritmus győzelme csak azáltal, hogy egy teljesen azonos algoritmussal játszik, a saját tanár által elérhető

IVAN ORTEGA

Ajánlott: