AlphaZero je nový šampion v šachu po pouhých 4 hodinách tréninku

13.12.2017, Jan Vítek, aktualita

Na světě je nový šampion v šachu a není žádné překvapení, že to je moderní umělá inteligence, a to konkrétně AlphaZero. Na celé věci je ale nejzajímavější to, že AI se dostala z naprosté nuly na světového mistra v šachu během pouhých 4 hodin.

Pokud by nás tak na moderních umělých inteligencích mělo něco zarazit, pak je to právě jejich schopnost velice rychle se učit, kterou nás už nyní dokáží snadno předčit. Svět tak během několika hodin získal nového šampiona v šachu, a to AlphaZero firmy Google. Počítače přitom už dávno dokázaly překonat i ty nejlepší lidské soupeře, však souboj Garyho Kasparova s Deep Blue v roce 1996 je notoricky známý. A nutno dodat, že tento počítač s výkonem 11,38 GFLOPS dnes dokáže strčit do kapsy kdejaký mobilní telefon, který si zase můžeme strčit do kapsy my, ale už ne obrazně.

Šachy jsou tak dávno překonány, ovšem to se stalo v případě Deep Blue hrubou silou, čili prohledáváním všech možných scénářů vývoje, což je možné v šachu, ale už ne ve hře Go, kde je něco takového i pro dnešní superpočítače nemožné. Zde musí nastoupit umělá inteligence, která dokáže hrát podobně jako člověk a taková v podobě AlphaGo už také nemá konkurenci.

Naposledy vládl šachu engine Stockfish 8, který pracoval v podstatě stejně jako Deep Blue s využitím prohledávání různých možností postupu a předem naprogramovaných kombinací i pro otevření a zakončení hry. Jenomže nyní se do něj pustila AI AlphaZero, která jej dokázala porazit ve stovce zápasů bez ztráty jediného.

AlphaZero je dítkem londýnského studia DeepMind, které už dobře známe z jiných projektů, jako je třeba učení se pohybu či rovnou parkouru. Tato AI využila techniku známou jako deep reinforcement learning, takže se učila v podstatě stejným způsobem jako lidé. Jde tak o neustálé opakování, při němž se inteligence pomalu zdokonaluje, neboť si pamatuje, že některé situace na šachové desce jsou pro ni výhodné a jiné zase ne.

Jenomže pouhý člověk dokáže během čtyř hodin dokončit pouze několik her, zatímco AlphaZero jich zvládla více než 22 milionů a hrála navíc sama proti sobě, takže se v podstatě mohla z každé hry poučit dvakrát. A pokud si vezmeme, že by jedna hra mohla člověku zabrat dejme tomu v průměru třicet minut, potřeboval by na stejný počet tréninkových her nějakých 1250 let čistého času. Pak už se opravdu nelze divit tomu, že AlphaZero se během tak krátké doby stala z šachového neználka světovým šampionem.

AlphaZero se tak může v krátké době stát lidmi nepřekonatelným přeborníkem ve všem, na co se dá aplikovat její schopnost rychle se učit, a to v procesu zcela bez lidské intervence.

Zdroj: Extremetech