Комп’ютер перемагає чемпіонів ґо

 

Китайську настільну гру вважають однією з найскладніших у світі. На відміну від шахістів, комп’ютер донедавна був  не здатен перемогти професійного гравця в ґо. Проте нещодавно штучний інтелект у вигляді програми AlphaGo здолав не лише комп’ютери, а й європейського майстра – з рахунком 5:0. Натомість світовий чемпіон Лі Седол записав на свій рахунок одну з чотирьох зіграних з AlphaGo партій.

 


Лі Седол, провідний гравець в ґо, тисне руку Демісу Хассабісу (Demis Hassabis), розробникові AlphaGo. Фото: REUTERS.

 

Ґо – це одна з найстаріших зі всіх відомих ігор людства. Ще 2 000 років тому китайські гравці випробовували свої стратегічні вміння, використовуючи зазвичай чорні та білі камінці. Передусім в Китаї, Японії та Кореї ґо є культурним надбанням: майже 10% усіх корейців регулярно грають в ґо та стежать за турнірами по телевізору.

 

На перший погляд принцип гри – дуже простий: обидва гравці починають з порожньої дошки й намагаються своїми камінцями оточити фігурки конкурента, якщо це вдається, то камінці суперника забирають з дошки. Зазвичай гравці по черзі ходять чорними й білими фігурками.

 

Проте за простим правилом ховається вся складність гри. Адже з огляду на велику кількість можливих ходів і дерев пошуку, ґо надто складна для комп’ютерів – кількість варіантів гри сильно перевершує сукупність шахових комбінацій.

 

Власне в цьому й суть: «Через високий коефіцієнт розгалуження та велику кількість ймовірних ходів ґо, порівняно з шахами, програмувати значно складніше, – пояснив Джон Даймонд (Jon Diamond) з Британської асоціації гравців ґо. Тому для науковців, що прагнули розробити штучний інтелект, який міг би перемогти топових гравців у ґо, це було неабияким викликом.

 

«Існують деякі ґо-програми, проте вони грають не сильніше за аматора», – розповідають Девід Сілвер (David Silver) та його колеги з дослідницького центру Google DeepMind в Лондоні. Аби це виправити, вони розробили цілу мережу, що об’єднує кілька навчальних та обчислювальних стратегій.

 

Нова програма AlphaGo використовує так звану мережу цінностей, аби визначати переваги окремих позицій камінчиків на дошці. Одночасно тактична мережа визначає, як вплинуть певні ходи на майбутні позиції та взагалі, яким буде подальший хід гри. «Ми використовуємо ці нейронні мережі, аби зменшити ефективні глибину та ширину дерева пошуку для наступних ходів», – пояснили Сілвер з колегами. Насамкінець в пригоді став класичний пошук, названий Монте-Карло, що з-поміж можливостей віднаходить найоптимальнішу.

 

Інша особливісь AlphaGo – програма постійно покращується. На початку підживлена набором класичних ходів майстрів гри, програмне забезпечення грає незліченну кількість разів проти самої себе, й щоразу в процесі цього вивчає все більше ходів.

 

Наскільки сильна AlphaGo, перевірили науковці в процесі ігор з дотепер існуючими ґо-комп’ютерами та людьми, що є справжніми профі у цій грі. В боротьбі з цифровим конкурентом програма AlphaGo показала клас: вона розгромила його в 494 з 495 ігор, повідомили Сілвер з колегами. Результати вказують на те, що AlphaGo набагато данів (рівнів професійності) сильніша, ніж всі попередні ґо-комп’ютери.

 

Проте ще вражаючішим був поєдинок програми з людиною – багаторазовим чемпіоном Європи з ґо Фаном Гвеєм (Fan Hui). «Складно було взагалі зрозуміти, по який бік грав комп’ютер», – написав експерт Джон Даймонд про свої враження від гри. Результат формального турніру, що складався з п’яти ігор: 5:0 на користь AlphaGo.

 

«Це вперше комп’ютер переміг професійного гравця, – констатують Сілвер з колегами. – Дотепер вважали, що на такий успіх потрібно буде чекати ще принаймні десятиріччя». Штучний інтелект впорався з великим викликом.

 

Науковці пояснюють: впродовж цього ґо-турніру AlphaGo аналізувала та визначила в тисячу разів менше позиції, ніж шаховий комп’ютер Deep Blue у своєму матчі проти чемпіона світу Гарі Каспарова, але попри це го-програма цілеспрямовано вибирала заздалегідь вигідні позиції.

 

«Ігрова сила ґо-програми справді вражає! Я був здивований почути, що Фан Гвей програв», – прокоментувала успіх AlphaGo Гадзін Лі (Hajin Lee), генеральний директор Міжародної ґо-фередації,.

 

На переможницю ґо-програми тепер чекають нові виклики: в березні 2016 вона виступить в Сеулі проти Седола Лі (Sedol Lee), що вже впродовж десятиліття є провідним ґо-гравцем світу. На його думку, це буде визначальна подія в історії ґо. «Я чув, що штучний інтелект, розроблений у Googles DeepMind, на диво сильний і стає все сильнішим, – сказав Лі. – Але переконаний, що зможу його перемогти».

 

Турнір між Лі та комп'ютером передбачає 5 матчів і відбувається з 9 по 15 березня. На разі рахунок становить 3:1 на користь AlphaGo. Лише з четвертого разу Седолові Лі вдалося здолати машину. Останній поєдинок відбудеться в вівторок, 15 березня.

 


Nadja Podbregar
Computer schlägt Go-ProfiQuelle
wissenschaft.de, 27.01.2016
Зреферувала Соломія Кривенко

13.03.2016