Після програшу чемпіона світу з гри в ґо комп’ютерній програмі Альфа-Ґо, ця стародавня гра поповнила список завдань, які комп’ютери здатні виконувати краще за людей. Протягом шестиденного поєдинку, який проходив у Сеулі і за яким спостерігали 100 млн. людей, програма Альфа-Ґо, створена компанією DeepMind, перемогла чемпіона світу Лі Седола з рахунком 4:1. Через інтуїтивний характер стратегії гра в ґо тривалий час була одним з найбільших викликів для штучного інтелекту. Тепер, коли комп’ютери вже навчилися перемагати в неї людей, питання полягає в тому, чи знайдеться для цієї програми застосування за межами гри і що компанія DeepMind робитиме далі.
Алгоритм Альфа-Ґо носить загальноцільовий характер. Тобто окрім декількох елементів, створених спеціально для гри, його можна застосовувати до широкого комплексу задач, що включають розпізнавання патернів, планування і прийняття рішень. Однак він має і свої обмеження, – зазначає Йошуа Бенжо, фахівець з комп’ютерних наук з Монреальського університету в Канаді.
Лі Седол, який думав, що легко переможе програму, був шокований поразкою. В жовтні Альфа-Ґо перемогла чемпіона Європи з ґо Фан Гуї, але версія програми, розробники якої кинули виклик Седолу, була набагато сильніша.
Особливістю Альфа-Ґо є використання методу машинного навчання, що називається «навчанням з посиленням» (reinforced learning). Тобто що більше вона грає ігор, тим майстернішою стає. Її архітектура копіює нервові зв’язки людського мозку, у якому за навчання та досвід відповідають зв’язки між шарами стимульованих нейронів.
Сьогодні комп’ютери вже можуть перемагати людей у значній кількості настільних ігор, але лише в тих, в яких гравці мають доступ до усієї інформації. У покер, наприклад, де гравець бачить тільки свої карти, машини поки не можуть кинути виклик людині. Джонатан Шефер, комп’ютерний науковець з Едмонтонського університету в Альберті (Канада), вважає, що невдовзі компанія DeepMind створить універсальний алгоритм, здатний вчитися грати у всі типи настільних стратегічних ігор з повнотою інформацією.
Аналіз ігор людей в ґо, за словами виконавчого директора DeepMind Демі Хассабіса, – це не єдиний спосіб, як програма може покращувати свої навички, адже вона може вчитися, граючи сама з собою і аналізуючи свої власні позиції. Розробники Альфа-Ґо вже планують вийти за межі настільних ігор. В лютому у рамках співпраці з Національною клінічною службою Сполученого Королівства (UK National Health Service) компанія заснувала підрозділ DeepMind Health, що повинна застосувати ці комп’ютерні алгоритми до опрацювання клінічної інформації, маючи на меті покращити діагнози та плани лікування. Однак тут програма зіштовхується зі складними завданнями. Адже комп’ютери здатні ефективно приймати рішення тільки за умови повної інформації і стандартних правил гри, що дозволяють кожне рішення оцінити як добре чи погане. Адже в медицині, як і в грі в покер, інформація часто буває неповною (наприклад, про рідкісні хвороби відомо набагато менше, ніж, скажімо, про грип), а оцінка рішень теж далека від прямолінійної.
«Багато людей думає, що якщо комп’ютер зумів перемогти світового чемпіона з ґо, то їх можливості безмежні. Але насправді ми перебуваємо ще дуже далеко від штучного інтелекту», – каже виконавчий директор Інституту штучного інтелекту ім. Пола Аллена в Сіетлі Орен Етціоні. За своє коротке існування Альфа Ґо зіграла і проаналізувала сотні мільйонів ігор – набагато більше, ніж Лі Сегол, який все-таки обіграв програму в одну гру з п’яти. При всій своїй швидкості обчислень, людині все-таки потрібно набагато менше часу і даних, щоб осмислити патерн і прийняти рішення.
Elizabeth Gibney
What Google’s winning Go algorithm will do next
Nature, 15.03.2016
Зреферував Євген Ланюк