Виклики штучного інтелекту



Олексій Молчановський,

керівник магістерської програми з комп’ютерних наук УКУ за напрямом «Науки про дані/Data Science», співзасновник платформи онлайн-курсів Prometheus. Учасник комітету з розвитку штучного інтелекту в Україні при міністерстві цифрової трансформації.
 

 

Штучний інтелект – між минулим та сьогоденням


Сьогодні поняття штучного інтелекту не є чимось новим для нас. Проте тільки протягом останнього десятиліття ця тема стала популярною у масмедіа. ШІ є відносно молодою галуззю – її заснування датують 1956 роком, коли у Дартмонському коледжі (США) відбулася наукова конференція, присвячена питанням ШІ. Термін “штучний інтелект” запропонував учений Джон Маккартні як певне протиставлення іншому дуже популярному терміну цих часів – “кібернетика”.

 

Ми можемо виділити чотири великі етапи розвитку ШІ. Період від заснування і до 1974 року часто називають “золотою добою” ШІ. У цей час були зроблені перші значні відкриття у цій галузі, що мали суттєвий евристичний потенціал. На тодішніх комп’ютерах науковцям вдалося застосовувати технологію для доведення геометричних теорем або розрахунків алгебраїчних виразів. Також були зроблені перші кроки щодо синтезу природної мови та її обробки. У 80 роках ХХ століття відбувається другий важливий етап розвитку ШІ, пов’язаний із експертними системами – це такі системи, які моделюють поведінку людини-експерта у певній галузі. Наприклад, однією з таких експертних систем була технологія виявлення захворювання крові. Завдяки цьому підходу створювалися так звані бази знань із різних наукових ділянок – проте, незважаючи на це, найбільші відкриття у сфері ШІ були ще попереду. З 90 років ХХ століття і по сьогоднішній день виокремлюється ще один етап, пов’язаний із виникненням теорії інтелектуальних агентів, а також сегмента Big Data – великі дані, і так зване глибоке навчання  Deep Learning.

У сфері ШІ є важливе поняття “зима штучного інтелекту” – це періоди зменшення комерційного та наукового інтересу до галузі, які спостерігалися у кінці 70 років та на початку 90 років ХХ століття. Проте зараз сфера ШІ переживає бум свого розквіту – з’являється стільки наукових досліджень та конференцій, присвячених цій темі, що дуже важко встигати опрацьовувати і ознайомлюватися з новими відкриттями та публікаціями. Науковці у цій галузі перебувають у стані “швидкого бігу”. З іншого боку, дослідження ШІ також мають величезні можливості для фінансування та розвитку.

 

Говорячи про сьогодення, у сфері ШІ переважають такі напрями, як робота з великими даними (Big Data), машинне навчання (Machine Learning), глибоке навчання (Deep Learning), пов’язане із розвитком нейронних мереж, навчання з підкріпленням (Reinforcement Learning).

 

Алгоритми є рушійними силами розвитку сучасного ШІ – це певні математичні моделі, які використовуються у комп’ютерних науках. Інший момент – це накопичення великих даних завдяки потужностям сучасних комп’ютерів. Компанії і кожен з нас почали накопичувати багато даних, і всі вони є “харчем” для алгоритмів, які дозволяють на базі цих даних отримувати певні практичні рішення та результати. Проте всі ці дослідження стають можливими тільки за наявності хороших обчислювальних потужностей. Здешевлення процесорів та доступність комп'ютерів як таких по суті дає можливість кожному робити певні дії з аналізу чи роботи з даними. Цікаво, що роботи у цьому напрямі зараз найбільше провадять не наукові інституції, а великі корпорації – такі як Amazon, Google тощо. Навіть найкращим науковим інституціям складно конкурувати з цими компаніями, адже останні володіють набагато кращими обчислювальними потужностями.

 


 

Основним двигуном сучасного ШІ також є глибоке навчання та машинне навчання, в основі яких лежать два основні принципи – це розпізнавання шаблонів (pattern recognition) та багатоітераційне навчання, тобто створення певної математичної моделі, яка запрограмовується і, по суті, “вчиться” на даних, які вона отримує. Основним завданням цього принципу є знаходження кореляцій, тобто взаємозв’язків між різними даними.

 

 


Сучасний ШІ найчастіше працює з візуальними вимірами та зображеннями. Це пояснюється, по-перше, когнітивно-психологічними факторами, адже візуальний канал для людей є найважливішим у сприйнятті реальності. Крім того, маємо ще біологічну площину – ділянка неокортексу, яка відповідає за обробку візуальної інформації, найбільше вивчена науковцями. Створення сучасних штучних нейронних мереж по суті відтворює роботу цих візуальних частин. Когнітивні науки значно вплинули на створення штучних нейронних мереж, а отже і розвиток ШІ. Тепер ми вже бачимо зворотній вплив – знання про те, як працюють штучні нейронні мережі, дозволяють поглиблювати наші уявлення про функціонування людського мозку.

 

Одним із типових завдань сучасного ШІ є розпізнавання зображень (image recognition) – до прикладу, розпізнавання облич на фотознімках чи постави (pose detection). Інший момент – це виявлення об’єктів. Цей підхід зараз широко використовують для технологій самокерованих автівок, які в режимі реального часу мають розпізнавати об'єкти на дорозі. Artistic style transferring – дуже популярний підхід, коли до певних світлин ми застосовуємо стиль та шаблони картин відомих художників. Artificial image creation – це можливість штучних нейронних мереж створювати образи на ваш запит, у тому числі й зображення людей, які ніколи не існували. Ця технологія викликає чи не найбільше етичних запитань та дискусій у суспільстві. Похідним від цього також є поява феномена Deep Fake – створення неправдивого контенту, зображень і відео. Такі технології Deep Learning можуть бути використані, скажімо, у всіляких політичних конфігураціях – коли потрібно, до прикладу, очорнити якогось політика чи політичну силу. В останній рік компанія Facebook активно фінансує ті проєкти науковців, які б дозволяли детектувати та боротися з таким контентом.

 

Ще однією принциповою особливістю ШІ є здатність працювати з текстом, а особливо з граматичними чи синтаксичними компонентами мови. До прикладу, заснована українцями компанія Grammarly надає сервісні послуги не тільки з граматичного коректування тексту, а й стилістичного. ШІ також вміє продукувати смисловий текст – поезію та тексти різної стилістики. Artificial conversation – створення штучних комунікаційних технологій. Мабуть, найбільш яскравим прикладом є створення чат-ботів, які все частіше у компаніях замінюють звичну нам службу сервісної підтримки. Ще один напрям – це синтез людської мови та її розпізнавання, ця технологія часто використовується у наших смартфонах. Декілька років тому фахівці з Google розробили сервісну технологію для одного ресторану, яка приймає замовлення по-телефону і спілкується з живими людьми за допомогою синтезованої мови.

 

Інший приклад, про який я казав вище, – це синтезування тексту. У серпні цього року студент одного з американських університетів використав модель ШІ – GPT3, яка є найбільш розвиненою моделлю англійської природної мови на даний час. Вона дозволяє як аналізувати тексти, так і синтезувати їх. Для того, щоби синтезувати текст, вам потрібно ввести початок якогось речення. Студент ввів заголовок тексту та початкові слова, і технологія синтезувала йому повністю весь текст. Згодом на форумі, де був опублікований цей матеріал, відбулася жвава дискусія: одні коментатори помітили штучність і несправжність цього тексту, а інші були переконані, що він автентичний, тобто створений людиною. Дуже цікавим у цьому контексті є звернення до так званого тесту Тюрінга (1950), який дозволяє  визначити, чи певна система володіє інтелектом. За Тюрінгом, якщо в процесі текстового спілкування людина не може визначити, спілкується вона з іншою людиною чи з якоюсь технологією – тоді, відповідно, ця технологія володіє інтелектом.

 


Повернімося до нашого початкового запитання – що ж лежить в основі машинного навчання? Насправді у цій системі немає особливих складнощів. Часто мова йде про класичну лінійну регресію та спробу знайти певну закономірність серед певних об’єктів і якомога простішим способом. Технології штучних нейронних мереж роблять доволі просту операцію – це передусім інструменти лінійної алгебри з її матричними перетвореннями, які повторюються у величезних масштабах.



“Неможливо дістатися Місяця, вилізаючи на все вищі дерева” – про недосконалість штучного інтелекту 

 

Сучасний ШІ екстремально спеціалізований: ми можемо його навчити виконувати певну дію з числами – проте якщо хочемо інтегрувати ще якісь компоненти у його систему, то мусимо навчати ШІ спочатку. У сучасних умовах ШІ залишається дуже лінійним.

 


Сучасна технологія ШІ є жонглюванням лінійною алгеброю, і якщо раптом щось перестає функціонувати, фахівці намагаються додавати все більше даних. Проте у цій системі є фундаментальні викривлення. “Неможливо дістатися Місяця, вилізаючи на все вищі дерева”, – про це нам каже 31-й закон розробки космічних кораблів Дейва Акіна з університету Меріленду, США, і ця цитата найкраще ілюструє ті вади, які існують у технології ШІ. Фахівці вказують на те, що сучасному ШІ дуже бракує двох основних компонентів – це розуміння контексту і причинно-наслідкових зв'язків. Розглянемо такий яскравий приклад. Маємо звичайну текстову новину про річницю від дня народження Івана Франка. Спробуємо поставити наступні запитання до тексту, на які система штучного інтелекту не зможе дати відповідь, тому що не здатна розпізнати контексту. Наприклад: “Чи зараз живий Іван Франко?” – система не знає, чи людина може стільки жити. Або ж: “Чи жив Іван Якович у 1800 році?” – На це питання система теж не дасть відповіді, оскільки вона не знає, чи Іван Якович і Іван Франко це та сама людина. “Чи покладали квіти до пам’ятника Івана Франка?” В тексті йдеться про покладання квітів до пам’ятника Каменяру – ШІ теж не вловить цього контексту. “Чи зустрічався Іван Франко й Андрій Москаленко?” У тексті згадується обидва прізвища, проте ШІ не може виявити, чи вони зустрічалися. “Чи вважає Андрій Москаленко Івана Франка дорожнім знаком?” У тексті Андрій Москаленко говорить про Івана Франка як про вказівника... і ШІ сприймає це слово буквально. Цей простий приклад ілюструє, що сучасні системи штучного інтелекту зламаються при першій же нагоді.

 

 

Отож сучасний ШІ не розуміє контекстів і того, як функціонує наш світ – це його основна проблема. У часи виникнення ШІ науковці робили багато спроб, щоби передати ШІ наші знання за допомогою різних семантичних схем. ШІ досі бракує контекстуальної і семантичної інформації. Працюючи на основі статистики, глибоке навчання дозволяє лише ймовірнісно поєднувати одні сутності з іншими. До того ж, глибоке навчання не може опановувати композиціональність та складність світу – ШІ “не розуміє” причинно-наслідкових зв'язків. Тому глибоке навчання як таке є добрим у самому навчанні, проте воно геть погане у композиціональності та побудові когнітивних моделей.

 



В останнє десятиліття багато досліджень ведуться у галузі так званого Responsible AI, коли ми підбираємо і генеруємо дані таким чином, щоб не нашкодити користувачам. Ethical AI – у світі існує багато організацій та комісій, які займаються питаннями етики у відношенні до застосування штучного інтелекту, а на рівні держав вводяться навіть окремі законодавчі та політичні рішення, що стосуються ШІ. Проте, до прикладу, Ілон Маск говорить про те, що всі ці обмеження не мають значення, адже ми не здатні зупинити прогрес у розвитку ШІ. Ілон Маск створив компанію Neuralink, що займається розробкою чіпів, які можна буде інтегровувати в людину і які дозволятимуть з’єднуватися зі ШІ – це така пряма асоціація з фільмом “Матриця”. На думку Ілона Маска, наш єдиний шанс убезпечитися від загроз ШІ – це стати в один ряд з технологією у сенсі швидкості обробки інформації. Адже технологія значно швидше справляється саме з обробкою даних, якщо ми порівнюємо цей процес із діяльністю нашого мозку.

 

 


У відомій книзі Джуди Перла “The book of Why” автор наголошує на тому, що нам слід ретельно вчитися виводити причинно-наслідкові зв’язки з феноменів, адже чиста статистика не дозволяє нам цього зробити. Дж.Перл одним із перших виявив, що статистична інформація  має багато теоретичних обмежень – скільки б ми не вводили нових статистичних даних, глибоке машинне навчання все одне не зможе вивести причинно-наслідкових зв’язків із них. Цікавою є його ілюстрація щодо трьох рівнів каузальності (причинно-наслідкових зв’язків). На першому рівні Асоціювання та поєднання знаходяться сучасні системи ШІ. На другому рівні “Втручання” відбувається процес активного запитування та пошуку відповідей – цю дію, як ми знаємо, особливо добре вміють робити діти. Шляхом проб і помилок ми вчимося і, як наслідок, виводимо певні причинно-наслідкові зв’язки. Третій рівень – це рівень Уявлення та припущення – ми маємо здатність проводити мисленнєві експерименти, уявляти, як щось станеться чи не станеться, і прослідкувати за наслідками у своїй уяві. Зважаючи на всі ці факти, Дж. Перл запропонував оновлений тест Тюрінга – на вхід дається історія\ситуація (наприклад, уже згадана стаття про Івана Франка), яка описана за допомогою причинно-наслідкової діаграми, а комп'ютер повинен давати відповіді на будь-які запитання відносно цієї історії – а саме те, що спричинило той чи інший факт.



На думку фахівців, ШІ повинен розвиватися у напрямі врахування контекстів та причинно-наслідкових зв’язків – і слід сказати, що в цьому сенсі вже ведуться дослідження й опрацьовується математичний апарат.

 

На завершення я б хотів запропонувати шість запитань для критичної оцінки досягнень ШІ, запозичених із книги “Rebooting AI: Building Artificial Intelligence We Can Trust”:

 

1) Якщо відкинути всю хвалебну риторику, чого насправді досягнула система ШІ?
2) Наскільки узагальнювальними є його результати?
3) Чи є конкретні приклади того, наскільки добре працює ШІ?
4) Якщо стверджується, що система ШІ працює краще людей, то яких саме людей?
5) Наскільки сучасні дослідження рухають нас у бік створення загального ШІ?
6) Наскільки надійною є система? Чи вона може працювати так само добре на інших наборах даних?

 

 

Доповідь прочитана на міждисциплінарному семінарі «Обрії науки» 24 вересня 2020 року в Українському католицькому університеті.

Текст підготував Андрій Гриниха. Фото https://theukrainians.org

 

25.12.2020