Данська модель ШІ з високою точністю прогнозує тривалість життя конкретної людини.

Нова модель штучного інтелекту може прогнозувати тривалість життя конкретної людини, кажуть дослідники. Вони хочуть бути впевненими, що вона буде використана на благо

 

 

Дослідники створили інструмент штучного інтелекту, який використовує послідовності життєвих подій, таких як медична історія, освіта, робота і дохід, щоб передбачити все – від особистості людини до її летальності.

 

Побудований із використанням трансформерових моделей, які є основою великих мовних моделей, таких як ChatGPT, новий інструмент life2vec навчається на масиві даних, узятих в усього населення Данії – 6 мільйонів людей. Цей масив даних було надано урядом Данії лише дослідникам.

 

Інструмент, який дослідники побудували на основі цього складного набору даних, здатен передбачати майбутнє людини, зокрема тривалість життя, з точністю, що перевищує найсучасніші моделі. Але, незважаючи на його прогностичну силу, команда дослідників вважає, що його найкраще використовувати як фундамент для майбутньої роботи, а не як самоціль.

 

"Незважаючи на те, що ми використовуємо прогнозування, щоб оцінити, наскільки хороші ці моделі, інструмент не варто використовувати для прогнозування на реальних людях, – каже професор комп'ютерних наук Тіна Еліассі-Рад (Північно-Східний університет у Бостоні). – Це модель прогнозування, побудована на конкретному масиві даних про конкретну групу населення".

 

Тіна Еліассі-Рад

 

Еліассі-Рад привнесла в проєкт свій досвід у питаннях етики штучного інтелекту: "Ці інструменти дозволяють по-іншому дивитися на ваше суспільство: на політику, яку ви проводите, на правила і норми, які ви маєте. Ви можете сприймати це як сканування того, що відбувається на місцях".

 

Залучивши соціологів до процесу створення цього інструменту, команда сподівається, що це привнесе людиноцентричний підхід до розробки штучного інтелекту, який не втрачає конкретної людини з поля зору серед величезних масивів даних, на яких навчався їхній інструмент.

 

"Ця модель пропонує значно комплексніше відображення світу, в якому живуть люди, ніж багато інших моделей", – каже Суне Леманн, автор статті, яка нещодавно була опублікована в журналі Nature Computational Science.

 

 

В основі life2vec лежить величезний масив даних, який дослідники використовували для навчання своєї моделі. Ці дані зберігаються в Статистичному управлінні Данії, центральному органі данської статистики, і незважаючи на суворе регулювання, деякі представники громадськості, зокрема дослідники, можуть отримати до них доступ. Причиною такого суворого контролю є те, що він містить детальний реєстр кожного громадянина Данії.

 

Дані включають багато описаних подій та елементів життя, починаючи від факторів здоров'я й освіти і закінчуючи рівнем доходу. Дослідники використали ці дані для створення довгих патернів повторюваних життєвих подій, які вони заклали у свою модель, застосувавши підхід трансформерової моделі, що використовується для навчання великих мовних моделей, та адаптувавши його до людського життя, представленого як послідовність подій.

 

"Всю історію людського життя, в певному сенсі, можна уявити як гігантське довге речення про багато речей, які можуть трапитися з людиною", – каже Леманн, професор мереж і комплексології в DTU Compute, Технічному університеті Данії, а раніше – постдокторант у Північно-Східному університеті.

 

Модель використовує інформацію, отриману в результаті спостереження за мільйонами послідовностей життєвих подій, щоб побудувати так звані векторні зображення в латентних просторах, де вона починає категоризувати і встановлювати зв'язки між життєвими подіями, такими як рівень доходу, освіта або фактори здоров'я. Ці латентні простори слугують основою для прогнозів, які в результаті робить модель.

 

Однією з життєвих подій, яку спрогнозували дослідники, була ймовірність смертності людини. (База даних містить інформацію, що охоплює період з 2008 по 2020 рік, хоча «life2vec» використовує дані за період 2008–2016 років, щоб мати можливість передбачити ситуації на наступні чотири роки, а потім перевірити прогноз: на запитання «чи помре він через чотири роки?» модель була правильною у 78% випадків – на 11% більше, ніж аналогічні моделі).

 

"Коли ми візуалізуємо простір, який модель використовує для прогнозування, він виглядає як довгий циліндр, який веде вас від низької ймовірності смерті до високої, – каже Леманн. – Тоді ми можемо показати, що в тому кінці, де висока ймовірність смерті, багато з цих людей дійсно померли, тоді як у тому кінці, де ймовірність смерті низька, причинами смерті є те, чого ми не можемо передбачити – наприклад, автомобільні аварії".

 

Стаття також ілюструє, як модель здатна передбачати індивідуальні відповіді на стандартний особистісний опитувальник, зокрема коли йдеться про екстраверсію.

 

Еліассі-Рад і Леманн зазначають, що хоча модель робить високоточні прогнози, вони ґрунтуються на кореляціях, дуже специфічних культурних і суспільних контекстах та упередженнях, які існують у кожному масиві даних.

 

"Такий інструмент є своєрідною обсерваторією суспільства – але не всіх суспільств, – каже Еліассі-Рад. – Це дослідження проводилося в Данії, а Данія має свою культуру, свої закони і свої суспільні правила. Чи можна подібне зробити в Америці – це вже інша історія".

 

Враховуючи всі ці застереження, Еліассі-Рад і Леманн розглядають свою прогностичну модель не як кінцевий продукт, а радше як початок суспільної розмови. Леманн каже, що великі технологічні компанії, ймовірно, роками створювали подібні алгоритми прогнозування в закритих кімнатах. Він сподівається, що ця робота покладе початок більш відкритому, публічному розумінню того, як працюють ці інструменти, на що вони здатні та як їх слід і не слід використовувати.

 

Представлення життєвих послідовностей, обумовлених прогнозами смертності a-g. Двовимірна проєкція 280-мірних зображень життя з використанням методу DensMap. Повна проекція в d забарвлена відповідно до передбачуваної ймовірності смертності. Червоні точки позначають дійсно померлих. Точки з меншим радіусом є невизначеними прогнозами. a-c і e-g показують збільшені області з додатковими аспектами, пов'язаними з життєвим циклом. Область 1 містить точки з низькою ймовірністю смертності (a-c), а область 2 з високою ймовірністю (e-g). 

 

Germans Savcisens, Tina Eliassi-Rad, Lars Kai Hansen, Laust Hvas Mortensen, Lau Lilleholt, Anna Rogers, Ingo Zettler & Sune Lehmann
Using sequences of life-events to predict human lives

DOI: 10.1038/s43588-023-00573-5

A transformer method that predicts human lives from sequences of life events

Nature Computational Science (2023)

DOI: 10.1038/s43588-023-00586-0

 

Cody Mello-Klein
New AI model can predict human lifespan, researchers say. They want to make sure it's used for good
Phys.org, 23.12.2023

 

07.01.2024