Чому біґ-дата не можна контролювати

Розумові, що сформувався в аналогову епоху, важко перетравити ключовий продукт епохи цифрової: приголомшливий обсяг інформації який створюють, збирають, у якому шукають кореляції. Те, що називають "біґ-дата", вже визначає спалахи грипу та належні методи лікування недоношених дітей, прогнозує перенаселення міст та затримки авіарейсів.

Пояснення того, як все це працює, є головною темою нової книжки "Біґ-дата: революція, що змінить наш спосіб життя, роботи та мислення", написаної вченим з Оксфорду Віктором Майєром-Шенберґером та Кеннетом Кукіером, редактором даних у The Economist. Книга повинна спонукати політиків до переосмислення того, як захистити наше приватне життя, відкриваючи водночас доступ до більшого обсягу даних. (Оголошення: видавцем є компанія Houghton Mifflin Harcourt, членом ради незалежних директорів якої я є)

Біґ-дата відрізняються від традиційної інформації у приголомшливий спосіб. З одного боку, як пишуть автори, "суспільству доведеться позбутися частини своєї одержимості причинно-наслідковим зв'язком та замінити її простими кореляціями. Це руйнує усталені за віки практики та ставить під сумнів наші елементарні підходи до того, як слід приймати рішення та розуміти реальність".

До недавнього часу біґ-дата були простою цікавинкою, але тепер вони стали важливим джерелом нових знань. Google краще визначає спалахи грипу, ніж Центри з контролю та профілактики захворювань. Google моніторить мільярди пошукових запитів (наприклад, "кращі ліки від кашлю"), і додає відомості про розташування користувачів для відстеження спалахів грипу. Коли WalMart аналізувала кореляції між даними про продаж товарів і погодними умовами, то виявила, що перед буревіями люди купують більше ліхтариків, а також більше печива Pop-Tarts, хоча й маркетологи не змогли встановити причинно-наслідковий зв'язок між погодою і попитом на печиво.

Дослідники технологій у Канаді аналізували дані про передчасні пологи, зі швидкістю понад 1000 раз на секунду. Вони шокували лікарів, продемонструвавши їм, що випадки, коли життєво важливі функції організму жінки є незвично стабільними, корелюються із серйозною лихоманкою через 24 години. Лікарі зараз запобігають лихоманці за допомогою окремого лікування, хоча причинно-наслідковий зв'язок залишається загадкою.

Вчені, що спеціалізуються на обробці даних, на замовлення Нью-Йорка проаналізували сотні наборів даних, щоб визначити, де власники незаконно ділять будинки та помешкання, здаючи їх в оренду, що веде до перенаселення і підвищує ризик серйозних пожеж. Маючи багато даних, зокрема, про випадки звернення стягнення на предмет іпотеки і скарги на появу щурів, інспектори змогли відсіювати скарги на перенаселення настільки ефективно, що знайшли небезпечні умови у 70% випадках, які вони розглядали, у порівнянні з 13% раніше.

Авіамандрівники можуть тепер з'ясувати, які рейси мають найвищі шанси бути виконаними вчасно, завдяки вченим, що вивчали дані про виконані авіакомпаніями рейси та їхні кореляції з погодними умовами. За кредитною оцінкою позичальника можна визначити, чи не потребує ця людина нагадувань про необхідність прийняти ліки. Видавці використовують дані, отримані завдяки аналізу текстів та з соціальних мереж, щоб запропонувати читачам персоналізовані новини.

Використання біґ-дата для інновацій у медицині є однією з найбільших їхніх можливостей, але чинне законодавство робить майже неможливим аналіз даних, зібраних в багатьох пацієнтів. Якби в нас були електронні медичні карти американців на кілька поколінь назад, ми могли б більше дізнатися про генетичні схильності, кореляції між симптомами, а також те, як персоналізувати лікування.

"Замість того, щоб зосередитися на проблемах випадкового оприлюднення або зловживання даними, які цілком навіть дуже реальні, – сказав Кукіер в інтерв'ю, – ми повинні збалансувати ці ризики з величезним потенціалом відкриття доступу до даних про стан здоров'я пацієнтів для дослідників. Я впевнений, що у майбутньому нас навіть лякатимуть випадки, коли лікарі не звертатимуться до потенціалу біґ-дата, що може їм допомогти у лікуванні пацієнтів – так само, як нині нас налякала б перспектива посадки авіалайнера пілотом без допомоги комп'ютерної апаратури".

Книжка Кукіера несподівано стала бестселером у Китаї. "Біґ-дата формуються як галузь саме зараз, коли Китай є винятково сильним, і це галузь, у якій він може стати світовим лідером та випередити Кремнієву долину", – каже він. Китай демонструє також темний бік біґ-дата, оскільки його уряд займається моніторингом практично усього – від користування інтернетом до місць перебування користувачів мобільних телефонів, щоб запобігти протестам та заарештувати дисидентів.

У США дискусія щодо приватності особистого життя зосередилася переважно на інтернет-рекламі з націлюванням. Автори книжки вказують на тривожніші проблеми, зокрема "покарання на підставі схильностей".

Правоохоронці використовують дані, щоб визначити вулиці, групи людей і навіть окремих осіб, за якими їм слід буде стежити завдяки "інтелектуальному поліцейському контролю". Це все чудово, аж поки це не перетворюється, як у фільмі "Особлива думка", на покарання людей за злочини, які, як підказують дані, вони, ймовірно, скоять у майбутньому. "Якщо ми притягатимемо людей до відповідальності за їхні передбачені майбутні вчинки, – застерігають автори, – ми також заперечуватимемо, що люди мають здатність робити моральний вибір". Біґ-дата не повинні "стати інструментом колективізації людського вибору і відмови від припущення про добру волю".

Автори порівнюють останні політичні рішення, що стосуються біґ-дата, з тим, як уряди реагували на появу друкарського верстату цензуруванням книжок і газет: "З плином століть ми зважилися на скасування обмежень для потоків інформації, і вирішили боротися з їхніми ексцесами не за допомогою цензури, а за допомогою правил, що обмежують зловживання інформацією".

Розумна політика щодо біґ-дата має наслідувати прецедент з друкарським верстатом, розширюючи доступ до інформації та, водночас, знаходячи творчі способи обмежити зловживання нею. Біґ-дата буде занадто складно придушити.


L. Gordon Crovitz]
Why ‘Big Data’ Is a Big Deal
The Wall Street Journal Europe, 22.03.2013
Зреферував Омелян Радимський

09.04.2013

До теми