Примітивність зворотного зв’язку та комунікації з користувачами — це запрограмована властивість, а не хиба онлайн-сервісів. Комп’ютеру набагато простіше орієнтуватися в “лайках” або зірочках рейтингу “*****”, ніж видобувати зміст із текстів. Популярний сервіс Yelp збирає відгуки про якість послуг у ресторанах і готелях та не може існувати без зірочок рейтингу, які дозволяють проводити зручне сортування, фільтрування, а також оцінити, погіршується чи покращується сервіс із часом. Це зумовлює те, що я називаю...
Першим законом інтернет-даних
У будь-якому комп’ютерному середовищі перевага надається чітко структурованим даним.
“Чітко структурованими” є будь-які дані, які пов’язані з категоріями, квантифікацією та рейтингуванням. Ці дані є автономними, а їхня інтерпретація не потребує якого-небудь ширшого контексту. Це можуть бути будь-які дані — кредитні записи DSM, фінансові транзакції, категорії продуктів Amazon чи профілі у Facebook. Дані, які існують в структурованій і квантифікованій формі, набагато корисніші і важливіші для алгоритмів, а також для людей і компаній, які їх використовують, ніж неструктуровані дані — наприклад, тексти на природній мові, зображення чи відео.
На початку існування Інтернету, коли ще не було великої кількості інформації, яку можна було квантифікувати, цьому закону не надавали достатньо уваги. Але вже тоді оцифровані метадані, як-от графи зв’язків, які корисливо використовувала Google, свідчили про те, що алгоритми тяжіють у бік квантифікації інформації. Іншими словами, ранні дні Інтернету були радше відхиленням. Тоді ще не було масштабного оцифрування, яке прискорилось із появою соціальних медіа, таких як Facebook, Snapchat, Instagram і Twitter, а також платформ із продажів, зокрема Amazon та eBay.
Слід зазначити, що для Веб 2.0 використання соціальних даних — не самоціль. Натомість сучасний Інтернет має справу радше з класифікацією соціальної інформації і — загальніше — з класифікацією життя. Google добув усе, що можна було добути з неструктурованих даних. Розвиток Інтернету потребував чітко організованого контенту, придатного для аналізу комп’ютерними алгоритмами. А найкращий спосіб це зробити полягав у тому, щоб змусити користувачів самим генерувати ці дані.
Процес оцифрування вимагає, щоб дані були позначені і класифіковані ще перед тим, як їх можна сортувати і впорядковувати. Такі архівні проекти, як, наприклад, бібліотека Конгресу, не сортують книжок самих по собі, а створюють систему всеохопної класифікації, яка визначає, в якому порядку мають бути розташовані книги. Машинне навчання, своєю чергою, працює значно гірше, якщо йому не передують класифікаційні рамки.
Другий закон інтернет-даних
Для будь-яких даних класифікація важливіша, ніж те, що класифікується.
Результат і ефект машинного аналізу зумовлений не самими даними, а радше типом класифікації, за допомогою якого зібрали ці дані. Коли Facebook групує людей у категорії за якоюсь ознакою — наприклад, “любителі пива” чи “ентузіасти моди” — це не означає, що у всіх цих людей насправді є ця ознака. Це лише амальгама індивідуальних факторів, які разом свідчать лише про схильність мати цю ознаку. Рішення про те, що я маю, наприклад, афро-американську “етнічну приналежність”, Facebook приймає зовсім не за кольором моєї шкіри (можливо, про це свідчать аудіозаписи виконавця Sun Ra в моєму плей-листі?).
Але важливо те, що ці категорії цілком реальні й диктують те, як з нами поводитимуться в майбутньому. Сама назва категорії (наприклад, “афро-американець”, “етнічна меншина”, “африканське походження” чи “чорний”) важливіша, ніж критерії, які лежать в її основі. Ці критерії можуть суттєво перетинатися між собою і бути дуже розмитими, але класифікація, зрештою, застосовується до кожного конкретного випадку. Ми ніколи не знаємо критеріїв, за якими нас оцінюють, хоча дуже часто ці критерії бувають довільними, а то й зовсім хибними. Вибір класифікації для Facebook важливіший, ніж критерії, за якими ця класифікація проводиться.
Тут важливо зазначити, що писані тексти дають Facebook небагато простору для дій, адже із багатозначної людської мови алгоритмам важко робити бодай якісь висновки. Саме тому компанія використовує наперед визначені комп’ютерні класифікатори, які лише загострюють проблеми попередніх таксономій. Категорії DSM більше розповідають про те, як розглядають популяції пацієнтів, ніж про характеристики кожної окремої людини, адже ці категорії — лише підсумок синтезу даних. Те, як ми розуміємо економіку, більше залежить від того, як ми класифікуємо безробіття (чи включати в цю категорію людей, які працюють неповний робочий день або на тимчасовій роботі?), ніж, власне, від досвіду та думок громадян. Ваша думку про своє здоров’я може більше залежати від того, чи ваш стиль життя класифікують як “здоровий” чи “нездоровий”, ніж від вашого власного самопочуття. Навіть назва категорії — наприклад, “грубий” чи “з надлишковою вагою” — несе в собі асоціації, які впливають на її інтерпретацію.
Деякі класифікації значно успішніші і популярніші, ніж інші. Домінує емпіричне правило, яке полягає в тому, що...
Третій закон інтернет-даних
Простіші класифікації виграють у складніших.
Спрощення механізмів зворотного зв’язку (наприклад, зведення їх до “лайків” та “зірочок” рейтингу) є умисною. Якщо це потрібно, інтернет-сервіси, звісно, можуть мати справу зі складними процедурами, але бізнес воліє надавати перевагу простішим. Facebook, скажімо, чекав аж десять років, щоби додати ще якісь реакції до єдиної кнопки “лайк”, і досі пручається проти кнопки “дизлайк”, змушуючи своїх користувачів “лайкати”, скажімо, повідомлення про смерть чи політичні скандали. Тривалий час компанія надавала перевагу простій двомодальній метриці. Але коли вона вирішила нарешті заспокоїти своїх користувачів, то додала ще п’ять почуттів до оригінального “лайк”: “у захваті”, “ха-ха”, “овва”, “сумно” та “злість”. Останні два негативні почуття — “сумно” і “злість” — досить двозначні. Якщо наділяю якийсь пост позитивною емоцією, то це означає, що я зацікавлений в тому, щоб отримувати такий контент і надалі. Але ж маркую його позначкою “сумно” або “злість”, то це вже складніше: я можу бути як зацікавлений у такій інформації і надалі, так і це може свідчити про те, що я хотів би її уникати. Ці реакції, отже, не такі корисні для Facebook.
Шість стандартизованих реакцій нагадують emoji, адже дозволяють користувачам висловлювати свої емоції невербально. При цьому вони корисніші для Facebook, ніж еmoji, адже пропонують простішу класифікацію. BuzzFeed, до речі, використовує дещо іншу схему, яка більше адаптована для маркетингу та медіа-ринку: контент може бути “незвичним”, “захоплюючим”, “шокуючим”, “смішним” тощо.
Сара Фраєр з агентства Bloomberg розповідає, як Facebook сформулював шість основних типів: “Дослідники компанії спершу почали компілювати відгуки, які люди найчастіше залишали в коментарях під постами, зокрема “ха-ха!”, “LOL”, “OMG” тощо. Далі вони посортували їх у шість груп за основними емоціями — “подобається”,“у захваті”, “ха-ха”, “овва”, “сумно”, “злість”. Спершу була ще й категорія “ай”, але від неї відмовились, бо вона не була універсально зрозумілою”.
Іронічно, що ці примітивні реакції дають змогу провести ретельніший аналіз, ніж складніші і деталізовані схеми. Текстові коментарі відпадають, адже із писаного тексту комп’ютерам дуже складно видобувати потрібний зміст, якщо це тільки не “LOL” чи “ха-ха”. Шестичленна класифікація також має свої переваги: такі компанії, як Facebook чи BuzzFeed, шукають універсальні емоції. Якщо взяти шість базових реакцій, то існує дуже мало відмінностей між ними в різних мовах та культурах.
Важливо, що цей набір також дозволяє оцінювати пости кількісно. Користувачі самостійно сортують контент на різні категорії — “смішний”, “приємний”, “сумний” або “такий, що викликає лють”. На перший погляд, незрозуміло, що може бути спільного між, наприклад, повідомленням про те, що “Канада не виконує торгову угоду” і новиною, що “поп-зірка покидає сцену”, але Facebook знає, що обидва пости “засмучують” чи “злять” користувачів. Ці інструменти також дозволяють порівняти реакцію на пост окремих користувачів із тим, як на неї реагує Facebook-спільнота в цілому, або ж дають змогу підбадьорити їх, коли вони стають надто “сумними” або “злими”. Якщо реакції на пост поділені, то компанія може розбивати їх далі на субкатегорії — як-от “смішні-зворушливі” або “смішні-дивні”. Facebook також може визначати, на який тип контенту користувачі найбільше реагують, наприклад, гнівом чи сміхом і спрогнозувати реакції в майбутньому. Корпорація також може ізолювати надміру незадоволених чи буркотливих користувачів, зменшивши їхній вплив на решту людей, а також тренувати алгоритми “вгадувати” відгуки на пости, які ще не отримали зворотного зв’язку.
Найважливіше те, що хоча ці шість реакцій далеко не є універсальними, вибір Facebook цілком може зробити їх такими. Що більше ми користуємось мережею, то більше ми схильні сприймати свої почуття саме в цій простій шестичленній схемі і пристосовувати їх до неї.
Шість варіантів були вибрані із набагато чисельнішої палітри емоційних маркерів, яку розробляв Мет Джонс зі студії “Дісней-Піксар”. Повний список містив найрізноманітніші почуття, починаючи від гордості і закінчуючи страхом. Але простіша класифікація врешті перемогла. Нею легше оперувати, і вона універсальніша, що, однак, досягається коштом культурних та особистих варіацій. А також, за словами дослідника Дахера Келтнера у розмові з Ендрю Цоллі з Radiolab, “коштом щастя”:
“Країни, які реагували на пости найбільшою кількістю “щастя”, насправді не були найщасливішими. Натомість такими були ті країни, які використовували найрізноманітніші емоційні маркери. Саме вони мали найвищі показники соціального щастя, благополуччя і навіть довголіття”. “Річ не в тому, щоби бути найщасливішим. Річ у тому, щоби бути емоційно найрізноманітнішим”, — резюмує Келтнер.
Хоча наслідком обмеженого набору емоційних реакцій є звуження, соціальні медіа та рекламні компанії розглядають це як необхідну ціну можливості збирати про користувачів якнайбільше даних. Обмежена емоційна мова, яку використовує Facebook, є мовою, яку може розуміти комп’ютер. Такий сплющений фідбек дозволяє заповнити прогалину між емоційним світом людини і технічним світом комп’ютера, причому набагато краще, ніж складна ad hoc класифікація DSM. Своєю чергою, ці прості реакції нагадують популярні психологічні таксономії Маєрс-Бріґґс, OCEAN та HEXACO, які також розбивають складні феномени та дюжину простих осей. Зокрема, реакції Facebook нагадують Велику П’ятірку у психології:
1. “Лайк”: Доброзичливість
2. “У захваті”: Екстраверсія
3. “Овва”: Відкритість
4. “Сумно”: Нейротизм
5. “Злість”: Сумлінність
Єдина реакція, якій не знайшлось відповідника, — “ха-ха”. Хоча сміх — це одна з найуніверсальніших і найкраще зрозумілих емоцій, він протидіє простим та однозначним дефініціям. Для решти п’яти, однак, настає невідворотне спрощення культурних варіацій. Хоча перш ніж генералізувати ці шість емоцій компанія провела емпіричне дослідження, дуже малоймовірно, що люди в різних культурах і континентах під “овва” чи “злістю” розуміють одне й те ж — хоча вона, безумовно, й знайшла універсальний емоційний словник, який використовують на всіх континентах. Якщо дата-майнери та маркетологи далі рухатимуться звичним курсом, то скоро ми будемо захоплюватися, дивуватися, сумувати чи злитися в унісон.
Реакції Facebook – це спримітизований словник людських емоцій, адаптований для машинного аналізу. Коли я запровадив графічні emoji у Messenger client ще 1999 року, то не передбачав усього цього. Приблизно у 2015-му я почав помічати зміни на своїй сторінці у Facebook: стало значно менше дискусії. Люди, яких я знаю особисто, стали набагато менше коментувати пости чимось більшим, ніж “yeah”, “uhg” чи шістьма базовими емоціями. Я підловив себе на тому, що й сам часто дію так само.
Я перевірив свої пости за 2009-й і 2010 роки — і помітив, що тоді я ще писав повними реченнями з багатьма абзацами. Метаморфоза була разючою та драматичною. Множинність, нюанси та двозначність зникли. А якщо емоції били через край і я не погоджувався з хором “yeah” чи “ugh”, то натовп ще лютіше накидався на мене — як і на інших незгідних. Що ж сталося? Це були мої друзі, але вони більше не здавалися тими самими людьми. Ми стали стандартизованими. Ми тепер усі разом говоримо однієї і тією ж мовою — мовою Facebook, мовою комп’ютерів.
David Auerbach
How Facebook Has Flattened Human Communication
Medium 28.08.2018
Зреферував Є. Л.
05.10.2018