Про математику. Від основ до незбагненного.

 

 

Чи снився вам колись кошмарний сон, в якому ви зненацька усвідомлюєте, що мусите складати іспит з курсу лекцій, яких ніколи не відвідували? Для викладачів це працює навпаки: вам сниться, що ви читаєте лекцію з предмету, про який нічого не знаєте.

 

Саме так я почуваюся щоразу, коли викладаю теорію ймовірності. Вона ніколи не була частиною моєї власної освіти, тож потреба тепер читати про це лекцію лякає і смішить, наче дім страхів у парку атракціонів.

 

Можливо, найбільше з усіх тем пульс прискорює «умовна ймовірність»: ймовірність того, що певна подія А стається, якщо (за «умови», що) відбулась якась інша подія В. Це нечітке поняття, яке легко сплутати з ймовірністю події В, якщо відбулась А. Це не одне і те саме, але ви мусите зосередитися, щоб побачити, чому це так. Наприклад, розгляньмо таку проблему тотожності слів.

 

Перед виїздом на канікули на тиждень ви просите свого роззявкуватого друга підливати вашу кволу рослину. Без води рослина має 90-відсотковий шанс померти. Навіть за належного підливання її шанс померти становить 20 %. А ймовірність того, що ваш друг забуде її підливати, становить 30 %. (а) Яка ймовірність, що ваша рослина переживе цей тиждень? (b) Якщо вона буде мертвою на момент вашого повернення, яка ймовірність того, що ваш друг забув її підливати? (с)  Якщо ваш товариш забув її підливати, яка ймовірність того, що вона буде мертвою, коли ви повернетесь?

 

Хоча вони звучать подібно, пункти (b) і (с) не є одним і тим самим. Насправді проблема показує, що відповіддю на (с) є 90 %. Але як поєднати всі ймовірності, щоб дістати відповіді на (b) чи (а)?   

 

Звісно, коли я викладав цю тему перші кілька семестрів, я дотримувався підручника, просуваючись вперед поволі та обережно, уникаючи ризику. Але поступово я почав дещо помічати. Дехто з моїх студентів волів уникати використовувати «теорему Баєса», заплутану формулу, якої я їх вчив. Натомість вони воліли розв'язувати проблеми набагато простішим методом.

 

Рік за роком ці винахідливі студенти щоразу виявляли кращий спосіб розглядати умовну ймовірність. Їхній метод узгоджується з людською інтуїцією, замість того щоб заважати їй. Трюк полягає у тому, щоб мислити в термінах «натуральних частот» — простий підрахунок подій, — а не у більш абстрактних поняттях відсотків, випадковостей або ймовірностей. Тільки-но ви зробите цей зсув у свідомості, як туман розсіється.

 

Це є основним уроком чудової книжки «Усвідомлені ризики» Ґерда Ґіґеренцера, когнітивного психолога з Інституту розвитку людини Макса Планка в Берліні. У низці розвідок про медичні й правові проблеми в діапазоні від допомоги хворим на СНІД до інтерпретації ДНК-генотипоскопії Ґіґеренцер досліджував, як люди неправильно оцінюють ризик і невизначеність. Але він не картає людей і не скаржиться на людську слабкість, а радше показує нам, як зробити краще — як уникнути «затуманеного мислення», переформульовуючи пов'язані з умовною ймовірністю проблеми в термінах натуральних частот, так само, як робили мої студенти.

 

В одному дослідженні Ґіґеренцер і його колеґи попросили лікарів у Німеччині та Сполучених Штатах оцінити ймовірність того, що жінка з позитивною мамограмою справді має рак грудей, навіть якщо вона є в групі низького ризику: вік 40–50 років, без симптомів і раку грудей в сімейному анамнезі. Щоб конкретизувати питання, лікарів попросили опиратись на ось такі статистичні дані — сформульовані в термінах відсотків і ймовірностей — про поширеність раку грудей серед жінок цієї групи, а також про точність мамограми і відсоток хибнопозитивних результатів.

 

Ймовірність того, що одна з цих жінок має рак грудей, становить 0,8 %. Якщо жінка має рак грудей, ймовірність позитивної мамограми становить 90 %. Якщо жінка не має раку грудей, ймовірність позитивної мамограми становить  7 %. Уявімо жінку з позитивною мамограмою. Яка ймовірність того, що в неї рак грудей?

 

Ґіґеренцер описує реакцію першого протестованого лікаря, керівника відділення в університетській навчальній лікарні з понад тридцятирічним професійним досвідом:

 

«Він був помітно зденервований, пробуючи збагнути, що він скаже цій жінці. Обдумавши цифри, він врешті-решт оцінив ймовірність того, що у жінки рак грудей, зважаючи на її позитивну мамограму,  у 90 %. І нервово додав:"Що за маячня. Я не можу цього зробити. Вам треба було б протестувати мою дочку; вона вивчає медицину". Він знав, що його оцінка є хибною, але не знав, як міркувати краще. Попри те, що він витратив 10 хвилин, терзаючи свій мозок у пошуках відповіді, він не зміг збагнути, як зробити правильний умовивід із ймовірностей».

 

Коли Ґіґеренцер поставив те саме питання перед 24 іншими німецькими лікарями, їхні оцінки коливалися від 1 % до 90 %. Вісім з них вважали, що ймовірність не більша 10 %, ще вісім висловились за 90 %, а решта вісім приблизно визначили ймовірність між 50 % і 80 %. Уявіть собі, як засмутився би пацієнт, якби почув такі відмінні думки.  

 

Що ж до американських лікарів, то 95 зі 100 оцінили ймовірність того, що в жінки рак грудей, приблизно у 75 %.

 

Правильною відповіддю є 9 %.

 

Як вона може бути такою низькою? На думку Ґіґеренцера, аналіз стає майже очевидним, якщо ми перекладемо вихідну інформацію з мови відсотків та ймовірностей на мову натуральних частот.

 

Вісім жінок з кожної тисячі мають рак грудей. З цих восьми жінок з раком грудей сім матимуть позитивну мамограму. З позосталих 992 жінок, в яких нема раку грудей, 70 однаково матимуть позитивну мамограму. Розгляньмо вибірку жінок, які мають позитивну мамограму після обстеження.  Скільки з цих жінок насправді мають рак грудей?

 

Оскільки 7 + 70 = 77 жінок мають позитивну мамограму і лише 7 з них справді хворі на рак грудей, ймовірність мати рак грудей за позитивної мамограми є 7 із 77, що дає 1 з 11, чи близько 9 %.

 

Зверніть увагу на два спрощення в попередньому обчисленні. Спочатку ми округлили десяткові дроби до цілих чисел. Це відбулося в кількох місцях, як-от тоді, коли ми сказали: з цих восьми жінок з раком грудей сім матимуть позитивну мамограму. Насправді ми мали сказати: 90% з восьми жінок, або 7,2 жінок, матимуть позитивну мамограму. Тож ми трохи пожертвували точністю заради більшої ясності.

 

По-друге, ми припустили, що все відбувається саме з такою частотою, на яку вказує ймовірність. Наприклад, оскільки ймовірність раку грудей становить 0,8 %, то припускається, що його матимуть точно 8 жінок з 1 000 в нашій гіпотетичній вибірці. Насправді це не конче є правдою. Події не мусять дотримуватися своєї ймовірності; монета, яку підкидають 1 000 разів, не завжди впаде орлом догори 500 разів. Однак це буцімто є правильною відповіддю в таких, як ця, проблемах.

 

Правду кажучи, ця логіка є трохи хиткою — саме тому підручники хнюплять носа в разі такого підходу порівняно з більш строгою, але важчою в застосуванні теоремою Баєса, — але виграш у ясності є достатнім виправданням. Коли Ґіґеренцер тестував іншу групу з 24 лікарів, цього разу використовуючи натуральні частоти, майже всі з них дали правильну відповідь чи близьку до неї.

 

Хоч переформулювання даних у термінах натуральних частот є дуже помічним, усе ж проблеми умовної ймовірності можуть спантеличувати з інших причин. Легко поставити хибне запитання чи обчислити ймовірність, яка є правильною, але дезорієнтує.

 

І обвинувачення, і захист грішили цим під час процесу О. Джей Сімпсона в 1994–1995 рр. Кожен з них просив присяжних взяти до уваги хибну умовну ймовірність.

 

Обвинувачення перші десять днів процесу витратило на надання доказів, що О. Джей Сімпсон мав історію насильства щодо своєї колишньої дружини Ніколь. Він буцімто бив її, жбурляв нею об стіну і домагався її прилюдно, кажучи очевидцям: «Це належить мені». Але чи мало усе це щось спільне з процесом про вбивство? Доводом обвинувачення було те, що модель жорстокого ставлення до дружини відображає мотив для вбивства. Як висловив це один з обвинувачів: «Ляпас є прелюдією до вбивства».

 

Алан Дершовіц зі сторони захисту відбив удар, арґументуючи, що навіть якщо звинувачення в домашньому насильстві є правдивими, вони не стосуються до справи і через це їх не має приймати суд. Пізніше він написав: «Ми знали, що могли б довести в разі потреби, що нескінченно малий відсоток — напевно менше, ніж 1 з 2 500 — чоловіків, які дають ляпасів чи б'ють своїх сімейних партнерів, доходять до того, щоб їх вбити».

 

Насправді обидві сторони просили присяжних розглянути ймовірність того, що чоловік вбив свою колишню дружину, беручи до уваги, що він перед тим її бив. Але як звернув увагу статистик І. Дж. Ґуд, це не те число, яке треба брати до уваги.

 

Насправді питання є таким: яка ймовірність того, що чоловік убив свою колишню дружину, за умови, що він перед тим її бив і вона була кимось вбита? Умовна ймовірність виявляється дуже далекою від 1 на 2 500.

 

Щоб побачити, чому це так, візьмімо вибірку зі 100 тис. битих жінок. Беручи до уваги число Дершовіца 1 з 2500, ми сподіваємося, що близько 40 з цих жінок будуть убиті їхніми кривдниками даного року (оскільки 100 тис., поділене на 2 500, дорівнює 40). Ми можемо оцінити, що в середньому ще трьох з цих побитих жінок уб'є хтось інший (ця оцінка базована на статистиці зі звіту FBI для жінок, вбитих у 1992 році). Тож загалом маємо 43 жертви убивств, 40 з них були вбиті їхніми кривдниками. Іншими словами, кривдник був убивцею приблизно у 93 % випадків.

 

Не плутайте це число з ймовірністю, що О. Джей Сімпсон зробив це. Ця ймовірність залежала би від багатьох інших доказів, за і проти, як-от заява захисту, що поліція неправдиво його звинуватила, або заява обвинувачення, що у вбивці та О. Джей Сімпсона були такі самі черевики, рукавиці й ДНК.  

 

Яка є ймовірність того, що щось із цього змінило вашу думку про вирок? Нуль. 

 

 


Steven Strogatz
The Joy of X
Зреферувала Галина Грабовська

 

21.10.2016