Условная вероятность является одним из важнейших понятий теории вероятности. В этой статье она будет разобрана на простых примерах. Те, кто хорошо знаком с предметом, не найдут здесь ничего интересного. Для остальных продолжим. Текст не сложный, примеры простые, только необходимый минимум формул.
Введение
Допустим, у нас есть случайный процесс, который может породить некоторое количество исходов (событий) с соответствующими вероятностями. Мы будем рассматривать случай, когда исхода всего два. Назовем исходы А1 и А2, их вероятности Р(А1) и Р(А2), сумма вероятностей Р(А1)+Р(А2)=1. Вероятности Р(А1) и Р(А2) будем называть априорными, так как эти величины не учитывают никакой дополнительной информации.
Далее мы проводим дополнительный эксперимент, результатом которого является событие В. Результат эксперимента может скорректировать наши представления о вероятности событий А1 и А2.
Так вот, условная (или апостериорная) вероятность – это и есть скорректированная вероятность с учетом новой информации от события В.
Пока все сказанное выглядит несколько абстрактно, поэтому перейдем к пояснению на примере.
Две монеты
Допустим, в кармане лежат 2 монеты, не различимые наощупь. Но монеты разные: одна из них обычная орел/решка, а вторая орел/орел. Мы наугад достаем одну из них. Очевидно, что любая из монет может оказаться в руке с вероятностью 1/2.
Перейдем к дополнительному эксперименту. Подбросим выбранную монету и посмотрим, какой стороной она выпала.
Разберем сначала неинтересный случай – монета выпала решкой. В этой ситуации после эксперимента неопределенность исчезает, выбранная монета оказалась монетой орел/решка с вероятностью 1. Все очевидно, формулы не нужны.
Интересным является случай, когда выбранная монета выпала орлом. В этой ситуации сохранилась неопределенность. Но сместились ли вероятности того, какую монету мы достали? Для одного броска это не вполне очевидно. Но допустим, что мы совершили некоторое количество бросков, и каждый раз монета выпадала орлом. И тут мы понимаем, что чем больше бросков, в результате которых каждый раз выпадает орел, тем больше степень уверенности в том, что мы наугад выбрали монету орел/орел.
Как это можно оценить численно? Пришло время отвлечься от конкретного примера и сделать небольшую теоретическую вставку.
Но сначала запишем для случая двух монет события и вероятности.
Априорные вероятности
Событие А1: Мы наугад выбрали монету орел/орел. Вероятность Р(А1)=1/2.
Событие А2: Мы наугад выбрали монету орел/решка. Вероятность Р(А2)=1/2.
Дополнительный эксперимент
Произошло событие В: Выбранную наугад монету мы подбросили N раз, и каждый раз выпадал орел.
Теперь обещанная теория.
Формула Байеса
Введем в рассмотрение величины Р(А1|B) и Р(А2|B), которые называются условными вероятностями:
Р(А1|B) - это вероятность события А1 при условии, что произошло событие В.
Р(А2|B) - это вероятность события А2 при условии, что произошло событие В.
Формула для условной вероятности получается из таких соображений. Вероятность совместного события AB (это когда предполагается, что вместе произошло и событие А и событие В) можно связать с условными вероятностями двумя способами:
Р(АВ)=Р(А|B)*Р(В)
Р(АВ)=Р(В|А)*Р(А)
Отсюда следует, что
Р(А|B)=Р(В|А)*Р(А)/Р(В)
Это формула Байеса для вычисления условной вероятности.
В случае двух исходов получаем:
Р(А1|B)=Р(В|А1)*Р(А1)/Р(В)
Р(А2|B)=Р(В|А2)*Р(А2)/Р(В)
Так как после дополнительного эксперимента сумма вероятностей по прежнему равна 1, то есть Р(А1|B)+Р(А2|B)=1, то полная вероятность события B равна:
Р(B)=Р(В|А1)*Р(А1)+Р(В|А2)*Р(А2)
Заметим, что для определения искомых вероятностей Р(А1|B) и Р(А2|B), в формуле Байеса используются:
- априорные вероятности Р(А1) и Р(А2),
- промежуточные величины Р(В|А1) и Р(В|А2), которые найти очень просто.
Смысл формулы Байеса состоит в том, что для вычисления искомых вероятностей сначала вычисляются промежуточные вероятности, при этом меняются местами условие (причина) и следствие из условия.
То есть при использовании формулы Байеса вычисляется вероятность того, что событие В (следствие) было вызвано событием А1 и А2 (причиной). Полученные таким образом промежуточные величины Р(В|А1) и Р(В|А2) далее используются для расчета искомых Р(А1|B) и Р(А2|B).
Все это станет понятным при возвращении к примеру.
Две монеты (продолжение)
Нам надо найти следующие величины:
Р(А1|B) – вероятность того, что мы наугад выбрали монету орел/орел при условии, что эта монета N раз подряд выпала орлом.
Р(А2|B) – вероятность того, что мы наугад выбрали монету орел/решка при условии, что эта монета N раз подряд выпала орлом.
Априорные вероятности известны: Р(А1)=1/2, Р(А2)=1/2.
Поэтому для вычисления Р(А1|B) и Р(А2|B) надо найти Р(В|А1) и Р(В|А2).
Р(В|А1) – вероятность того, что монета N раз подряд выпадет орлом при условии, что эта монета орел/орел. Очевидно, что Р(В|А1)=1.
Р(В|А2) – вероятность того, что монета N раз подряд выпадет орлом при условии, что эта монета орел/решка. Р(В|А2)=(1/2)^N.
Теперь мы можем записать формулы искомых условных вероятностей:
Р(А1|B)=1/(1+(1/2)^N)=2^N/(2^N+1)
Р(А2|B)=1-Р(А1|B)=1/(2^N+1)
Для упомянутого выше «не вполне очевидного» случая одного броска (N=1), вместо исходного распределения Р(А1)=1/2 и Р(А2)=1/2, получаем Р(А1|B)=2/3 и Р(А2|B)=1/3.
Рассмотрим еще один пример применения формулы Байеса.
Проверка брака на производстве
Есть предприятие, на котором производится некое изделие. По результатам длительных испытаний известно, что вероятность того, что наугад выбранное изделие окажется бракованным, равна p.
На предприятии используется выборочный контроль качества. Вероятность того, что процедура контроля выдаст ошибочный результат, равна q. Уточним, что ошибка может быть двух видов: изделие с браком признано исправным, исправное изделие признано бракованным.
Итак, наугад выбрано изделие, проведена процедура проверки качества, в результате изделие признано бракованным. Какова вероятность того, что оно является таковым на самом деле? Расчет будет приведен ниже. Далее варьированием параметров p и q мы выясним, каково должно быть их соотношение для того, чтобы обеспечить достаточную точность контроля.
Запишем события и вероятности.
Априорные вероятности
Событие А1: Наугад выбрано бракованное изделие. Вероятность Р(А1)=p.
Событие А2: Наугад выбрано исправное изделие. Вероятность Р(А2)=1-p.
Тестирование
Произошло событие В: Выбранное наугад изделие прошло процедуру контроля, и тест признал изделие браком (при этом вероятность того, что процедура контроля выдаст ошибочный результат, равна q).
Расчет условной (апостериорной) вероятности
Требуется найти Р(А1|B), то есть вероятность того, что выбранное наугад изделие реально бракованное, при условии, что это изделие признано бракованным процедурой контроля.
Для вычисления Р(А1|B) надо вычислить Р(В|А1) и Р(В|А2).
Р(В|А1) – это вероятность того, что изделие признано браком при условии, что оно браковано на самом деле. Процедура контроля ошибается с вероятностью q, то есть дает правильный результат с вероятностью 1-q. Значит Р(В|А1)=1-q.
Р(В|А2) – это вероятность того, что изделие признано браком при условии, что оно на самом деле исправно. Процедура контроля ошибается с вероятностью q. Значит Р(В|А2)=q.
Теперь мы можем записать формулу для искомой величины:
Р(А1|B)=(1-q)*p/[(1-q)*p+q*(1-p)]
После того, как формула получена в общем виде, протестируем ее на численных данных. Зададим реальную вероятность брака p=0.001. Варьировать будем вероятность ошибки процедуры контроля q. Приведем расчет для нескольких значений q, при этом величину Р(А1|B) округлим до двух знаков.
Если q=10*p=0.01, то Р(А1|B)=0.09
Если q=p=0.001, то Р(А1|B)=0.50
Если q=0.1*p=0.0001, то Р(А1|B)=0.91
Если q=0.01*p=0.00001, то Р(А1|B)=0.99
Из приведенных расчетов следует, что для получения адекватной информации о реальном состоянии тестируемого изделия, вероятность ошибки процедуры контроля q должна быть много меньше исторической вероятности брака p. И этот вывод может быть не для всех очевиден до проведения расчетов. В данном случае использование формулы Байеса поможет найти то соотношение между p и q, которое позволяет осуществлять контроль качества с любой заданной точностью.
Кстати, та же самая задача может быть сформулирована в более драматичном виде. Если p – вероятность некого заболевания, распространенность которого в популяции стабильна, q – вероятность ошибки метода выявления заболевания, то все приведенные выше расчеты справедливы и для этой формулировки. Поэтому, если вы получите диагноз при исследовании, то до того, как начинать всерьез волноваться, надо прежде всего выяснить соотношение между p и q.
Мнимые парадоксы
В заключение несколько слов о парадоксах типа Задачи о двух конвертах или Игры Монти Холла. Об их решении достаточно написано, поэтому не будем останавливаться на них подробно. Скажем лишь о том, что представление об области применимости условной вероятности наилучшим образом позволяет понять их мнимую парадоксальность. Достаточно лишь осознать, что к тому моменту игры, когда Участник должен сделать свой выбор, он не получил никакой полезной информации по сравнению с информацией до начала игры. То есть к моменту выбора Участник по прежнему имеет дело с априорными вероятностями, а апостериорные просто отсутствуют.
Комментарии
Переведи. https://youtu.be/orbFDdlq1ig
Прочитал, вспомнил молодость. Тридцать лет назад статью бы понял полностью, а сейчас "тёмный лес".
Так для того статья и написана, чтобы была возможность вспомнить. Штука то полезная, может пригодиться.
Почему дополнительный, а не просто первый? После него все следующие будут апостериорные по отношению ко времени до первого. При этом каждая новая будет априорной по отношению к оставшимся.
Тут тоже кривое выражение, так как достанете любую в вероятностью 1, в то время как другая останется с вероятностью тоже 1. Но если вы скажете, что достанете какую-то из (орел/решка) или (орел/орел), то действительно 0,5 и 0,5.
Последнее замечание интересное. В свое время у меня был разговор на эту тему с коллегой. Приведу ту ситуацию, которую мы обсуждали.
Итак, допустим ваш знакомый - футбольный болельщик. Предстоит игра Реал-Барселона. Вы до игры просите его дать прогноз результата. Для простоты матч на вылет, ничьи быть не может. Он дает такой прогноз: вероятность победы Реала 0.6, Барселоны 0.4.
Вы игру смотрите и результат вам точно известен. Допустим Барса выиграла.
А приятель игру проспал, новостей не слышал, результата не знает. Вы повторно просите его оценить вероятности победы команд. Он говорит, что так как ничего нового за время сна не узнал, то вероятности те же: 0.6 на 0.4.
Но матч то уже завершен, результат известен. Так как вы считаете, прав ли ваш знакомый, оценивая вероятности исхода игры?
С одной стороны, игра завершена, результат вы знаете. Но результат неизвестен вашему знакомому. Так может ли он после игры оценивать вероятности победы команд? Или он ерундой занимается?
"Далее мы проводим дополнительный эксперимент" -
Я объяснял так. Пусть проводится эксперимент, в котором может произойти или нет событие А. Например, стрельба по мишени, а событие А - попадание в 10. Тогда вероятность А ~ (число попаданий в 10) / (число выстрелов). Также рассматривается событие В, которое тоже может произойти или нет в первом эксперименте. Например, попадание вправо и вверх от центра мишени. Теперь рассмотрим новый эксперимент, который считается состоявшимся, если проводится первый эксперимент и в первом эксперименте произошло А. Тогда вероятность получить В в новом эксперименте это условная вероятность Р(В|А).
Ну и в нашем случае: Р(В|А) ~ (число дырок в 10 справа сверху от центра) / (число дырок в 10) = Р(АВ) / Р(А)
Как я понял, тут речь идет о подмножествах поля 10. Видимо вы рассматривали 4 подмножества: верх справа, верх слева, низ справа, низ слева. То есть речь просто о попадании в различные сектора поля 10. При отсутствии информации о распределении рассеяния выстрелов относительно центра разумно предположить отсутствие какой либо ассиметрии. То есть попадание в сектор справа сверху в 10 - это просто 1/4 от всех попаданий в 10.
Я честно говоря не вижу, где тут условная вероятность. Но может что то не понял в объяснении.
Это статистическое определение условной вероятности, такое же, как и статистическое определение просто вероятности.
Когда речь о событии В, то рассматривается только одно поле: справа сверху от центра, причем всей мишени и даже всего стенда, на котором мишень.
"попадание в сектор справа сверху в 10 - это просто 1/4 от всех попаданий в 10" - совсем не обязательно. Может быть, у стрелка прицел косой или глаз косой.
Считайте дырки при большом числе выстрелов - и получите условную вероятность.
Спорить не буду, надо обдумать.
А что скажете по истории о матче Реал-Барселона? Это выше в обсуждении.
Вопрос то интересный, я бы даже сказал - филосовский. В сущности это про предмет изучения теорвера. Этот предмет - истинно случайные процессы? Или детерминированные процессы с неполной информацией? Или все сразу?
https://aftershock.news/?q=comment/15840131#comment-15840131
В случае Вашего знакомого - скорее занимается ерундой. Но вот аналогичный пример, когда рассуждения о вероятностях вполне осмыслены.
Игра в преферанс, карты розданы, прикуп открыт. Вы оцениваете вероятность расклада 4 - 0 в бубях у партнеров. И на основании такой оценки принимаете решение. Вполне практический вопрос.
Про преф согласен. Но ваш пример с префом для меня лично подтверждает полезность размышления над такими задачами, как про матч.
В префе перед заказом игры ни у кого нет полной информации о раскладе.
В случае с прошедшим матчем она у кого то есть. Но что это меняет для того, у кого ее нет?
Для проспавшего - это задача с неполной информацией. Но решать задачу надо здесь и сейчас. И даже понимая, что полная информация в принципе есть, решать придется на основании неполной, то есть с помощью вероятностей, выхода другого нет.