Cпойлер
Если вас смущает этот вывод, то утешьтесь тем, что вы не одиноки. Большинство людей, в том числе профессиональные медики, приходит от такого странного утверждения в замешательство. Этот любопытный результат находит объяснение в теореме Байеса — математическом обосновании комбинации условных вероятностей. Теорема показывает, как ветвятся вероятности, и, в частности, сообщает нам, что вероятность заболевания ВИЧ при получении положительного результата анализа зависит не только от этого результата, но и от того, насколько в целом велика вероятность заболеть ВИЧ. Несмотря на то, что сам анализ почти совершенен, его точность зависит от другого условия, а именно — от априорной вероятности того, что у пациента вообще есть вирус. Мы не станем углубляться в формальное доказательство теоремы Байеса, так как это выходит за рамки настоящей книги и лишь напугает тех, кто незнаком с математическими символами. Однако логику теоремы понять легко, как легко и ее проиллюстрировать, несмотря на то, что истина прячется за парадоксально выглядящими статистическими выкладками.
Вернемся, однако, к нашему примеру. Каким образом тест с чувствительностью 99,99 процента может показать, что у человека с положительным результатом вероятность заболевания равна всего 50 процентам? Для человека из группы низкого риска вероятность заболеть СПИДом равна приблизительно 1:10 000. Теперь представьте себе, что 10 000 человек из этой группы низкого риска приходят сдавать анализ на ВИЧ. Один из них носитель ВИЧ, и результат его анализа практически наверняка окажется положительным. Но среди оставшихся, в связи с малой неточностью теста, один результат окажется ложноположительным. Таким образом, мы получим два положительных результата, лишь один из которых будет истинно положительным, — а это означает, что у пациента с положительным результатом вероятность заболевания равна именно 50 процентам.
Важно понимать, что такой удивительный результат не говорит о неадекватности самого анализа: в нашем примере тест отличается невероятной точностью. Главное заключается в том, что вследствие малой заболеваемости условная вероятность намного ниже той, какую мы ожидаем. На самом деле априорная вероятность того, что данный конкретный пациент инфицирован, неразрывно связана с достоверностью результата. Предположим, что тот же анализ делают людям из когорты высокого риска, например наркоманам, вводящим себе внутривенно героин. Частота инфицированности в этой группе равна приблизительно 1,5 процента. Снова представим себе, что анализ сдают 10 000 таких пациентов. В этой когорте у 150 человек тест окажется положительным ввиду истинной инфицированности. Из оставшихся 9 850 пациентов приблизительно у одного результат будет ложноположительным. Вероятность заражения при положительном результате в этой группе уже не равна 50/50 — в данном случае вероятность будет равна 150/151 или 99,34 процента, то есть намного больше, чем у пациента из когорты низкого риска.
Сценарии для случаев низкого и высокого риска можно для наглядности представить в виде частотного дерева, изображенного на рисунке. Разница между этими сценариями весьма велика, и на ней надо остановиться подробнее.