О статистике

Говорят, что существует 3 вида лжи: ложь, наглая ложь и статистика.

Статистика, несомненно, предмет большого количества манипуляций. Статистика опасна! Нельзя просто вслепую использовать её, иной раз может быть хуже с ней, нежели без неё. Например, «Иллюзия слишком тщательного исследования», которая великолепно описана в одной из моих самых любимых книг — «Эффекте Ореола»: если что-то слишком тщательно исследовать, то это выглядит «серьёзно», но не даёт гарантии того, что тщательное исследование, вообще, имеет смысл. 

Пример: «человек после прививки от коронавируса» (да-да, вновь о коронавирусе)

Один мой знакомый и прекраснейший человек поведал вот такую историю: «Вот сделал кто-то прививку от коронавируса, вышел из больницы, поскользнулся на собачьем дерьме, упал и умер от удара головой. А говорят, что умер от прививки». 

Так вот, я уж молчу о том, что его действительно можно записать «в умерших от коронавируса» (но нельзя записывать и в умерших от собачьего дерьма), умер человек и можно провести тщательнейшее исследование: выявить всю его родословную и собрать все его генетические заболевания; оценить количество кислорода в его крови; посчитать его текущее количество заболеваний и каждое из них исследовать и описать на какой оно стадии; тщательно исследовать его привычки; выяснить, что он делал в день смерти, за кого он голосовал на выборах, католик он или нет и проч., проч. Но смысл то в этом всём, если он просто умер от удара головой?

Тут то вы, несомненно, понимаете, что в этом смысла нет, т.к. есть нечто самое главное, после чего всё остальное теряет смысл. Но это лишь тут так очевидно!

Точно так же можно поставить знак равенства между «работет очень много / почти не спит / живёт в офисе» = «эффективная работа». Но мы же все понимаем…

Статистика заражения коронавирусом

На главной странице Яндекса есть виджет, в котором показываются «ежедневные выявления заболевания коронавирусом». И говорят, что «количество заболеваний страшно увеличилось по сравнению с прошлым годом». Окей!

По скольким параметрам оценивается заболеваемость? Ах, только лишь по одному: количество выявленных заболеваний, после проведения тестов. 

Теперь вопросы:

— Каким образом тестировали год назад и сейчас? (может, виды тестов отличаются)

— Стали ли тесты более точными? (если год назад точность была 50%, а сейчас 75%?)

— Заболеваемость растёт по некоей прогрессии, т.е. заболевших, быть может, нынче больше, чем год назад, следовательно справедливо ли сравнивать голые цифры или нужно опираться на процент заболевших? 

— Каков процент из выявленных тестов вакцинированы? Каков процент тестируемых только что сделали прививку? (и тест тупо положительный после прививки, а напомню: год назад прививки не было)

— Каково количество тестов относительно населения? Ибо если год назад тестировали 100 000 человек в день, а сегодня 1 000 000 человек в день, то условных 35000 человек от 100 000 и 35000 человек от 1 000 000 — это ведь кардинально разные цифры, разве нет?

И список я могу продолжать. Т.е. для корректной оценки количества выявленных заболевших нужно оперировать гораздо бОльшим количеством параметров. 

Смерти от коронавируса

А вот тут более интересно (хоть и печально): какое количество людей действительно скончались от того, что коронавирус нанёс непоправимый урон их здоровью? А какое количество скончалось от того, что от нагрузки от болезни оторвался давно назревший тромб? Или сдало утомлённое алкоголем и сигаретами сердце? А кому просто было плохо и он потерял сознание и во время потери сознания чем-то ударился? И примеров можно привести ещё очень много. А каково, вообще, здоровье современных людей? Они занимаются спортом, пьют воду, высыпаются, не употребляют спиртное, табак, не испытывают стресса? И что сделает с ними такая сильная нагрузка как коронавирус?

Думаю, что на последние несколько вопросов ответы итак очевидны. Так что выводы о статистике (и не только) оставляю вам.