[Обновлено] Covid-19: К Каплану-Мейеру (коронавирус.онлайн)

Аватар пользователя Bzz

...Правильным способом было бы разделить количество смертей сегодня на количество фактически инфицированных людей (включая незарегистрированные случаи) 16 дней назад, потому что в среднем 16 дней проходит между временем "заражения" и смертью. И поэтому необходимо сравнивать общее количество погибших с общим количеством инфицированных 16 дней назад.

Этот метод называется "Kaplan Meier Estimator" и используется всеми компаниями по страхованию жизни...

Сегодня на АШ опубликовали интервью профессора Пауля Роберт Фогта (Швейцария). Текст большой, но самой интересной показалась именно эта цитата. С методом Каплана-Мейера можно познакомиться здесь.

 

Как резонно заметили в комментариях, на итоговую оценку катастрофически влияет та самая, "темная", неучтенная часть заболевших. Именно ради нее пытаются запустить тестирование на антитела. Но, даже при отсутствии ее учета, можно сделать интересные выводы.

 

Что, если попробовать посчитать "летальность" заболевания исходя из пока имеющихся данных? Рассмотрим число выживших, принимая во внимание интервал в 2 недели, начиная с 10 апреля. Воспользовавшись инфографикой, представленной на Яндекс.Картах коронавирус.онлайн (здесь доступнее архивные данные) и взяв двухнедельный интервал (10.04...24.04), можно получить вот такие цифры (по возрастанию).

Формула: d24-d10/N10

d24 -умерших на 24.04

d10 - умерших на 10.04

N10 -  на общее число зараженных на 10.04


Германия - 2.3% = (5396-2607)/118235

Швейцария - 2.7%  = (1427-821)/22253

Испания - 4.3% = (22157-15447)/153222

Италия - 4.7% = (25.085-18279)/143626

Россия - 5.1% = (593-79)/10141

США - 7% = (49845-16691)/468566

Канада - 7.7% = (2123-509)/20765

Франция - 7.8% = (21376-12210)/117749 - "ступенька" на графике: вероятно, изменение методики учета заболевших

Нидерланды - 7.9%  = (4111-23960)/21762 (Tinkle Bell, Tinkle Bell... очень похоже)

Швеция - 12.9% (!!!) = (1580-591)/7693

Британия - 16.9% (!!!)  = (18100-7097)/65077


Обновлено: Для проверки, по совету комментатора, попробуем сдвинуть интервал на 3 дня ранее (7.04...21.04):

Германия: 2.76% = (4669-1810)/103375

Швейцария: 3% = (1427-765)/21657

Испания: 5.6% = (20852-13341)/136675

Россия: 5.6% = (408-51)/ 6356

Италия: 5.7% = (24114-16523)/132547

Канада - 7.8% = (1618-323)/ 16667

США - 8.3% = (41316-10876)/ 367385

Нидерланды - 10%  = (3751-1867)/ 18803 (Tinkle Bell, Tinkle Bell... очень похоже)

Франция - 11% = (19718 -8911)/ 98010 - "ступенька" на графике: вероятно, изменение методики учета заболевших

Швеция - 17% (!!!) = (1765-591)/6897 (также здесь)

Британия: 21.5% = (16509-5373)/ 51608



Не жестковато? :о)

 

Да, с одной стороны, в знаменателе сегодня точно ужасный недоучет, а в числителе возможны манипуляции с "пере"учетом... Однако национальный характер в подходе к учету эпидемии налицо.

И еще.

Получается, что вопрос "переоцененности" эпидемии может иметь основания не раньше, чем будет мало-мальски достоверная оценка неучтенных заболевших. А тем, кто ранее требовал убрать из статистики "спорно" учтенных бессимптомных, стоит хорошенько подумать - это действительно то, чего вы хотели? Какую тогда летальность получите?


Замечания об ошибках, включая аргументы о неприменимости метода для подобной оценки "в принципе" - приветствуются.


Пока дискутировал, сам нашел причину адских цифр - сейчас пересчитаю.

Редактор, пожалуйста, снимите с пульса или в Ахтунг.

Mea maxima culpa.

Пересчитал. Оценки, несмотря на грубый характер и "среднюю по палате", все равно очень интересные. Выводы устояли :о)

Авторство: 
Авторская работа / переводика
Комментарий автора: 

Особенности национального учета заболевших.

Не зря бежала почтенная публика с Туманного Альбиона, ох, не зря!

Комментарии

Аватар пользователя Bzz
Bzz(9 лет 2 месяца)

Дискуссионный комментарий, выросший в заметку.

Замечания об ошибках, включая аргументы о неприменимости метода для подобной оценки "в принципе" - приветствуются.

Аватар пользователя Антидот
Антидот(9 лет 11 месяцев)

Во всяком случае методика логичная.
Но показатели будут зависеть от уровня тестирования.
Чем выше уровень тестирования, тем больше выловили заболевших, а значит летальность ниже.
Реальное сравнение можно будет сделать по итогам эпидемии. Тогда можно будет сравнить смертность. Это будут более точные данные. Хотя и здесь можно со статистикой нахимичить.
Вот когда "снег сойдёт, тогда и посмотрим, кто и сколько гадил".

Аватар пользователя Bzz
Bzz(9 лет 2 месяца)

Именно.

Несколько досадно, что нельзя разделить эффективность противоэпидемических мер и затраты на выявление. Но оценить "комулятивный" эффект тоже интересно.

Аватар пользователя zz27
zz27(10 лет 4 месяца)

А тем, кто ранее требовал убрать из статистики "спорно" учтенных бессимптомных, стоит хорошенько подумать - это действительно то, чего вы хотели? Какую тогда летальность получите?

Мы истину хотим узнать, или красивые цифры нарисовать?

Аватар пользователя Bzz
Bzz(9 лет 2 месяца)

Так и на здоровье.

Намек был как раз на то, что требовали-то как раз люди, которые придерживаются точки зрения о "фейковости" эпидемии. С уменьшением знаменателя (если следовать их предложениям), летальность как раз растет. Что свидетельствует о большей опасности заразы.

Аватар пользователя user3120
user3120(10 лет 4 месяца)

Если нет статистики о "фактически инфицированных людей" - не можете правильно считать летальность как не могут и на соотв сайтах. У них не летальность а справочная цифра отношения смертей к числу кейсов.

Те летальности что подсчитаны(до 0,4%) и та что приведена самим Паулем Фогтом в его статьях и интервью(приводит грубые оценочные значения) - как минимум очень далеки от ваших цифр.

Ваша "статья" максимум тянет на блог. "Статью" в мусорку.

Также цифры (что указали) по странам много ниже цифр по конкретным городам или областям. Хотя она плавающая, а вы брали какую-то максимальную с графика.

Франция Ile-de-France текущая CFR, % 27.25  - всего лишь означает что в больных определяют де-факто только госпитализированных.

Аватар пользователя Bzz
Bzz(9 лет 2 месяца)

В статье нет утверждения о "правильном подсчете летальности". ТС предложил использовать метод для оценки эффективности учета заболевших и опасности вируса. Цифры взяты с Яндекс.Карт. Вы нашли ошибку в цифрах? Буду благодарен за усилия.

Вот Франция:

 

Аватар пользователя user3120
user3120(10 лет 4 месяца)

Есть статьи на АШ о расчете реальной летальности со ссылкой на научные данные. Поищите статьи.

Вы же с умным лицом распространяете... тупо панику.

Аватар пользователя Bzz
Bzz(9 лет 2 месяца)

Не то, чтобы с умным лицом :о))

А в поисках смысла.

Впрочем, я, пожалуй, сам нашел ошибку в своем тексте.

Аватар пользователя user3120
user3120(10 лет 4 месяца)

Дополнение к моим комментариям выше.

То что вы можете почти точно посчитать на сегодня(если статистика не занижает а она занижает иногда до двух раз) это максимальную смертность по различным городам и регионам(число смертей на 1м или 100к населения) по "фейл штатам" (когда эпидемия еще не прошла до конца) и где приняты хоть какие-то меры самоизоляции.

Летальность обычному населению пока - до лампочки тем более она разная для разных групп риска(не применима на практике чтобы узнать риски и чего бояться). Т. к. никто пока не готов положиться что она слабенькая и полностью снять карантин самоизоляцию и не использовать маски. таких дураков нет. Даже в Беларуси начали активно носить маски.

Летальность интересна с точки зрения длительных промежутков времени лет 10. Но к этому времени она может значительно снизится из-за вакцин ослабления вируса(но может и усилится), улучшенного лечения.

Оперируйте только этими цифрами. Причем для России важная российская цифра смертности (а итальянская и английская нужны для того чтобы представлять чего смогли избежать) и те что чуть выше её и ниже. А ниже многие азиатские страны(Тайланд) за исключением вероятно Индонезии.

Аватар пользователя Bzz
Bzz(9 лет 2 месяца)

Ошибку в расчетах поправил, но выводы не изменились.

Ваше замечание насчет "средней температуры по палате" каждой страны справедливо, конечно.

Однако даже столь грубая оценка все равно представляет интерес.

Летальность интересна с точки зрения длительных промежутков времени лет 10. Но к этому времени она может значительно снизится из-за вакцин ослабления вируса(но может и усилится), улучшенного лечения.

Интересно, что этот аспект на оценку по данному интервалу не повлияет.

Аватар пользователя Kosyan
Kosyan(10 лет 7 месяцев)

Надо покрутить и так и сяк.

Первым делом надо таким образом проверить несколько дней подряд (сегодня и назад) и убедиться, что проценты не скачут туда-сюда. Если скачут, то попробовать поменять период отсрочки (временной лаг), в плюс или минус. 

Аватар пользователя Bzz
Bzz(9 лет 2 месяца)

Две недели взято исходя из современных рекомендаций на самоизоляцию.

И чем ближе к "плато", тем точнее будет цифра, это понятно.

Но пока что как-то так.

 

Аватар пользователя Kosyan
Kosyan(10 лет 7 месяцев)

Ну Вы попробуйте посчитать таким же образом, на данных за вчера, за позавчера и так ещё на несколько дней назад. Буду цифры по странам стабильны, будут плавно меняться или они будут скакать. 

Аватар пользователя Bzz
Bzz(9 лет 2 месяца)

Ок, давайте попробуем...

Сместим на 3 дня назад - 07.04...21.04:

Германия: 2.76% = (4669-1810)/103375

Швейцария: 3% = (1427-765)/21657

Испания: 5.6% = (20852-13341)/136675

Италия: 5.7% = (24114-16523)/132547

Россия: 5.6% = (408-51)/ 6356

...

Британия: 21.5% = (16509-5373)/ 51608

Похоже, работает :о) Сейчас остальных досчитаю.

Аватар пользователя Bzz
Bzz(9 лет 2 месяца)

США - 8.3% = (41316-10876)/ 367385

Канада - 7.8% = (1618-323)/ 16667

Франция - 11% = (19718 -8911)/ 98010 - "ступенька" на графике: вероятно, изменение методики учета заболевших

Нидерланды - 10%  = (3751-1867)/ 18803 (Tinkle Bell, Tinkle Bell... очень похоже)

Швеция - 17% (!!!) = (1765-591)/6897 (также здесь)

Аватар пользователя Kosyan
Kosyan(10 лет 7 месяцев)

Ну вот у Вас данные сильно отличаются, по Швеции было 11, а на другие даты 17, по Британии было 16,9, стало 21.5.

Мне кажется, что это говорит (при условии, что этот метод, при такой политищации вопроса - вообще рабочий) о том, что временной лаг выбран не правильно. 

Аватар пользователя Bzz
Bzz(9 лет 2 месяца)

по Швеции было 11, а на другие даты 17, по Британии было 16,9, стало 21.5.

Не, наоборот.

Швеция: было 17 стало 13

Британия: было 21.5 стало 16.9

Чем больше тестов, тем точнее величина. А тестов делается все больше и больше.

Насчет выбора даты смысл, конечно, есть. Вот динамика смертности по Швеции как раз пролетала. Волна как есть. Но для 2 недель дельта получается по максимумам:

Возьмем 5.04...19.04:

Швеция: 18.3% = (1540-401)/6224 - близко к интервалу предыдущей оценки.

Амплитуда смертности большая. Интересный вывод можно сделать: если ее, волну эту, "перехватить"? Но перехватить без карантина никак. Либо сама постепенно.

Аватар пользователя Bzz
Bzz(9 лет 2 месяца)

Еще интервал: 3.04-17.04:

Швеция: 18.7% = (1400-358)/5568

Такой ряд получается: с интервалом в 3 дня:

18.7, 18, 17, 12.9

 

 

Аватар пользователя Kosyan
Kosyan(10 лет 7 месяцев)

Знал же, что нельзя на этих "официальных" данных ничего строить, но блин... зацепился. 

Если будут нормальные цифры по количеству зараженных и количеству умерших на каждый день, то подставляйте, балуйтесь.

Если российские данные нормальные, то, в среднем, смерть наступает через 8 дней после выявления. Только при таком лаге можно получить стабильное отношение смертей к новым случаям в прошлом.

Больше никаких других выводов из этих цифр сделать нельзя. 

Аватар пользователя Bzz
Bzz(9 лет 2 месяца)

Вот вы могучий :о) Спасибо, добрый человек.

Интересно, что 8 назывались американцами как среднее время в интенсивной терапии.

Со статистикой прикольно, конечно. Я только потом сообразил - в Германии и Швеции, например, по-недельная периодичность графика смертности... Вот как эти волны разделить. Засранцы. Может быть, сгладить недельным окном сначала. У Швеции 3 крайних дня, кстати, в этой таблице одни и те же данные.

А еще может быть различие в протоколах.

В любом случае, спасибо. Попробую посмотреть еще в течении недели.

Аватар пользователя Kosyan
Kosyan(10 лет 7 месяцев)

по-недельная периодичность графика смертности... Вот как эти волны разделить.

Можно попробовать скользящие средние. 

Аватар пользователя prot
prot(11 лет 9 месяцев)

На самом деле робкие нотки оптимизма НАКОНЕЦ пробиваются к концу недели.
1. Динамика роста выздоровлений в РФ наконец превышает прирост заболевших.
2. Прирост сметрности в РФ чуть выше чем заболевших но это не 14 а 10%, т.е. почти залезли на "плато" (пальцы крестом)
Напрягает пока лишь то, что РФ единственная объемная с двузначным приростом.
У лидеров, Слава Б-гу, приростов уже почти нет... Следующая неделя будет очень забавной.

Аватар пользователя Bzz
Bzz(9 лет 2 месяца)

Внутри страны динамика очень уж отличается, как бы регионы не "скомпенсировали"...

 

Аватар пользователя Escander
Escander(7 лет 2 месяца)

А зачем нам критерии страховщиков? Страховщикам не нужна точная оценка - им нужна оценка сверху что-бы не уйти а минус.

 

количество смертей сегодня на количество фактически инфицированных людей (включая незарегистрированные случаи) 16 дней назад, потому что в среднем 16 дней проходит между временем "заражения" и смертью.

Если нужна точная оценка, то смерти всех больных заболевших ранее ... ну пусть предложенные вами 16 суток, на количество заболевших эти самые 16 суток назад. Эта оценка будет точнее на растущем тренде. Впрочем на АШ всё это с десяток раз писал минимум.

 

Аватар пользователя Phantom2
Phantom2(5 лет 8 месяцев)

Вы затронули интересную и актуальную тему =посчитать "летальность" заболевания исходя из пока имеющихся данных=

в коментах и замечаниях к теме прослеживается отсутствие  некоторых базовых основ работы с данными.

реальные события, которые связаны с эпидемией\пандемией, слагаются как минимум из нескольких (двух и больше) составляющих :

1. закономерность связанная с протеканием болезни после инфицирования

2. случайность обращения больного человека за медицинской помощью

3. случайность выявления инфицированного человека при медицинских обследованиях

когда составляющие складываются воедино в результате получается закономерность , модулированная случайными событиями . Чем сильнее выражена закономерность , тем меньше отклонений от закономерности вызывают случайные события . В технической литературе и в учебниках для описания этого употребляют термин "флуктуация" .

даже в случае линейной зависимости какого-то реального события на реальных данных невозможно получить прямую, так как всегда будут возникать отклонения (флуктуации) .

По причинам , которые описаны чуть выше , любая измерительная аппаратура применяемая в быту или в промышленности обладает таким техническим свойством как "погрешность измерения" . В бытовых приборах погрешность измерений допускается от 5% до 10% . Другими словами ,

1. если результат отклоняется от закономерности на 5% то этот результат принадлежит закономерности

2.если результат отклоняется больше чем на 5%, то этот результат НЕПРИНАДЛЕЖИТ закономерности .

Очень важным также является КОЛИЧЕСТВО данных , на которых происходит поиск закономерности . При этом, ЧЕМ МЕНЬШЕ ДАННЫХ имеется в распоряжении ТЕМ БОЛЬШЕ отличается конечный результат отличается от закономерности .

изложенное касается не только эпидемии с короновирусом . Это упрощённо изложенные базовые основы обработки данных для промышленности, для статистики, для науки , для медицины

Вы, Bzz , абсолютно правильно подходите к тому , что

даже грубая оценка СЕЙЧАС все равно (представляет интерес) ЗНАЧИТЕЛЬНО ВАЖНЕЕ ,

чем "Летальность с точки зрения длительных промежутков времени лет 10"

после того как погибнут десятки-сотни-миллионы людей .

Но на этом пути есть также несколько не-очевидных моментов (комент ниже).

Аватар пользователя Phantom2
Phantom2(5 лет 8 месяцев)

как  =посчитать "летальность" заболевания исходя из пока имеющихся данных=
даже грубая оценка СЕЙЧАС ЗНАЧИТЕЛЬНО ВАЖНЕЕ ,
чем "Летальность с точки зрения длительных промежутков времени лет 10"

.

не-очевидные моменты заключаются в поведении людей, как больных так и мед.работников.
Медицина практически всех стран мира продемонстрировала
очень сильное влияние административного фактора на выявление и противодействие эпидемии .
С инфекцией , с вирусом первым сталкивается лечащий, семейный итд врач .
Но юридического решения о том, что это новый вирус, новое заболевание "лечащий" врач не принимает.
В тоже время, глав.врач , зав.клиникой , министр здоровья
практически во всех странах занимают позицию противодействия поступающим сообщениям .

В результате вирус распространяется, а меры административного противодействия отсутствуют.
Только тогда, когда проблему о заболевании невозможно замолчать
начинают приниматься административные меры по локализации заболевания .

В поведении людей, которые обращаются за мед.помощью, легко
различаются три большие группы
1. люди прибегают к медицинской помощи тогда, когда не-могут справиться с болезнью самостоятельно;
2. "паникёры", которые бегут к врачу "по каждому чиху";
3. "пофигисты", алкаши, бомжи, наркоши , которые в том числе могут умереть не обратившись к врачу .

вторая 2. и третья 3. группы составляют незначительную долю от общего числа населения.
Основной является первая 1. группа людей,
которая в дальнейшем будет создавать статистику летальности и смертности .
Поэтому на паникёров и пофигистов можно сделать поправку , когда станет понятна общая картина.

таким образом эпидемия или неизвестное ранее заболевание
всегда начинается с обращения к врачу людей,
которые самостоятельно не могут справиться с болезнью,
которые нуждаются в квалифицированной медицинской помощи.

с этого момента начинаем отвечать на поставленный Вами вопрос :
как  посчитать "летальность" заболевания исходя из пока имеющихся данных ?

Аватар пользователя Phantom2
Phantom2(5 лет 8 месяцев)

как  посчитать "летальность" заболевания исходя из пока имеющихся данных ?

за основу вычислений возьмем общедоступные определения :   

http://wiki/Летальность  

Летальность (от лат. letalis «смертельный») — показатель медицинской статистики,
равный отношению числа умерших от определённого заболевания
за определённый период времени
к общему числу людей, имевших тот же диагноз в рамках того же периода времени.

Если из популяции в 1000 человек заболело 300, а умерло из их числа 100 человек,
то смертность от заболевания будет составлять 10 %,
а летальность —  (100 /300) *100% =33 % .   
Если же в другой популяции из 1000 человек заболело 50 человек, а умерло 40,
то смертность будет составлять лишь 4 %,
а летальность —  (40 /50) *100% =80 % .
В первом случае от заболевания умерло больше людей,
но во втором случае заболевание оказалось более тяжёлым и опасным .

Приведённые на сайте wiki/Летальность
примеры показывают способ определения летальности .
Оба примера относятся к абстрактным случаям, когда данные заболело-умерло не изменяются .

В ситуации с короновирусом сегодня данные заболело-умерло изменяются каждый час.
возьмём например данные по Италии на утро 05.05

Italy    инфицировано -211938;    летально -29079;    выздоров. -82879;    

Если бы пандемия в Италии уже завершилась
то показатель "летальность" был бы :  (29079 /211938) *100% = ~13,7 %

Однако сегодня в число инфицированных 211938 учтены
умершие, выздоровевшие, а также инфицированные в количестве
211938 -29079 -82879 =99980 состояние здоровья которых может измениться в любую минуту .

В тоже время совершенно точно определено и
уже не будет изменяться состояние умерших и выздоровевших: 29079 +82879 =111958
Поэтому более адекватным в ежеминутно меняющейся ситуации
определять летальность :  (29079 / (29079 +82879)) *100% = ~26 %

Именно эти 26% определяют тяжесть, опасность заболевания ,
а также вероятность летального исхода для инфицированных , которые находятся на излечении .

Теперь в действие вступает административно-политический фактор :  
из двух значений выбрать, то которое выгодно политически

абсолютно глупым является комент (16:27:11 / 24-04-2020) с утверждением
"Летальность интересна с точки зрения длительных промежутков времени лет 10"

это что-то типа "ты когда умрёшь -приходи, будем тебя лечить"

Аватар пользователя Phantom2
Phantom2(5 лет 8 месяцев)

поскольку эпидемия\пандемия длящийся ,
продолжающийся в настоящий момент процесс ,

.

можно выделить даты ,
когда количество инфицированных {dat1} 
и {dat2} , когда сумма  (выздоровевшие +летально)  
окажутся примерно равными , допустим с погрешностью около 5% .

Проведённые наблюдения приведены ниже

 

 

 

показатель "летальность"