...Правильным способом было бы разделить количество смертей сегодня на количество фактически инфицированных людей (включая незарегистрированные случаи) 16 дней назад, потому что в среднем 16 дней проходит между временем "заражения" и смертью. И поэтому необходимо сравнивать общее количество погибших с общим количеством инфицированных 16 дней назад.
Этот метод называется "Kaplan Meier Estimator" и используется всеми компаниями по страхованию жизни...
Сегодня на АШ опубликовали интервью профессора Пауля Роберт Фогта (Швейцария). Текст большой, но самой интересной показалась именно эта цитата. С методом Каплана-Мейера можно познакомиться здесь.
Как резонно заметили в комментариях, на итоговую оценку катастрофически влияет та самая, "темная", неучтенная часть заболевших. Именно ради нее пытаются запустить тестирование на антитела. Но, даже при отсутствии ее учета, можно сделать интересные выводы.
Что, если попробовать посчитать "летальность" заболевания исходя из пока имеющихся данных? Рассмотрим число выживших, принимая во внимание интервал в 2 недели, начиная с 10 апреля. Воспользовавшись инфографикой, представленной на Яндекс.Картах коронавирус.онлайн (здесь доступнее архивные данные) и взяв двухнедельный интервал (10.04...24.04), можно получить вот такие цифры (по возрастанию).
Формула: d24-d10/N10
d24 -умерших на 24.04
d10 - умерших на 10.04
N10 - на общее число зараженных на 10.04
Германия - 2.3% = (5396-2607)/118235
Швейцария - 2.7% = (1427-821)/22253
Испания - 4.3% = (22157-15447)/153222
Италия - 4.7% = (25.085-18279)/143626
Россия - 5.1% = (593-79)/10141
США - 7% = (49845-16691)/468566
Канада - 7.7% = (2123-509)/20765
Франция - 7.8% = (21376-12210)/117749 - "ступенька" на графике: вероятно, изменение методики учета заболевших
Нидерланды - 7.9% = (4111-23960)/21762 (Tinkle Bell, Tinkle Bell... очень похоже)
Швеция - 12.9% (!!!) = (1580-591)/7693
Британия - 16.9% (!!!) = (18100-7097)/65077
Обновлено: Для проверки, по совету комментатора, попробуем сдвинуть интервал на 3 дня ранее (7.04...21.04):
Германия: 2.76% = (4669-1810)/103375
Швейцария: 3% = (1427-765)/21657
Испания: 5.6% = (20852-13341)/136675
Россия: 5.6% = (408-51)/ 6356
Италия: 5.7% = (24114-16523)/132547
Канада - 7.8% = (1618-323)/ 16667
США - 8.3% = (41316-10876)/ 367385
Нидерланды - 10% = (3751-1867)/ 18803 (Tinkle Bell, Tinkle Bell... очень похоже)
Франция - 11% = (19718 -8911)/ 98010 - "ступенька" на графике: вероятно, изменение методики учета заболевших
Швеция - 17% (!!!) = (1765-591)/6897 (также здесь)
Британия: 21.5% = (16509-5373)/ 51608
Не жестковато? :о)
Да, с одной стороны, в знаменателе сегодня точно ужасный недоучет, а в числителе возможны манипуляции с "пере"учетом... Однако национальный характер в подходе к учету эпидемии налицо.
И еще.
Получается, что вопрос "переоцененности" эпидемии может иметь основания не раньше, чем будет мало-мальски достоверная оценка неучтенных заболевших. А тем, кто ранее требовал убрать из статистики "спорно" учтенных бессимптомных, стоит хорошенько подумать - это действительно то, чего вы хотели? Какую тогда летальность получите?
Замечания об ошибках, включая аргументы о неприменимости метода для подобной оценки "в принципе" - приветствуются.
Пока дискутировал, сам нашел причину адских цифр - сейчас пересчитаю.
Редактор, пожалуйста, снимите с пульса или в Ахтунг.
Mea maxima culpa.
Пересчитал. Оценки, несмотря на грубый характер и "среднюю по палате", все равно очень интересные. Выводы устояли :о)
Комментарии
Дискуссионный комментарий, выросший в заметку.
Замечания об ошибках, включая аргументы о неприменимости метода для подобной оценки "в принципе" - приветствуются.
Во всяком случае методика логичная.
Но показатели будут зависеть от уровня тестирования.
Чем выше уровень тестирования, тем больше выловили заболевших, а значит летальность ниже.
Реальное сравнение можно будет сделать по итогам эпидемии. Тогда можно будет сравнить смертность. Это будут более точные данные. Хотя и здесь можно со статистикой нахимичить.
Вот когда "снег сойдёт, тогда и посмотрим, кто и сколько гадил".
Именно.
Несколько досадно, что нельзя разделить эффективность противоэпидемических мер и затраты на выявление. Но оценить "комулятивный" эффект тоже интересно.
Мы истину хотим узнать, или красивые цифры нарисовать?
Так и на здоровье.
Намек был как раз на то, что требовали-то как раз люди, которые придерживаются точки зрения о "фейковости" эпидемии. С уменьшением знаменателя (если следовать их предложениям), летальность как раз растет. Что свидетельствует о большей опасности заразы.
Если нет статистики о "фактически инфицированных людей" - не можете правильно считать летальность как не могут и на соотв сайтах. У них не летальность а справочная цифра отношения смертей к числу кейсов.
Те летальности что подсчитаны(до 0,4%) и та что приведена самим Паулем Фогтом в его статьях и интервью(приводит грубые оценочные значения) - как минимум очень далеки от ваших цифр.
Ваша "статья" максимум тянет на блог. "Статью" в мусорку.
Также цифры (что указали) по странам много ниже цифр по конкретным городам или областям. Хотя она плавающая, а вы брали какую-то максимальную с графика.
Франция Ile-de-France текущая CFR, % 27.25 - всего лишь означает что в больных определяют де-факто только госпитализированных.
В статье нет утверждения о "правильном подсчете летальности". ТС предложил использовать метод для оценки эффективности учета заболевших и опасности вируса. Цифры взяты с Яндекс.Карт. Вы нашли ошибку в цифрах? Буду благодарен за усилия.
Вот Франция:
Есть статьи на АШ о расчете реальной летальности со ссылкой на научные данные. Поищите статьи.
Вы же с умным лицом распространяете... тупо панику.
Не то, чтобы с умным лицом :о))
А в поисках смысла.
Впрочем, я, пожалуй, сам нашел ошибку в своем тексте.
Дополнение к моим комментариям выше.
То что вы можете почти точно посчитать на сегодня(если статистика не занижает а она занижает иногда до двух раз) это максимальную смертность по различным городам и регионам(число смертей на 1м или 100к населения) по "фейл штатам" (когда эпидемия еще не прошла до конца) и где приняты хоть какие-то меры самоизоляции.
Летальность обычному населению пока - до лампочки тем более она разная для разных групп риска(не применима на практике чтобы узнать риски и чего бояться). Т. к. никто пока не готов положиться что она слабенькая и полностью снять карантин самоизоляцию и не использовать маски. таких дураков нет. Даже в Беларуси начали активно носить маски.
Летальность интересна с точки зрения длительных промежутков времени лет 10. Но к этому времени она может значительно снизится из-за вакцин ослабления вируса(но может и усилится), улучшенного лечения.
Оперируйте только этими цифрами. Причем для России важная российская цифра смертности (а итальянская и английская нужны для того чтобы представлять чего смогли избежать) и те что чуть выше её и ниже. А ниже многие азиатские страны(Тайланд) за исключением вероятно Индонезии.
Ошибку в расчетах поправил, но выводы не изменились.
Ваше замечание насчет "средней температуры по палате" каждой страны справедливо, конечно.
Однако даже столь грубая оценка все равно представляет интерес.
Интересно, что этот аспект на оценку по данному интервалу не повлияет.
Надо покрутить и так и сяк.
Первым делом надо таким образом проверить несколько дней подряд (сегодня и назад) и убедиться, что проценты не скачут туда-сюда. Если скачут, то попробовать поменять период отсрочки (временной лаг), в плюс или минус.
Две недели взято исходя из современных рекомендаций на самоизоляцию.
И чем ближе к "плато", тем точнее будет цифра, это понятно.
Но пока что как-то так.
Ну Вы попробуйте посчитать таким же образом, на данных за вчера, за позавчера и так ещё на несколько дней назад. Буду цифры по странам стабильны, будут плавно меняться или они будут скакать.
Ок, давайте попробуем...
Сместим на 3 дня назад - 07.04...21.04:
Германия: 2.76% = (4669-1810)/103375
Швейцария: 3% = (1427-765)/21657
Испания: 5.6% = (20852-13341)/136675
Италия: 5.7% = (24114-16523)/132547
Россия: 5.6% = (408-51)/ 6356
...
Британия: 21.5% = (16509-5373)/ 51608
Похоже, работает :о) Сейчас остальных досчитаю.
США - 8.3% = (41316-10876)/ 367385
Канада - 7.8% = (1618-323)/ 16667
Франция - 11% = (19718 -8911)/ 98010 - "ступенька" на графике: вероятно, изменение методики учета заболевших
Нидерланды - 10% = (3751-1867)/ 18803 (Tinkle Bell, Tinkle Bell... очень похоже)
Швеция - 17% (!!!) = (1765-591)/6897 (также здесь)
Ну вот у Вас данные сильно отличаются, по Швеции было 11, а на другие даты 17, по Британии было 16,9, стало 21.5.
Мне кажется, что это говорит (при условии, что этот метод, при такой политищации вопроса - вообще рабочий) о том, что временной лаг выбран не правильно.
Не, наоборот.
Швеция: было 17 стало 13
Британия: было 21.5 стало 16.9
Чем больше тестов, тем точнее величина. А тестов делается все больше и больше.
Насчет выбора даты смысл, конечно, есть. Вот динамика смертности по Швеции как раз пролетала. Волна как есть. Но для 2 недель дельта получается по максимумам:
Возьмем 5.04...19.04:
Швеция: 18.3% = (1540-401)/6224 - близко к интервалу предыдущей оценки.
Амплитуда смертности большая. Интересный вывод можно сделать: если ее, волну эту, "перехватить"? Но перехватить без карантина никак. Либо сама постепенно.
Еще интервал: 3.04-17.04:
Швеция: 18.7% = (1400-358)/5568
Такой ряд получается: с интервалом в 3 дня:
18.7, 18, 17, 12.9
Знал же, что нельзя на этих "официальных" данных ничего строить, но блин... зацепился.
Если будут нормальные цифры по количеству зараженных и количеству умерших на каждый день, то подставляйте, балуйтесь.
Если российские данные нормальные, то, в среднем, смерть наступает через 8 дней после выявления. Только при таком лаге можно получить стабильное отношение смертей к новым случаям в прошлом.
Больше никаких других выводов из этих цифр сделать нельзя.
Вот вы могучий :о) Спасибо, добрый человек.
Интересно, что 8 назывались американцами как среднее время в интенсивной терапии.
Со статистикой прикольно, конечно. Я только потом сообразил - в Германии и Швеции, например, по-недельная периодичность графика смертности... Вот как эти волны разделить. Засранцы. Может быть, сгладить недельным окном сначала. У Швеции 3 крайних дня, кстати, в этой таблице одни и те же данные.
А еще может быть различие в протоколах.
В любом случае, спасибо. Попробую посмотреть еще в течении недели.
Можно попробовать скользящие средние.
На самом деле робкие нотки оптимизма НАКОНЕЦ пробиваются к концу недели.
1. Динамика роста выздоровлений в РФ наконец превышает прирост заболевших.
2. Прирост сметрности в РФ чуть выше чем заболевших но это не 14 а 10%, т.е. почти залезли на "плато" (пальцы крестом)
Напрягает пока лишь то, что РФ единственная объемная с двузначным приростом.
У лидеров, Слава Б-гу, приростов уже почти нет... Следующая неделя будет очень забавной.
Внутри страны динамика очень уж отличается, как бы регионы не "скомпенсировали"...
А зачем нам критерии страховщиков? Страховщикам не нужна точная оценка - им нужна оценка сверху что-бы не уйти а минус.
количество смертей сегодня на количество фактически инфицированных людей (включая незарегистрированные случаи) 16 дней назад, потому что в среднем 16 дней проходит между временем "заражения" и смертью.
Если нужна точная оценка, то смерти всех больных заболевших ранее ... ну пусть предложенные вами 16 суток, на количество заболевших эти самые 16 суток назад. Эта оценка будет точнее на растущем тренде. Впрочем на АШ всё это с десяток раз писал минимум.
Вы затронули интересную и актуальную тему =посчитать "летальность" заболевания исходя из пока имеющихся данных=
в коментах и замечаниях к теме прослеживается отсутствие некоторых базовых основ работы с данными.
реальные события, которые связаны с эпидемией\пандемией, слагаются как минимум из нескольких (двух и больше) составляющих :
1. закономерность связанная с протеканием болезни после инфицирования
2. случайность обращения больного человека за медицинской помощью
3. случайность выявления инфицированного человека при медицинских обследованиях
когда составляющие складываются воедино в результате получается закономерность , модулированная случайными событиями . Чем сильнее выражена закономерность , тем меньше отклонений от закономерности вызывают случайные события . В технической литературе и в учебниках для описания этого употребляют термин "флуктуация" .
даже в случае линейной зависимости какого-то реального события на реальных данных невозможно получить прямую, так как всегда будут возникать отклонения (флуктуации) .
По причинам , которые описаны чуть выше , любая измерительная аппаратура применяемая в быту или в промышленности обладает таким техническим свойством как "погрешность измерения" . В бытовых приборах погрешность измерений допускается от 5% до 10% . Другими словами ,
1. если результат отклоняется от закономерности на 5% то этот результат принадлежит закономерности
2.если результат отклоняется больше чем на 5%, то этот результат НЕПРИНАДЛЕЖИТ закономерности .
Очень важным также является КОЛИЧЕСТВО данных , на которых происходит поиск закономерности . При этом, ЧЕМ МЕНЬШЕ ДАННЫХ имеется в распоряжении ТЕМ БОЛЬШЕ отличается конечный результат отличается от закономерности .
изложенное касается не только эпидемии с короновирусом . Это упрощённо изложенные базовые основы обработки данных для промышленности, для статистики, для науки , для медицины
Вы, Bzz , абсолютно правильно подходите к тому , что
даже грубая оценка СЕЙЧАС все равно (представляет интерес) ЗНАЧИТЕЛЬНО ВАЖНЕЕ ,
чем "Летальность с точки зрения длительных промежутков времени лет 10"
после того как погибнут десятки-сотни-миллионы людей .
Но на этом пути есть также несколько не-очевидных моментов (комент ниже).
как =посчитать "летальность" заболевания исходя из пока имеющихся данных=
даже грубая оценка СЕЙЧАС ЗНАЧИТЕЛЬНО ВАЖНЕЕ ,
чем "Летальность с точки зрения длительных промежутков времени лет 10"
.
не-очевидные моменты заключаются в поведении людей, как больных так и мед.работников.
Медицина практически всех стран мира продемонстрировала
очень сильное влияние административного фактора на выявление и противодействие эпидемии .
С инфекцией , с вирусом первым сталкивается лечащий, семейный итд врач .
Но юридического решения о том, что это новый вирус, новое заболевание "лечащий" врач не принимает.
В тоже время, глав.врач , зав.клиникой , министр здоровья
практически во всех странах занимают позицию противодействия поступающим сообщениям .
В результате вирус распространяется, а меры административного противодействия отсутствуют.
Только тогда, когда проблему о заболевании невозможно замолчать
начинают приниматься административные меры по локализации заболевания .
В поведении людей, которые обращаются за мед.помощью, легко
различаются три большие группы
1. люди прибегают к медицинской помощи тогда, когда не-могут справиться с болезнью самостоятельно;
2. "паникёры", которые бегут к врачу "по каждому чиху";
3. "пофигисты", алкаши, бомжи, наркоши , которые в том числе могут умереть не обратившись к врачу .
вторая 2. и третья 3. группы составляют незначительную долю от общего числа населения.
Основной является первая 1. группа людей,
которая в дальнейшем будет создавать статистику летальности и смертности .
Поэтому на паникёров и пофигистов можно сделать поправку , когда станет понятна общая картина.
таким образом эпидемия или неизвестное ранее заболевание
всегда начинается с обращения к врачу людей,
которые самостоятельно не могут справиться с болезнью,
которые нуждаются в квалифицированной медицинской помощи.
с этого момента начинаем отвечать на поставленный Вами вопрос :
как посчитать "летальность" заболевания исходя из пока имеющихся данных ?
как посчитать "летальность" заболевания исходя из пока имеющихся данных ?
за основу вычислений возьмем общедоступные определения :
http://wiki/Летальность
Летальность (от лат. letalis «смертельный») — показатель медицинской статистики,
равный отношению числа умерших от определённого заболевания
за определённый период времени
к общему числу людей, имевших тот же диагноз в рамках того же периода времени.
Если из популяции в 1000 человек заболело 300, а умерло из их числа 100 человек,
то смертность от заболевания будет составлять 10 %,
а летальность — (100 /300) *100% =33 % .
Если же в другой популяции из 1000 человек заболело 50 человек, а умерло 40,
то смертность будет составлять лишь 4 %,
а летальность — (40 /50) *100% =80 % .
В первом случае от заболевания умерло больше людей,
но во втором случае заболевание оказалось более тяжёлым и опасным .
Приведённые на сайте wiki/Летальность
примеры показывают способ определения летальности .
Оба примера относятся к абстрактным случаям, когда данные заболело-умерло не изменяются .
В ситуации с короновирусом сегодня данные заболело-умерло изменяются каждый час.
возьмём например данные по Италии на утро 05.05
Italy инфицировано -211938; летально -29079; выздоров. -82879;
Если бы пандемия в Италии уже завершилась
то показатель "летальность" был бы : (29079 /211938) *100% = ~13,7 %
Однако сегодня в число инфицированных 211938 учтены
умершие, выздоровевшие, а также инфицированные в количестве
211938 -29079 -82879 =99980 состояние здоровья которых может измениться в любую минуту .
В тоже время совершенно точно определено и
уже не будет изменяться состояние умерших и выздоровевших: 29079 +82879 =111958
Поэтому более адекватным в ежеминутно меняющейся ситуации
определять летальность : (29079 / (29079 +82879)) *100% = ~26 %
Именно эти 26% определяют тяжесть, опасность заболевания ,
а также вероятность летального исхода для инфицированных , которые находятся на излечении .
Теперь в действие вступает административно-политический фактор :
из двух значений выбрать, то которое выгодно политически
абсолютно глупым является комент (16:27:11 / 24-04-2020) с утверждением
"Летальность интересна с точки зрения длительных промежутков времени лет 10"
это что-то типа "ты когда умрёшь -приходи, будем тебя лечить"
поскольку эпидемия\пандемия длящийся ,
продолжающийся в настоящий момент процесс ,
.
можно выделить даты ,
когда количество инфицированных {dat1}
и {dat2} , когда сумма (выздоровевшие +летально)
окажутся примерно равными , допустим с погрешностью около 5% .
Проведённые наблюдения приведены ниже