Взял данные https://www.worldometers.info/coronavirus/ от 9 апр 2020
Удалил строки с неполными данными
Удалил данные, где Total Cases < 2500
Рассчитал две колонки Total Cases / Total Tests (зараженность) и Total Deaths / Total Cases (смертность) в процентах
Построил график (на рисунке)
Характер графика понятен – чем больше зараженность, тем выше смертность.
Но расположение стран вызывает вопросы.
Дмитрий Петров и ephor обнаружили ошибку в моих расчетах. Спасибо!
При переносе в Excel пропали нули, я пропустил. Мои извинения сообществу!
Публикую исправленную версию (изменения коснулись Ирана и Франции). По крайней мере, одна загадка разрешилась.
Комментарии
Все же хватает комментария, мы не телепаты ведь, и ваши мысли угадывать не можем.
Мысли есть, но аргументов маловато у меня. Надеюсь сообщество АШ выскажет свое мнение.
С-З квадрант этой диаграммы - это те страны, у кого не хватает тестов? А заодно и что-то не то с качеством этих тестов? Впрочем, стыдно давать тут какие-то оценки. Не понимаю в этой системе ни фига.
P.S.
Наверное, умничать должны люди, которые понимают не только в эпидемиологии "да я еще с лихорадкой Денге боролся", но разбирающиеся в различиях систем учета этих стран.
Ну вот реально, нужен нам на АШ представитель ВОЗ с большим стажем. Допустим, знакомый мой отработал 15 лет в МАГАТЭ, ездил с инспекциями всякими по планете. Какой-то такой нужен человек.
График построен в предположении качественных данных. Одна только эта публикация https://aftershock.news/?q=node/853804 перечеркивает смысл использования таких данных. Но других-то нет! И никакой спец не поможет.
Главная последовательность очевидна. Значительные отклонения могут быть связаны только с мухлежом (особенностями) национальных статистик.
Чем больше тестов на одного подтвержденного, тем больше попадает в статистику подтвержденных больных легких случаев, тем меньше смертность на одного подтвержденного больного.
Количество тестов на одного подтвержденного характеризует не зараженность популяции. Тестируют не случайные выборки граждан, а тестируют подозрительные симптомы и контактеров. Это характеризует степень тщательности выявления заболевших, а не средние числа заболевших впопуляции. То есть, чем больше тестов на один подтвержденный случай, тем выше соотношение (выявленные больные КОВИД19)/(все больные КОВИД19)
Ну и наша группа - это ОАЭ, Австралия, Россия. (чем я кстати, уже устал писать)
Так и есть. Поэтому на графике я оставил названия колонок. В тексте хотелось бы дать "физический " смысл этих данных. Если у Вас есть более корректное название, с удовольствием заменю.
Да все правильно.
Ось Х - процент подтвержденных среди подозрительных (протестированных)
Ось У - Процент умерших среди подтвержденных
Ничего лучше я придумать не смог.
Спасибо! Если буду готовить следующую версию рисунка, использую Ваше предложение
А у меня не вызывает вопросов.
Можете пояснить, например, почему во Франции при высоком заражении низкая смертность?
Потому, что у вас в данных по ней явная ошибка. 118785 выявленных заражённых, 12228 смертей.
Исправил. Спасибо!
А где Китай?
Китай вынужден удалить, так как в исходных данных нет числа тестов
Что за страна UAE? Украина чтоли?
ОАЭ
ОАЭ. Эмираты
ОАЭ
Может это футболисты? Ну, типа... UEFA ))))
У России как вижу лучшие показатели. Но то у России в целом, это как средняя температура по больнице. У нас в Москве более 2/3 случаев, а населения в Москве явно меньше 2/3. Потому брать Россию в целом - это гонять порожняк. У нас в разных регионах очень разная ситуация. Не исключаю, что в других странах так же, но тем не менее.
Москва - транспортный хаб. В каждой стране есть такой. Рассматривать случаи по отдельным населенным пунктам, наверное, более правильно, но нет доступных данных для анализа. То, что получилось у меня, странно, согласен.
Да, к сожалению Москва - транспортный хаб, потому вчера в городе Саров (закрытый город ядерщиков, Нижегородская область) обнаружен первый инфицированный - пенсионер, ехал из санатория в Саров через Москву, ну и привез заразу в город, куда въезд только по пропускам. Казалось бы, уж в Сарове вирус должен появится в самую последнюю очередь. Аннет, достаточно неудачно через Москву транзитом проехаться. Да и вообще по всем регионам страны много случаев привезенных из Москвы.
Не то слово. % 80 - Москва. Из нее вся гниль ползет. Чем ближе к ней, тем чаще лидеры по распространению.
Может, стоило в карантин ставить Москву, отдельно. Либо прибывших сажать ВСЕХ. А страну, можно вообще не трогать, предположу. Все это, теперь "если бы".
Я начал эту тему, опираясь на известные данные. Надеюсь, все участники дискуссии так же будут подтверждать свое мнение данными и источниками. Заранее благодарю.
Это смрадное дыхание мегаполиса))
Немножко не так. Вся гниль через Москву пробирается в свои региончики, заражая при этом москвичей.
Нехер им ездить таким путем. Пусть окольными добираются. Пешочком в свои Задрищенски.
Тут же на соседней ветке Собянина клянут за насилие. Над...
Если считать отношение смертей к выявленным заражённым, то по Москве 0.64%, по России, в-целом - 0.79% . Т.ч. Москва статистику по летальности не портит. Статистики по количеству тестов с разбивкой по регионам - не видел.
Для многих стран ситуация схожая. В Италии основные события на севере. И на севере преимущественно в Ломбардии. В США вклад Нью-Йорка значительный. В Китае - Ухань.
С Францией ошибка? 117 749/12 220 Они вроде как тоже в лидерах
https://coronavirus-monitor.info/country/france/
Дмитрий, спасибо! Действительно, при копировании в Excel пропали нули, а я это пропустил. К сожалению, это не единственная ошибка. Мне надо немного времени, чтобы перепроверить все данные.
Есть один нюанс с этим сайтом, на котором я крупно облажался. Надо брать данные за вчерашний день - они фиксированы. А текущие данные - постоянно меняются, если Россия выдаёт данные 1 раз в сутки, то другие страны обновляют по несколько раз в день. Поэтому суточные данные (новые смерти и новые зараженные) - полная туфта. Да и суммарные данные, тоже, - искажены, пускай и незначительно, в основном.
Данные взял вчера вечером. Сегодня они немного другие, но пока резких изменений нет.
Низкое соотношение заражений/тест для России, может быть связано с тем, что некоторые чиновники ежедневно проверяются сразу в нескольких лабораториях. Это не плохо, но может исказить показатели, при большом числе таких чиновников.
Действительно, очень много факторов: и качество тестов, и их количество, и диагностика (вроде, решили диагностировать без анализов, только по симптомам). Китай вообще не приводит общзее количество тестов. Так что пользуемся теми данными, которые есть.
Показатель "количество выполненных тестов" вообще несоизмерим в разных системах здравоохранения. Так, у нас для постановки диагноза ковид делают 2-3 теста. По мере течения заболевания делают несколько тестов и т.п. Так что стоит его рассматривать, скорее, как качественный показатель (мало/средне/много).
гетероскедастичность будет
берите логарифмы, она уменьшится. К тому же регрессионный коэфициент имеет смысл эластичности
Для меня было удивительным, как группируются страны на таком графике. То. что Испания и Португалия так отличаются, вроде нашло объяснение. Но почему такой разброс других стран ЕС? Почему США оказались в такой странной компании?
См. личку
Ответил. Ваше письмо в личку было бы интересным всем. Не хотите вынести в обсуждение?
Да, можно. Попробую сейчас отдельным постом сделать
Под диагональю - вопросы снялись.
Над диагональю:
- Италия - прощелкали начало эпидемии, соотв. на начальном этапе и на пике не было достаточного тестирования - мы все это наблюдали в новостях.
- Швеция - вроде как вообще не вводила ни карантин, ни какого-то особенного ограничения, вполне вероятно и массового тестирования потенциальных и контактных не проводились.
- Англия и Голландия - точного объяснения нет, но на мой взгляд - тоже как и в Италии - прощелкали начало и ввели карантины и массовое тестирование уже после резкого роста, помнится Боря Джонсон что-то там вообще говорил что вирус не страшный и т.п., за что его потом публично драли...
Это хорошее объяснение. А почему рядом Израиль, Чили, Пакистан, Люксембург?
Почему страны ЕС не группируются?
Эти вопросы скорее к самому себе и своей картинке..
"Почему страны ЕС не группируются?" - вы что новости не читаете? Они там крысятничают сами у своих маски и аппараты ИВЛ, в каждой стране ЕС свои мед. нормы и законы.
ЕС - это не одна страна, а куча крыс и пауков расположенных на соседних территориях. Гражданку TinkleBell почитайте, у неё много и доступно про разичие здравоохранения внутри ЕС.
"А почему рядом Израиль, Чили, Пакистан, Люксембург?" Там все в нижнем блоке в одной куче, флуктуации никто не отменял.
В ЕС не было границ: свободное перемещение капитала, товаров, рабочей силы и вирусов.
Перспективный чат детектед! Сим повелеваю - внести запись в реестр самых обсуждаемых за последние 4 часа.
к сожалению исходные данные "грязные" и ничего толкового, кроме как группировки по схожим результатам это не дает (что скорее всего говорит о схожих методиках публикации данных). Было бы полезно увидеть динамику по странам по показателям:
Но я таких данных нигде не нашел.
За неимением гербовой бумаги пишут на простой.
Кром того, мне хотелось проверить географическую гипотезу, но она не подтвердилась.
Не совсем понятно:
Total Cases / Total Tests = 30 - это 30 обнаруженных случаев на один тест (такого быть не может)? Или 30% тестов положительные?
Может, вы имели в виду Total Tests / Total Cases ?
Кстати, а откуда Worldometer берёт данные по количеству проведённых тестов? Вот по Ю.Корее Worldometer врал:
30% тестов положительные
Страницы