S0mbre: Black [O]lives Matter: раса, криминал и огонь на поражение в США. Часть 1. Часть 2. Часть 3

Аватар пользователя Олежа

По рекомендации одного хорошего и хорошо известного на АШ автора, публикую статьи с Хабра автора S0mbre (Искандер Шафиков). Статьи уважаемого S0mbre имеют сильный уклон на работу с данными при помощи языка программирования питон. Данные и их интерпретация интересные, но программирование для АШ это неформат, поэтому то, что касается кода и манипуляций данными при его помощи, буду приводить в спойлерах.

В питоне отступы значащие, а движок сайта не позволяет структурировать текст как того требует язык. Поэтому код, приводимый в тексте, может поломаться. Если интересует именно он, качайте исходники. У нас тут нет специальных блоков для кода, буду выделять его как цитаты.).

Данной статье пол-года, поэтому устареть она не успела, хотя страсти по BLM и приутихли.

Сама оригинальная статья выходила в трёх частях. Здесь собраны все три. 

Часть 1.

 
Дискреймер

Во времена Советского Союза нашим с вами, уважаемые читатели, папам и мамам, дедушкам и бабушкам неустанно и отовсюду напоминали о том, как "империалисты" притесняли и угнетали представителей иных рас, как уже после отмены крепостного права в Российской Империи американские капиталисты продолжали использовать рабский труд африканцев и их потомков, как и в нынешнем (на то время) двадцатом веке издевательства не прекращаются даже после формального упразднения рабства, выражаясь в самых возмутительных формах апартеида, унижений, расизма и ненависти... Классические романы вроде "Хижины дяди Тома" Гарриет Бичер-Стоу и "Убить пересмешника" Харпер Ли еще сильнее упрочняли негодование борцов за свободу по всему миру. Да, расизм со стороны белых процветал в США до 1960-х - 1970-х. Но и, конечно, эти притеснения были отличным подспорьем для социалистической пропаганды, не щадящей красок в живописании "зверств акул капитализма". С середины 1950-х в США началось сильное движение за борьбу с расовым неравенством, которое было в итоге поддержано властями и кардинально изменило ситуацию с социальными свободами к 1980-м. Обо всем этом можно прочитать хотя бы в Википедии. А что теперь?..

Иллюстрация к роману Г. Бичер-Стоу "Хижина дяди Тома". "Классическое" изображение рабского труда африканцев.

Почти все то же, что наши родичи читали со страниц "Правды" в 1960-х, сейчас мы слышим со всех американских СМИ. Расовая несправедливость! Насилие со стороны полиции и иных слуг закона! Как мы все видели, после гибели Джорджа Флойда в США начались массовые протесты, перешедшие местами в беспорядки и погромы под лозунгом Black Lives Matter. Итог официально озвучиваемого и поддерживаемого общественного мнения в США на сегодняшний день: полиция убивает чернокожих по причине массового расизма со стороны белых.

Цели исследования

Как и многим из вас (я уверен), мне часто хочется самостоятельно разобраться в каком-то вопросе, особенно если:

  • вопрос широко обсуждается и составляет предмет споров

  • освещение почти во всех СМИ носит явно окрашенный характер (т.е. налицо пропаганда той или иной позиции)

  • есть достаточное количество исходных данных, доступных для изучения

Интересно заметить, что эти три пункта связаны между собой: 1) злободневные вопросы почти всегда однобоко освещаются прессой, так как истинно свободной прессы почти нет (да и была ли когда-то?) 2) злободневные темы порождают сообщества активистов, которые начинают собирать и анализировать данные в поддержку своей точки зрения (или во имя справедливости); также данные начинают открывать / предоставлять публике официальные источники (чтобы их нельзя было обвинить в сокрытии оных). Об имеющихся данных поговорим чуть позже, а пока - цели исследования.

Я хотел для себя ответить на несколько вопросов:

  1. Какова статистика применения поражающего огня полицейскими против черных и белых в абсолютном выражении (т.е. количество случаев) и в удельном выражении (на количество представителей обеих рас)? Можно ли сказать, что полицейские убивают черных чаще, чем белых?
  2. Какова статистика совершения преступлений представителями обеих рас (в абсолютном и удельном выражениях)? Представители какой расы статистически чаще совершают преступления?
  3. Имеется ли взаимосвязь между статистикой совершения преступлений и статистикой гибели от рук полиции (в целом по США, а также отдельно для белых и черных)? Можно ли сказать, что полиция стреляет насмерть пропорционально количеству совершаемых преступлений?
  4. Каким образом найденные закономерности (по пунктам 1-3) распределены между отдельными штатами США?

На данный момент это все вопросы, однако, я не исключаю, что могут добавиться и другие в процессе исследования, которое пока выполнено лишь на самом поверхностном уровне.

Оговорки и допущения

Вы ведь прочитали дисклеймер в начале статьи? :) Кроме того, что там написано, вот еще несколько допущений и оговорок, принятых для исследования в основном в целях упрощения:

  • Исследование касается только США и не распространяется на другие страны.

  • Представителей чернокожей расы в США для краткости я могу называть "черными", а представителей белокожей расы - "белыми"; эти краткие наименования не отражают какого-то неуважения, а приняты именно для лаконичности.

  • Представители белокожей расы ("белые") включают латиноамериканцев (проживающих на территории США), но исключают представителей азиатских рас, американских индейцев, гавайцев, эскимосов и представителей смешанных рас, в соответствии с данными по населению в Википедии, взятыми из официальной переписи населения в США. Поскольку много комментариев к статье говорят о неправильности такого объединения, еще раз подчеркну: это объединение есть вынужденная мера, поскольку данные о преступности не делают такого разделения (выделяя расы строго по расовому, а не по этническому признаку).

  • Для настоящего исследования взяты только белая и черная расы; представители иных рас, а также те, чья раса не указана в источниках, не включены в исследование. Это ограничение сделано для упрощения, основываясь на том, что эти две категории составляют совместно более 80% всего населения США. При этом я не исключаю, что на будущих этапах будут добавлены и остальные расовые категории для полной картины.

Источники данных

Теперь поговорим о том, какие данные используются для исследования. Исходя из обозначенных целей нам нужны данные по:

  • совершенным преступлениям с указанием расовой принадлежности, видов преступления и штатов

  • гибели от рук полиции с указанием расовой принадлежности погибших и места события (штата)

  • численности населения по годам с указанием расовой принадлежности (для вычисления удельных показателей)

Для данных по преступлениям использовалась открытая база данных ФБР Crime Data Explorer, обладающая расширенным API и содержащая детальные данные по преступлениям, арестам, жертвам преступлений в США с 1991 по 2018 год.

Для данных по гибели от рук полиции использовалась открытая база данных на сайте Fatal Encounters, поддерживаемая сообществом. На настоящий момент база (доступная для скачивания) содержит более 28 тысяч записей начиная с 2000 года с подробной информацией о каждом погибшем, кратким описанием события, ссылками на СМИ, местом события и т.д. В Интернете есть и другие базы данных с тем же назначением, например, на сайте MappingPoliceViolence (около 8400 записей с 2013 г.) или БД Washington Post (ок. 5600 записей с 2015 г.). Но БД Fatal Encounters (FENC) на текущий момент самая подробная и имеет самый длинный период наблюдений (20 лет), поэтому я использовал ее. Кстати сказать, официальные источники (ФБР) также обещают открыть базу данных применения силы службами порядка, но это наступит только когда наберется представительная выборка данных. Прочитать об этой будущей официальной базе можно по ссылке.

Наконец, данные по общей численности представителей различных рас взяты из Википедии, которая в свою очередь, берет эти данные из официальных источников - Бюро переписи населения США. К сожалению, данные доступны только за промежуток с 2010 по 2018 год. В связи с этим в рамках данного исследования пришлось: 1) ограничить конечную точку наблюдений 2018 годом; 2) для промежутка с 2000 по 2009 год использовать данные по численности населения, смоделированные при помощи простой линейной регрессии (что вполне оправдано учитывая линейную природу прироста населения). Таким образом, мы будем исследовать все данные за период с 2000 г. (начальная точка в БД FENC) по 2018 г. (конечная точка в данных по численности населения). Все результаты будут основаны на наблюдениях за эти 18 лет.

 
Подготовка данных

Часть 2.

В первой части статьи я описал предпосылки для исследования, его цели, допущения, исходные данные и инструменты. Сейчас можно без дальнейших разглагольствований сказать гагаринское...

Поехали!

Импортируем библиотеки и определяем путь к директории со всеми файлами:

 
 Код

Гибель от рук закона

 
Начнем с анализа данных по жертвам полиции.

Промежуточный вывод:

В количественном (абсолютном) выражении белых жертв больше, чем черных.

Разница между этими данными составляет в среднем 2.4 раза. Напрашивается справедливое заключение о том, что это связано с разницей в численности белых и черных. Что же, давайте посмотрим теперь на удельные показатели.

 
Подгрузим данные по численности населения (по расам):

Также выведем основную статистику по этим данным:

 
Код

 

White_promln

Black_promln

count (количество)

19.000000

19.000000

mean (среднее арифм.)

2.336123

5.872145

std (станд. отклонение)

0.615133

1.133677

min (мин. значение)

1.330247

4.179559

25%

1.946485

4.890977

50%

2.091501

5.786171

75%

2.991827

6.558062

max (макс. значение)

3.281493

7.765653

Промежуточные выводы:

1. В среднем от рук полиции погибает 5.9 на 1 млн. черных и 2.3 на 1 млн. белых (черных в 2.6 раз больше).

2. Разброс (отклонение) в данных по черным жертвам в 1.8 раз выше, чем в данных по белым жертвам. (На графике видно, что кривая по белым жертвам гораздо более плавная, без резких скачков.)

3. Максимальное количество жертв среди черных - в 2013 г. (7.7 на миллион); максимальное количество жертв среди белых - в 2018 г. (3.3 на миллион).

4. Жертвы среди белых монотонно растут (в среднем на 0.1 - 0.2 в год), в то время как жертвы среди черных вернулись на уровень 2009 г. после пика в 2011 - 2013 гг.

Итак, на первый поставленный вопрос мы ответили:

- Можно ли сказать, что полицейские убивают черных чаще, чем белых?

- Да, это верный вывод. От рук закона черных гибнет в среднем в 2.6 раз больше, чем белых.

Держа в голове эти промежуточные выводы, идем дальше - посмотрим данные по преступлениям, чтобы понять, как они соотносятся с расовой принадлежностью и жертвами от рук стражей закона.

Данные по преступлениям

 
Загружаем наш CSV по преступлениям:

Итак, видим, что:

  • В количественном отношении нападения, наркотики, воровство и "все преступления" сильно превалируют над преступлениями, связанными с убийством, оружием и сексом

  • В абсолютных значениях белые совершают больше преступлений, чем черные (ровно в 2 раза для категории "все преступления")

Опять понимаем, что без информации о численности никакие выводы о "криминальности" рас не сделаешь. Соответственно, посмотрим на удельные показатели:

 
Код
 

 

White_promln

Black_promln

Offense

 

 

All Offenses

194522.307758

574905.952459

Assault Offenses

54513.398833

192454.602875

Drugs Narcotic Offenses

41845.758869

88575.523095

Larceny Theft Offenses

41697.303725

108189.184125

Murder And Nonnegligent Manslaughter

125.943007

1016.403706

Sex Offenses

3633.777035

8225.144985

Weapon Law Violation

3612.671402

17389.163849

И на графике:

 
Код

Здесь уже совсем иная картина. По всем видам преступлений (из анализируемых) черные совершают больше, чем белые. По категории "все преступления" эта разница составляет почти 3 раза.

Давайте теперь оставим только категорию "все преступления" (All Offenses) как наиболее представительную, только удельные показатели по преступлениям (на миллион человек) и сгруппируем данные по годам (так как в исходных данных на каждый год может быть несколько записей - по количеству служб, предоставивших данные).

 
Код

Промежуточные выводы:

1. Белые совершают в 2 раза больше преступлений, чем черные, в абсолютном выражении, но в 3 раза меньше в относительном выражении (на миллион представителей своей расы).

2. Преступность среди белых относительно монотонно растет на протяжении всего периода (выросла в 2 раза за 18 лет). Преступность среди черных также растет, но скачкообразно: с 2001 по 2006 г. резкий рост, с 2007 по 2016 она даже убывала, с 2017 года опять резкий рост. За весь период преступность среди черных выросла также в 2 раза (аналогично белым).

3. Если не принимать во внимание спад среди черной преступности в 2007-2016 гг., преступность среди черных растет более быстрыми темпами, чем среди белых.

Итак, мы ответили на второй вопрос:

Представители какой расы статистически чаще совершают преступления?

- Черные статистически совершают преступления в 3 раза чаще белых.

Криминальность и гибель от рук полиции

Теперь мы подошли к самому важному: необходимо ответить на третий поставленный вопрос, а именно "Можно ли сказать, что полиция стреляет насмерть пропорционально количеству совершаемых преступлений?"

То есть надо как-то проследить корреляцию между двумя нашими наборами данных - данных по жертвам полиции и данных по преступлениям.

 
Начнем с того, что объединим эти два датасета в один:

То же самое на диаграмме рассеяния:

Отметим мимоходом, что определенная корреляция есть. ОК, теперь то же для черных:

 
Код

И скаттерплот:

 

Здесь все намного хуже: тренды явно "пляшут", хотя общая тенденция все равно прослеживается: пропорция здесь явно прямая, хотя и нелинейная.

Давайте воспользуемся методами матстатистики для определения величины этих корреляций, построив корреляционную матрицу на основе коэффициента Пирсона:

 
Код

Получаем такую картинку:

 

White_promln_cr

White_promln_uof

Black_promln_cr

Black_promln_uof

White_promln_cr

1.000000

0.885470

0.949909

0.802529

White_promln_uof

0.885470

1.000000

0.710052

0.795486

Black_promln_cr

0.949909

0.710052

1.000000

0.722170

Black_promln_uof

0.802529

0.795486

0.722170

1.000000

Коэффициенты корреляции для обеих рас выделены жирным: для белых = 0.885, для черных = 0.722. Таким образом, положительная корреляция между гибелью от полиции и преступностью прослеживается и для белых, и для черных, но для белых она гораздо выше (статистически значима), в то время как для черных она близка к статистической незначимости. Последний результат, конечно, связан с большей неоднородностью данных как по жертвам полиции, так и по преступлениям среди черных.

Напоследок для этой статьи попробуем выяснить, какова вероятность белых и черных преступников быть застреленным полицией. Прямых способом это выяснить у нас нет (нет данных по тому, кто из погибших от рук полиции был зарегистрирован как преступник, а кто как невинная жертва). Поэтому пойдем простым путем: разделим удельное количество жертв полиции на удельное количество преступлений по каждой расовой группе (и умножим на 100, чтобы выразить в %):

 
Код

Получаем такие данные:

 

White_promln_cr

White_promln_uof

Black_promln_cr

Black_promln_uof

White_uof_cr

Black_uof_cr

mean

10238.016198

2.336123

30258.208024

5.872145

0.022818

0.019407

sum

194522.307758

44.386338

574905.952459

111.570747

0.022818

0.019407

min

6115.058976

1.330247

17697.409882

4.179559

0.021754

0.023617

max

13180.171893

3.281493

37805.202605

7.765653

0.024897

0.020541

Отобразим полученные значения в виде столбчатой диаграммы:

 
Код

На диаграмме видно, что вероятность белого преступника быть застреленным несколько выше, чем черного преступника. Конечно, этот анализ весьма условный, но все же дает какое-то представление.

Промежуточные выводы:

1. Гибель от рук полиции связана с криминальностью (количеством совершаемых преступлений). При этом эта корреляция неоднородна по расам: для белых она близка к идеальной, для черных далека от идеальной.

2. При рассмотрении совмещенных диаграмм гибели от полиции и преступности видно, что фатальные встречи с полицией растут "в ответ" на рост преступности, с лагом в несколько лет (особенно видно по данным среди черных). Это согласуется с логическим предположением о том, что власти "отвечают" на преступность (больше преступлений -> больше безнаказанности -> больше стычек с представителями закона -> больше смертельных исходов).

3. Белые преступники немного чаще встречают смерть от рук полиции, чем черные. Однако эта разница почти несущественна.

Итак, ответ на третий вопрос:

Можно ли сказать, что полиция стреляет насмерть пропорционально количеству совершаемых преступлений?

- Да, такая корреляция наблюдается, хотя она неоднородна по расам: для белых почти идеальная, для черных - почти неидеальная.

Часть 3.

Сегодня, как я обещал, посмотрим на географическое распределение этих данных по отдельным штатам США, что должно либо подтвердить, либо опровергнуть выводы, сделанные в масштабах всей страны.

Однако, прежде чем мы займемся этой географией, давайте сделаем шаг назад и посмотрим, что будет, если вместо категории "все преступления" (All Offenses) в качестве исходных данных по преступности взять только самые "злодейские". Многие из моих читателей указали в комментариях, что это будет правильнее, так как "все преступления" включают, например, мелкое воровство или торговлю наркотиками, что (по логике) не должно быть связано с агрессивным поведением, провоцирующим полицейских на стрельбу. Хотя я лично не могу целиком с этим согласиться и считаю, что любое совершенное преступление может повлечь за собой повышенное внимание со стороны полиции (которое, в свою очередь, может кончиться не лучшим образом)... все же, давайте проявим любопытство и посмотрим!

Нападения и убийства вместо "всех преступлений"

 
Итак, в том месте, где мы формируем датасет по преступлениям, вместо строки

Удельное количество преступлений на миллион представителей расы:

Видим, что порядок меньше, но графики почти идентичны предыдущим (по всем преступлениям).

Связь между преступностью и жертвами полиции:

Корреляционная матрица:

 

White_promln_cr

White_promln_uof

Black_promln_cr

Black_promln_uof

White_promln_cr

1.000000

0.684757

0.986622

0.729674

White_promln_uof

0.684757

1.000000

0.614132

0.795486

Black_promln_cr

0.986622

0.614132

1.000000

0.680893

Black_promln_uof

0.729674

0.795486

0.680893

1.000000

Как видим, согласованность в этом случае хуже (0.68 против 0.88 и 0.72 по данным всех преступлений). Но радует здесь, по крайней мере, что коэффициенты корреляции почти не различаются между белыми и черными, т.е. можно сказать, что между преступлениями и жертвами полиции есть некая постоянная корреляция.

Ну, и наш "самодельный" индекс - отношение количества жертв полиции к количеству преступлений:

Здесь разница между расами выглядит еще более заметной, чем в прошлый раз. Вывод тот же - белые преступники чаще гибнут от рук полиции, чем черные.

Таким образом, все сделанные выводы остаются в силе.

Что ж, теперь - уроки географии! :)

 
Исходные данные

"Голливудский" штат намного опережает по этой печальной статистике все остальные. Тройка лидеров - южные штаты (Калифорния, Техас и Флорида); именно про эти штаты снято большинство американских фильмов про бандитов :)

Также видно, что в некоторых штатах уровень преступности существенно изменился за наблюдаемый период (Калифорния, Флорида, Иллинойс), в то время как в других он остался почти на том же уровне (например, в Джорджии).

Подозреваю, что преступность непосредственно связана с численностью населения. Давайте посмотрим на топ-10 штатов по населению в 2018 году:

 
Код

Как говорится, те же фаберже, только в профиль. Удостоверимся в корреляции между преступностью и населением:

 
Код

- получаем коэффициент корреляции 0.98. Что и требовалось доказать!

А вот удельные показатели преступности дают совсем другой топ-лист:

 
Код

Вот так дела! По удельным значениям впереди штаты с небольшой численностью населения: Округ Колумбия (т.е. столица США) и Аляска (в обоих по 700+ тыс. человек на 2018 г.) и один штат со средней численностью (Нью-Мексико с 2 млн. чел.) Из нашего предыдущего топа здесь засветился только Теннесси, что придает этому штату, мягко говоря, не очень хорошую репутацию...

 
Отобразим наши наблюдения на карте США.

 
Теперь то же в удельных значениях (на 1 млн человек):

Видим, что в первом случае примерно поровну северных и южных штатов, а во втором случае - одни южные штаты плюс столица США и Аляска.

Жертвы полиции по штатам (без расовой принадлежности)

Давайте сейчас поглядим, что происходит в конкретных штатах в отношении полицейской стрельбы на уничтожение.

 
Подготовим данные:

 
Также посмотрим на данные за весь период в виде "ящиков с усами":

Ну что же, та же "великолепная троица": Калифорния, Техас и Флорида плюс еще два южных штата - Аризона и Джорджия. Лидеры обнаруживают, как и прежде, больший разброс по годам, демонстрируя изменения.

Связь между жертвами полиции и криминалом

Как и в предыдущей статье, будем исследовать связь между гибелью от рук полиции и криминальностью. Начнем пока без выделения расового признака, чтобы посмотреть есть ли связь в целом и как она распределяется по штатам.

Для начала необходимо объединить данные по преступлениям (насильственного характера) с данными по жертвам полиции, попутно указав диапазон с 2000 по 2018 год (этот же период анализировался в предыдущей части исследования).

 
Код

Если внимательно посмотреть на эту совмещенную диаграмму, можно сделать пару наблюдений:

  • связь между преступностью и гибелью от полиции хорошо прослеживается "невооруженным глазом": зеленая кривая в большинстве случаев "повторяет" столбики преступности;

  • в штатах с высоким уровнем преступности (Флорида, Иллинойс, Мичиган, Нью-Йорк, Техас) количество жертв полиции несколько ниже (в пропорциональном отношении) по сравнению со штатами с более низким уровнем преступности.

 
Посмотрим на диаграмму рассеяния:

Здесь становится хорошо заметно, что соотношение между жертвами полиции и преступностью зависит от уровня преступности. Условно говоря, для штатов со среднегодовым количеством преступлений до 75 тыс. количество жертв полиции растет полее полого, чем для штатов со среднегодовым количеством преступлений свыше 75 тыс. Таких "преступных" штатов здесь, как мы видим, всего четыре.

Давайте посмотрим им "в лицо":

 
Код

 

UOF

violent_crime

state_name

 

 

California

133.263158

181514.578947

Florida

54.578947

110104.315789

New York

19.157895

81618.052632

Texas

64.368421

117614.631579

Ну конечно же, это уже знакомая нам четверка "всадников Апокалипсиса": Калифорния, Флорида, Техас и Нью-Йорк.

Давайте посмотрим на корреляцию между нашими данными по 3 кейсам:

  1. Штаты со среднегодовым количеством преступлений до 75 тыс.
  2. Штаты со среднегодовым количеством преступлений свыше 75 тыс. (наша "четверка")
  3. Все штаты
 
Для первого кейса:

получаем коэффициент 0.839. Это значимая величина, но до 0.9 не доходит, так как здесь налицо значительный разброс по 47 штатам.

 
Для второго кейса:

получаем уже 0.999 - идеальную корреляцию!

 
Для третьего кейса (все штаты):

получаем нечто среднее между двумя предыдущими: 0.935. Но этот общий коэффициент указывает на весьма значительно корреляцию.

А теперь посмотрим, как распределен по штатам наш "индекс стрельбы в преступников" (это, конечно, условное название). Разделим, как и раньше, количество жертв полиции на количество преступлений:

 
 Разделим, как и раньше, количество жертв полиции на количество преступлений:

Здесь интересно заметить, что наши лидеры по преступности ушли в середину и даже ближе концу, показывая тем самым, что в самых преступных штатах не самые "кровавые" полицейские (по отношению к потенциальным или реальным преступникам).

Промежуточные выводы:

1. Количество насильственных преступлений прямо зависит от количества населения (спасибо, кэп!)

2. В абсолютном выражении лидеры по преступности - самые населенные штаты: Калифорния, Флорида, Техас и Нью-Йорк.

2. В удельном отношении (на миллион населения) преступности больше в южных штатах, чем в северных, где заметны только два низко населенных штата - Аляска и Округ Колумбия (г. Вашингтон).

3. Между преступностью и гибелью от рук полиции подтверждается заметная корреляция, составляющая в среднем 0.93 по всем штатам. При этом для лидеров по преступности эта корреляция достигает почти единицы (т.е. линейная пропорция), в то время как для остальных штатов - 0.84.

Влияние расы на преступность и гибель от полиции по штатам

Убедившись, что преступность в целом влияет на гибель от рук полиции, давайте добавим теперь расовый фактор и посмотрим, на что он влияет. Как я уже объяснил выше, для этой цели будем использовать данные по арестам, поскольку они являются наиболее полными из доступных, покрывая основные виды преступлений и все штаты США. Естественно, ни в одном штате и ни в одной стране нельзя приравнять количество арестов к количеству преступлений, но эти показатели, тем не менее, тесно взаимосвязаны. Поэтому для статистических изысканий аресты нам годятся. И мы уже договорились, что будем рассматривать аресты только за насильственные преступления (убийство, грабеж, изнасилование и нападение с отягчающими обстоятельствами), в соответствии с принятой концепцией анализа.

 
Подготовка данных

Отобразим в виде диаграмм:

 
1.Количество арестов в абсолютных значениях
 
ДЛИННАЯ КАРТИНКА
 
2. Теперь в удельных значениях:
 
ЕЩЕ ОДНА ДЛИННАЯ КАРТИНКА

Что можно сказать при взгляде на эти данные?

Во-первых, конечно, количество арестов зависит от количество населения - это заметно по данным для обеих рас.

Во-вторых, в абсолютных показателях белых арестовывают несколько чаще. Говорю "несколько", потому как видно, что эта закономерность соблюдается не во всех штатах (см. например, Северная Каролина, Джорджия, Луизиана и др.) А во-вторых, разница в большинстве штатов не слишком заметна (за исключением, пожалуй, Калифорнии, Техаса, Колорадо, Массачусетса и нескольких других штатов.

В-третьих, в удельных показателях (на миллион представителей расы) во всех штатах черных арестовывают гораздо больше, чем белых.

Давайте проверим наши выводы цифрами.

Разница между средним количеством арестов белых и черных:

 
 Код

- получаем 1.56. Т.е. белых за наблюдаемые 9 лет арестовывали в среднем в полтора раза больше, чем черных.

Теперь то же в удельных показателях:

 
Код

- получаем 0.183. Т.е. вероятность ареста черных в 5.5 раз выше, чем белых.

Таким образом, гипотеза о большей преступности среди черных еще раз подтверждается на примере арестов по всем штатам США.

Чтобы понять, как раса и преступность связаны с гибелью от рук стражей закона, объединим данные по арестам с данными по жертвам полиции.

 
Подготовим данные по жертвам с расовым признаком с разбивкой по штатам:

ОК, теперь можно вычислить корреляцию между арестами и жертвами полиции, как мы уже делали раньше:

 
Код

 

white_uof

black_uof

white_arrests

0.872766

0.622167

black_arrests

0.702350

0.766852

Получаем вновь неплохую корреляцию: 0.87 для белых и 0.77 для черных! Здесь интересно отметить, что эти значения очень близки к коэффициентам корреляции, полученным нами на примере данных по преступлениям в предыдущей части статьи (там было 0.88 для белых и 0.72 для черных).

Наконец, давайте посмотрим на наш "индекс стрельбы в преступников", разделив количество жертв полиции на количество арестов по каждой расе.

 
Код

Посмотрим на графике, как распределяется этот показатель по штатам (возьмем 2018 год):

 
Код
 
ОПЯТЬ ДЛИННАЯ КАРТИНКА

Видно, что в большинстве штатов показатель для белых превышает показатель для черных, хотя есть и яркие исключения: Юта, Западная Вирджиния, Канзас, Айдахо и Округ Колумбия.

Но сравним средние показатели по всем штатам:

 
Код

Показатель для белых выше в 2.5 раза. То есть, если этот индекс о чем-то говорит, то белый преступник имеет в среднем в 2.5 раза большую вероятность встретить смерть от рук полиции, чем черный преступник. Конечно, этот показатель сильно варьируется по штатам: например, в Айдахо черный преступник погибает в 2 раза чаще белого, а в Миссисипи - в 4 раза реже.

Что же, это исследование подошло к концу. Пора резюмировать.

Выводы

  1. Преступность в штатах прямо зависит от численности населения. Наиболее "преступные" штаты, о которых мы привыкли смотреть криминальные хроники или художественные фильмы, - просто самые густо населенные. При рассмотрении удельных показателей насильственных преступлений (на душу населения) лидерами оказываются совершенно неожиданные штаты - Аляска, Округ Колумбия (со столицей США) и Нью-Мексико.
  2. В целом южные штаты показывают более высокие показатели преступности (в удельном выражении), чем северные штаты.
  3. В США количество совершаемых преступлений и арестов обнаруживает значительную разницу среди белых и среди черных в удельном выражении: черные совершаю в 3 раза больше преступлений и в 5 раз чаще попадают под арест, чем белые.
  4. Черные погибают в 2.5 раза чаще от рук служб правопорядка, чем белые.
  5. Гибель от рук служб правопорядка имеет хорошо прослеживаемую связь с преступностью: чем больше преступлений, тем больше смертельных исходов от встреч с полицией. Эта корреляция подтверждается в целом по штатам и для каждой расы, хотя она немного выше для белых. Это подтверждается и разницей в отношении количества жертв полиции к количеству преступлений и арестов между расами: белые преступники имеют несколько более высокую вероятность встретить смерть, чем черные.

Хочу напоследок выразить благодарность моим читателям, давшим ценные комментарии и советы :)

PS. В следующей, отдельной статье я планирую продолжить рассматривать преступность в США и ее связь с расовой принадлежностью. Сначала поколдуем с официальными данными по преступлениям на почве расовой и иной нетерпимости, а потом поглядим на конфликты между полицией и населением с другой стороны и разберем случаи гибели полицейских при исполнении служебных обязанностей. Если эта тема интересна, прошу дать знать в комментариях!

Авторство: 
Копия чужих материалов
Комментарий редакции раздела Правильные неподпиндосные статы

Комментарии

Аватар пользователя Kroen
Kroen(8 лет 9 месяцев)

Основная проблема наркотики и оружейное лобби. Посмотрите канал propolice (не реклама) на ют. То с какой лёгкостью они расстаются с жизнью и то что копы валят наглухо, т.е. если выжил повезло. У них даже есть способ суицида - убийство полицейским. И нужно рассматривать проблему банд и строгости наказания за преступления.

Аватар пользователя Alexander Chernykh
Alexander Chernykh(7 лет 11 месяцев)

латиноамериканцев человек сходу записывает в белые. Что странно весьма - даже в США в статистике можно встретить деление на черных испаноязычных и не черных

ну и раз уж взялся человек копать глубоко - привел бы сравнительный возраст национальных групп. Очевидно ведь что чем моложе социальная группа, тем выше вероятность насильственных преступлений. И очевидно что афроамериканцы будут в среднем моложе

 

Аватар пользователя Олежа
Олежа(9 лет 11 месяцев)

Файл us_pop, с которым работал автор, содержит столбцы White alone, White alone (Non-Hispanic), Black alone, Black alone (Non-Hispanic), отдельно по Hispanic столбца нет. В принципе взять White alone и Black alone вполне логично.  

раз уж взялся человек копать глубоко - привел бы сравнительный возраст национальных групп.

Претензия не понятна. Что такое - возраст национальных групп?

Аватар пользователя ИЮЛь Майский
ИЮЛь Майский(8 лет 9 месяцев)

Это диссертация кандидатская или докторская?

Аватар пользователя Олежа
Олежа(9 лет 11 месяцев)

Не знаю. Думаю, оба два сразу нет.

Аватар пользователя Dimitriys
Dimitriys(6 лет 2 недели)

Нет. Нет научной новизны. Просто работа со статистикой. При желании можно из этого сделать статью ВАК.

Комментарий администрации:  
*** отключен (хохлопропаганда) ***
Аватар пользователя Satos
Satos(7 лет 7 месяцев)

Впечатляющее исследование.

А латиносов никак нельзя выделить из белых?

Вопрос снимается, выше ответили.

Очень жаль. Получается, какие-нибудь Мара Сальватруча или Синалоа  - организации белых.

Аватар пользователя fivik
fivik(6 лет 3 недели)

Преступность в штатах прямо зависит от численности населения.

А можно это интерпретировать как плотность населения?

Аватар пользователя Олежа
Олежа(9 лет 11 месяцев)

Не уверен. Можно соотнести данные по преступности с площадями штатов, однако, этого будет мало, так как население в них распределено неравномерно. Гипотеза вполне правдоподобна и даже очевидна в какой-то мере, но подтвердить её пока нечем.

Аватар пользователя fivik
fivik(6 лет 3 недели)

Я с мыслью, что в городах преступность выше, чем в сельской местности. 

Аватар пользователя Олежа
Олежа(9 лет 11 месяцев)

smile23.gif В каких штатах больше людей, там больше и преступлений. Это кэп автор уже выяснил. Но по концентрации населения в конкретных местах данных на руках нет. Простое деление на количество жителей даёт интересные коллизии. Например, Аляска выходит в лидеры по преступности. Чувствую, там просто почти всё население сконцентрировано в каком-то месте, но показать этого не могу. Тут нужна работа с координатами на местности. В принципе, питон это может, но надо знать координаты мест преступлений. Есть ли такие, или надо восстанавливать координаты по адресам преступлений? Надо иметь данные по концентрации населения с привязкой к координатам. Работа действительно на маленькую диссертацию.

По поводу типа местности ещё больше вопросов. Какую местность считать сельской? Считать ли одноэтажную субурбию сельской местностью или нет? Мы знаем, что сельским хозяйством в сошедших штатах занимается около 2% населения. Но где они живут,  я честно говоря представления не имею. Если это какие-либо аналоги хуторов, где все родственники, то понятно, что по видам преступлений и их частоте будет сильно отличаться от городских. За отсутствием наркомафии в первую очередь. Рецидивистов вряд ли терпеть будут Ну и т.д. 

Нет у меня ответа на этот вопрос. Извините.

Аватар пользователя Kozel de Baran
Kozel de Baran(5 лет 9 месяцев)

Автор исходного поста ответил на простой вопрос - правда ли, что негров валят чаще, чем белых. Ответил чётко и однозначно: и да, и нет. Взяв его математику за основу любой желающий может искать ответа уже на свои вопросы.

Аватар пользователя zag
zag(10 лет 5 месяцев)

Всю эту хрень легче посчитать в экселе, автор вероятно про такую программулину не в курсе. Да и графики там покрасивее. Зависимость количества полицейских убийств от уровня преступности  нечего считать и ежу понятно. Тоже мне бином Ньютона. Короче никаких открытий. На дисер не потянет, максимум - курсовик.

Аватар пользователя Олежа
Олежа(9 лет 11 месяцев)

Всю эту хрень легче посчитать в экселе

Мёржить данные из разных баз с десятками тысяч строк проще в экселе? Ну-ну.

 

Аватар пользователя timus
timus(5 лет 1 неделя)

Спасибо - было интересно))  Я бы - из вредности своей - добавил бы - 1. процентное соотношение черных и белых в штате 2. возраст преступников (понимаю, что такие данные получить куда сложнее) 3. количество "ходок" преступника в момент ареста\убийства  4. отделил бы всё же - испаноязычных от всех остальных и причин тому масса. Но - в любом случае - работа ДОСТОЙНАЯ!

Аватар пользователя Олежа
Олежа(9 лет 11 месяцев)

Пункты 1 и 4 в технически решаемы, по 3 и 4 не уверен, что такие данные доступны. Я подумаю. Может и возьмусь по 1, 4. Сами понимаете, данные и, самое главное - код,  чужие, надо вникать.

Аватар пользователя timus
timus(5 лет 1 неделя)

 В любом случае - повторю - работа ДОСТОЙНАЯ... в отличии от некоторого процента галиматьи, которую зрю ИНОГДА  в и_нете  )) С другой стороны - непубличная сторона подобных исследований, профессиональных и намного-намного более глубоких присутствует  "где надо" и давно, НО - она недоступна для массовой аудитории (что тоже, надо признать, часто, оправданная правильная или вынужденная мера) smile16.gifsmile9.gif

Аватар пользователя cupol77
cupol77(4 года 11 месяцев)

Оговорки и допущения

Понятно, что автор хочет как лучше и отводит от себя подозрения, но как же раздражает это самооправдывание. А ведь могут найтись те, кто придерутся к нейтральным по сути словам. Но на мой взгляд, они и сами так думают, раз видят в словах что-то непотребное. Там где его нет. Где нет текста с эмоциональной окраской.

Каждый думает в меру своей испорченности (с)

 

Читаю дальше

Аватар пользователя ifdru74
ifdru74(8 лет 5 дней)

Любому жителю США известно, что есть четыре "расы": белые, латиносы, негры и азиаты. Я использую краткие названия для сокращения длины текста, а не для нанесения обиды кому-либо по каким-либо поводам. Латиносы - это не белые. Их даже в тюрьмах содержат отдельно. Всего одно неверное допущение делает всю работу бессмысленной. Она остаётся статистически безупречной, но теряет смысл. Вероятно, что статистика, во имя политкорректности, именно так и ведётся, но это искажает картину в целом.

Аватар пользователя Олежа
Олежа(9 лет 11 месяцев)

Латиносы - это не белые.

В банке данных, с которым работал автор, hispanic - это скорее язык, чем принадлежность к расе. Так как и белые, и чёрные приведены как белые и чёрные целиком, так и "белые без хиспаник", и "черные без хиспаник". Зато для "хиспаник" отдельно столбца не нашлось. Ну и латиносов к африканцам отнести всё же труднее, чем к европеоидам, на мой непрофессиональный взгляд.

Их даже в тюрьмах содержат отдельно.

Для меня это новость. А по какой причине?

Аватар пользователя Big Jabba
Big Jabba(12 лет 1 месяц)

Ну и латиносов к африканцам отнести всё же труднее, чем к европеоидам

Почему? К кому ты отнесешь большую часть кубинцев, ямайкцев, пуэрториканцев и прочих выходцев с карибских островов? А вот мексиканцы в массе своей европеоиды. Вот и не получается их разделить.

Аватар пользователя Олежа
Олежа(9 лет 11 месяцев)

А мне зачем? Вот полный список наименований этих самых, имеющийся на руках у автора работы. Это из банка данных по популяции:

White alone White alone (Non-Hispanic) Black alone Black alone (Non-Hispanic) Asian alone American Indian and Alaska Native alone Native Hawaiian and Other Pacific Islander alone Some other race Two or more races White and Black White and Asian White and American Indian and Alaska Native Black and American Indian and Alaska Native Two or more races (Other)

То есть, вся вот эта солянка - какие-то смеси,  две и более рас или некоторые другие. Зато хиспаник отдельно здесь нет.

 

При этом, банк данных по погибшим от рук правосудия по названиям "рас" не совпадает:

Здесь какие-то средне восточники появляются, и испанцы/латиняне отдельной стройкой. Что делать с блэк хиспаник из первого банка в связи с этим не совсем понятно. Я в принципе понимаю, почему автор всех кроме блэк и вайт отчислил.

Аватар пользователя ifdru74
ifdru74(8 лет 5 дней)

Зато для "хиспаник" отдельно столбца не нашлось.

Вот об этом я и говорю. Уровень доходов/образования чудовищно разные, но ради красивых цифр всё это сведено в условный "один столбец". Условный молодой мексиканец, который вчера переплыл Мексиканский залив и работает, в лучшем случае, уборщиком приравнивается условному белому оболтусу, который отсидел 12 лет в школе.

А по какой причине?

Вероятно, по причине ужасающего накала дружбы народов, когда латинос плохо говорящий по-английски будет, как минимум, вечной мишенью злобных шуток. Равно как и W.A.S.P. без испанского среди латиносов будет на тех же ролях. Оптимизация личного состава надзирателей и ничего больше.

З.Ы. Краткие наименования использованы только в целях сокращения текста.

 

Аватар пользователя Пpохоp
Пpохоp(2 года 11 месяцев)

У нас по преступности "приезжие" аналогично черным имеют повышенные показатели. Однако черные понаехали сотни лет назад. Вывод: понаехавшие не исправляются за сотни лет.

Аватар пользователя Kozel de Baran
Kozel de Baran(5 лет 9 месяцев)

Неужели это гены? Да ну, ерунда какая-то.

Скрытый комментарий Повелитель Ботов (без обсуждения)
Аватар пользователя Повелитель Ботов
Повелитель Ботов(54 года 11 месяцев)

Перспективный чат детектед! Сим повелеваю - внести запись в реестр самых обсуждаемых за последние 4 часа.

Комментарий администрации:  
*** Это легальный, годный бот ***
Аватар пользователя Escander
Escander(6 лет 1 неделя)

 Как расово некорректно... БЛМщики и прочие мемориальщики тебя-бы заклевали, будь у них значимо влияние в РФ. 

Аватар пользователя Олежа
Олежа(9 лет 11 месяцев)

Автор работы не прочитает скорее всего. Чем, кстати, расово некорректно-то? Не толерантно, может быть?

Аватар пользователя Escander
Escander(6 лет 1 неделя)

Тебя-бы как распространителя они-бы тоже пытались загрызть и да, в слове толерастно у вас 1 грамматическая ошибка!

Аватар пользователя Олежа
Олежа(9 лет 11 месяцев)

- А знаете, сосед, когда вас нет, так вас ругает, так ругает ...

- Да когда меня нет, пускай даже бьёт.

А толерантность, что притащили из медицины - это когда организм воспринимает что-то чуждое вредное как своё, и не может сопротивляться. Не собирался и не собираюсь, кто бы чтобы не свистел.

Аватар пользователя ДК
ДК(12 лет 1 месяц)

сильно напомнило как я свои пирамиды для книжки считал...

Аватар пользователя warden
warden(10 лет 1 месяц)

Аватар пользователя someuser
someuser(2 года 7 месяцев)

афтар явно неравнодушен к черным, перепощивает простыни бессмысленного текста о суровых черных мужчинах

не палится совсем просто