Преступность в США и России: сравнительный обзор

Аватар пользователя brekotin

Цель исследования -- на основе анализа открытых статистических данных сравнить ситуацию с преступностью в США и России и попытаться понять:

  • какие преступления количественно преобладают;

  • как изменяется преступность по годам;

  • каков уровень преступности в удельном выражении (на 1 млн. населения);

  • как указанные параметры распределяются территориально -- по штатам США и регионам России.

Источники данных

Для анализа используются только открытые официальные данные

  1. Количество совершенных преступлений по основным преступлениям (убийство, грабёж, нападение при отягчающих обстоятельствах, изнасилование): СШАCrime Data Explorer (FBI) Россия: Количество преступлений, зарегистрированных в отчетном периоде: ЕМИСС (данные Генпрокураторы РФ) Население по регионам России: ЕМИСС (данные Росстата)
 
Дисклеймер

Зная, как многие любят поспекулировать на тему надежности исходных данных (если не откапывают изъяны в самом анализе), не грех сразу же расставить точки над "ё".

🗣 Вы наверняка "подшаманили" данные как вам нужно...

💁 Все данные были взяты как есть и не подвергались модификации; над ними лишь производятся статистические вычисления. Это вы можете легко проверить, самостоятельно скачав данные по приведенным ссылкам и сравнив их с теми, которые используются мной.

🗣 Да разве можно доверять нашей статистике? В нашем "THE GULAG" ☭ нарисуют что угодно!

🤦 А каким тогда данным следует доверять? "Независимым" расследованиям "честных" СМИ? 🤢 Или данным ютуберов / тиктокеров / умных инстраграммеров? 🤮

🗣 Да и ФБР что угодно расскажут, чтобы свой зад прикрыть! Это же ИМПЕРИЯ ЛЖИ!

👆 / 🖕

Поскольку данные по преступлениям в России доступны (в указанном источнике) только с 2008 г., то датасет по США также взят за аналогичный период: с 2008 по 2020 г. включительно.

Для использования в Python данные были предварительно сохранены в CSV файлы.

🌎 Все исходные файлы и Jupyter-ноутбук проекта можно скачать ⚡по ссылке⚡.

Используемые инструменты

Я традиционно использую для анализа Python (у меня версия 3.10) с установленными пакетами:

  • для работы с данными: pandas, numpy

  • для создания карт: folium, geopandas, branca

  • для графиков: matplotlib, seaborn

Работаю в интерактивной оболочке Jupyter.

Всё перечисленное уже идет в комплекте с известными дистрибутивами Python. Я использую WinPython на Windows-машине.

Конечно, вам ничего не мешает проделать то же самое в R, JS, MatLAB или даже Excel. Я выбрал свое оружие :)

 

Подготовка данных

Итак, после загрузки всех необходимых пакетов, импорта и начальной обработки исходных данных (см. код в Jupyter) получаем следующие наборы данных:

Количество преступлений в США (первые 10 строк из 676)

year

state_abbr

state_name

population

violent_crime

homicide

robbery

aggravated_assault

property_crime

burglary

larceny

motor_vehicle_theft

rape

2008

0

0

304059724

1394461

16465

443563

843683

9774152

2228887

6586206

959059

90750

2008

AK

Alaska

686293

4475

27

645

3356

20090

3237

15225

1628

447

2008

AL

Alabama

4661900

21110

351

7346

11795

190416

50411

126539

13466

1618

2008

AR

Arkansas

2855390

14649

165

2777

10244

110360

33912

69905

6543

1463

2008

AZ

Arizona

6500180

31567

462

9809

19096

266653

58606

169460

38587

2200

2008

CA

California

36756666

185329

2142

69388

104896

1080996

237811

650656

192529

8903

2008

CO

Colorado

4939456

17480

165

3404

11760

139340

28054

97937

13349

2151

2008

CT

Connecticut

3501252

10737

132

4043

5882

87210

15107

63212

8891

680

2008

DC

District of Columbia

591833

8509

186

4430

3707

30211

3788

19958

6465

186

2008

DE

Delaware

873092

6187

57

1847

3912

31385

6783

22045

2557

371

Количество преступлений в России (первые 10 строк из 1118)

year

region

aggravated_assault

armed_robbery

extortion

homicide

larceny

misdemeanor

rape

robbery

population

2008

Алтайский край

926

315

110

377

29218

56

90

4817

2446182

2008

Амурская область

495

183

64

219

10085

21

39

1582

841579

2008

Архангельская область (без а/о)

398

330

91

199

12486

102

87

1953

0

2008

Архангельская область (с а/о)

422

334

101

216

12816

122

88

1998

1251684

2008

Астраханская область

254

265

68

118

8486

175

90

1749

1007911

2008

Белгородская область

232

121

53

98

6864

82

33

789

1523180

2008

Брянская область

334

155

29

155

10997

95

43

1000

1298797

2008

Владимирская область

353

373

50

176

14346

115

28

1910

1462340

2008

Волгоградская область

665

416

89

278

18657

166

153

3283

2620595

2008

Вологодская область

479

345

98

155

12169

257

43

2123

1216955

 

Как видно, оба датасета имеют сходные столбцы:

  1. year: год, для которого приведены данные
  2. state_abbr, state_name (для США) и region (для России): штат или регион
  3. population: численность населения в указанном регионе в указанный год
  4. остальные столбцы -- количество соответствующих преступлений
  5.  

Здесь следует отметить два момента:

  • в исходных датасетах уже есть суммарные показатели для всей страны: в датасете по США они соответствуют строкам, в которых название штата равно нулю, а в датасете по России -- где в столбце region стоит "Российская Федерация";

  • столбцы в российском датасете были переименованы из источника в английские наименования преступлений в соответствии со следующей таблицей:

{'по ст.105 УК РФ (Убийство)': 'homicide', 
 'по ст.111 УК РФ (Умышленное причинение вреда здоровью)': 'aggravated assault',
 'по ст.131 УК РФ (Изнасилование)': 'rape',
 'по ст.158 УК РФ (Кража)': 'larceny',
 'по ст.161 УК РФ (Грабёж)': 'robbery',
 'по ст.162 УК РФ (Разбой)': 'armed robbery',
 'по ст.163 УК РФ (Вымогательство)': 'extortion',
 'по ст.213 УК РФ (Хулиганство)': 'misdemeanor'}

Поскольку у двух полученных наборов данных совпадают только несколько видов преступлений, для исследования мы возьмем только четыре самых "ядреных":

  • убийство (homicide)

  • нападение [с причинением вреда здоровью] (aggravated assault)

  • грабёж (robbery)

  • изнасилование (rape)

Годовые показатели по стране

Начнем обзор данных с самого очевидного -- годового количества преступлений в масштабах стран (США и России).

США

В абсолютных показателях (количество преступлений в год * 1000) картина в этой стране выглядит следующим образом:

f7669a32d6b99e70f574432639ccaf39.png

С большим отрывом лидирует нападение (по-видимому, без цели ограбления, т.к. ограбление -- это отдельный график). Причем, видно, что после некого спада к 2013 г., количество нападений быстро возрастает. За один только 2020 год рост составил 100 тысяч случаев! Количество грабежей, напротив, падает. Что бы это могло значить? Так и напрашивается вывод о том, что жестокость становится все более бессмысленной. Развлекаются ребята, что тут скажешь ;)

Изнасилования также растут, несмотря на то, что в 2020 г. был небольшой спад. На фоне остальных преступлений убийств кажется мало, и график выглядит плоским; но если приглядеться к цифрам, видно, что и здесь есть рост: после "плато" в 15-17 тыс. убийств за 2008--2019 гг., в 2020 г. их количество резко поднялось до 22 тыс.

Давайте теперь посмотрим на удельные показатели, разделив количество преступлений на численность населения * 1 млн. Это поможет проанализировать "преступные наклонности" нации, так сказать. Имеем:

В принципе, здесь картина та же, почти "пуля в пулю", что говорит нам о независимости преступности в США от численности населения: тенденции будут сохраняться при любой численности. Интересно было бы посмотреть, как они меняются в зависимости от состава населения (по расе, возрасту и т.п.), но это как-нибудь в другой раз.

А пока посмотрим, что там делается на нашем дворе.

Россия

ce45f108dee972b0d20e23a5d15702dc.png

При взгляде на этот график сразу бросается в глаза пикирующий тренд грабежей: их количество с 2008 г. снижается нелинейно, приближаясь к некому плато (на 2020 г. падение еще продолжается). За 13 лет количество грабежей упало в 6.5 раз. За этот же период в США грабежи сократились в 2 раза. По состоянию на 2020 г. в США грабят в 3 раза чаще, чем у нас.

Остальные три вида преступлений также обнаруживают тенденцию к сокращению, хотя спад здесь не такой заметный. Так, количество нападений (с причинением тяжкого вреда здоровью) сократилось в 2 раза с 2008 по 2020 г. Убийства сократились 2.5 раза -- с 40 тыс. в 2008 г. до 15 тыс. в 2020 г. Изнасилования сократились почти в 2 раза -- с 12.5 тыс. в 2008 г. до 7 тыс. в 2020 г.

Одним словом, боремся с данными по преступности преступностью :)

04bce3ad6b1c08d52cb2ceac924ebe6e.jpg

В удельных показателях выглядит так:

В целом, картина здесь аналогичная, что опять говорит о том, что в масштабах страны уровень преступности не зависит от численности населения; здесь необходим учет региональных, социально-экономических, этнических и других внешних факторов.

Сравнение показателей на конец периода (2020 г.)

Давайте теперь сравним показатели преступности по США и России на 2020 г. (конец наблюдаемого периода).

236ec5d9a4880ea63f5b7119f749d431.png

 

При сравнении преступности в США и России можно сделать следующие наблюдения:

 

  1. Как в абсолютных величинах, так и при расчете на 1 млн. населения в США преступность выше, чем в России по состоянию на 2020 г.

  2. В США уровень преступности растет (за исключением грабежей), а в России -- падает.

  3. В США явным лидером из 4 анализируемых видов преступлений является нападение при отягчающих обстоятельствах (на втором месте -- ограбление, на третьем -- изнасилование, на четвертом -- убийство). В России лидирует ограбление (хотя при продолжающемся стремительном падении ситуация может измениться); далее следуют нападение, убийство и изнасилование. Конечно, у нас нет данных о том, как квалифицируются случаи ограбления с нападением (в российских данных, конечно, есть отдельная статья -- разбой, но таких данных нет по США). Но и без этого напрашивается вывод о том, что в США преобладает бессмысленное / бытовое насилие, в то время как российский условный преступник более конкретно мотивирован (наживой). 

  4. Если сравнивать количество убийств и изнасилований, то в США изнасилований совершается гораздо больше, чем убийств (и рост заметнее): 126 тыс. изнасилований и 21 тыс. убийств в 2020 г. В России же картина обратная: 7 тыс. изнасилований и 15 тыс. убийств в 2020 г. Здесь, наверное, можно подискутировать на тему того, насколько часто в этих двух странах люди заявляют в полицию о совершенном изнасиловании (видимо, в США все же чаще). Также у нас нет информации о том, как отображаются в статистике случаи изнасилования и убийства, совершенные одним человеком в одном и том же месте и времени... Но результат все равно показателен.

  5. По убийствам США обгоняют нашу страну только начиная с 2020 г. и с минимальным отрывом. Если взглянуть на данные 2008 -- 2019 гг., картина была обратная: убивали больше в России (как в абсолютном, так и в удельном выражении). Например, при усреднении показателей за весь период (2008--2020 гг.) в США удельное количество убийств составляет 51 на 1 млн. человек, а у нас -- 85 на 1 млн. человек. Вот вам и "окаянные нулевые"...

 

Преступность по регионам

Теперь же будет интересно посмотреть на эти данные в разрезе географического распределения по регионам каждой страны. Это может многое рассказать о глубинных причинах совершаемых преступлений.

США

Рейтинг штатов США по суммарному количеству всех 4 видов преступлений в абсолютном выражении:

2670478d11aa7f46fc529624b8ac7c3c.png

То, что мы видим на этой диаграмме, подтверждает наблюдения моего предыдущего исследования, которое я позволю себе здесь процитировать:

"Голливудский" штат намного опережает по этой печальной статистике все остальные. Тройка лидеров - южные штаты (Калифорния, Техас и Флорида); именно про эти штаты снято большинство американских фильмов про бандитов.

Посмотрим на десятку лидеров по каждому виду преступлений:

b22b38c889e35afc6cb45f24d8999300.png

Везде на пьедестале та же "троица" (хотя по грабежам штат Нью-Йорк вытеснил Флориду на 4-е место). Разница между "суперменом"-Калифорнией и Техасом везде примерно одинаковая, кроме изнасилований: здесь эти два штата соперничают на равных.

Так как без данных по численности населения мы не сможем сделать вывод о том, какие же штаты более безопасные для жизни, посмотрим и на удельные показатели:

9cc355f76f2b67f79a277654d59d3b4d.png

"Внезапно" в лидеры выбились малочисленные штаты -- Округ Колумбия (где столица страны Вашингтон), Аляска и не такой уж малонаселенный Нью-Мексико.

Топ по видам преступлений выглядит следующим образом:

83d5e97d0aca4caeb36ae75eed2166c6.png

Ну и чтобы более наглядно было, отобразим удельные показатели преступности на карте:

Аляска против объединенного Юга борются за пальму первенства

Аляска против объединенного Юга борются за пальму первенства

Итак, можно сделать следующие наблюдения по США:

  • самые преступные штаты с точки зрения количества совершаемых преступлений -- самые густо населенные (кэп здесь!); это Калифорния, Техас, Флорида и Нью-Йорк

  • в показателях на душу населения с большим отрывом лидирует Округ Колумбия с г. Вашингтон (столица все-таки)

  • по 3 из 4 видов преступлений также лидируют "столичные", хотя по нападениям этот отрыв (от Аляски и Нью-Мексико) не столь заметен

  • по убийствам на втором месте неожиданно Луизиана -- штат хлопка, работорговли, джаза, блюза и хм... преступности

    Из Википедии:

    In 2015, Louisiana had a higher murder rate (10.3 per 100,000) than any other state in the country for the 27th straight year. Louisiana is the only state with an annual average murder rate (13.6 per 100,000) at least twice as high as the U.S. annual average (6.6 per 100,000) during that period, according to Bureau of Justice Statistics from FBI Uniform Crime Reports.

    Wikipedia contributors. (2022, January 25). Louisiana. In Wikipedia, The Free Encyclopedia. Retrieved 00:26, January 27, 2022, from https://en.wikipedia.org/w/index.php?title=Louisiana&oldid=1067877269

  • по изнасилованиям на душу населения явным "фаворитом" выступает холодная Аляска... греются ребята ;)

Россия

Все регионы России по количеству преступлений (в абсолютном выражении):

8d5c736c4dc816a9301c64e51ca2688b.png

Вот она -- Москва, жемчужина нашей Родины! Как десяток других областей вместе взятых. Понимаем, что дело здесь, конечно, в численности населения... До удельных показателей дойдем, а пока топ-10 по количеству преступлений:

3863866a31f6cb76df2b21a1a01ae1e6.png

Москва или Московская область везде на первом месте, как видите. Особенно что касается грабежей. Вот с "серебряным призером" интереснее: по убийствам Свердловская область потеснила даже столицу, по нападениям на пятки Московской области наступают Кузбасс, Иркутская область и Свердловская область, по изнасилованиям Москву догоняет все та же "жемчужина Урала".

Ладно, что там с удельными показателями?

4203c7e18f1e997f3ec83df276c1c878.png

f9f8ac3ffa12ab6c7c5ae5636c1640ca.png

Ну и где бы вы теперь согласились постоять в "ролексе" в подземном переходе около полуночи? :) Тувинцы зверствуют, поморы из Архангельска тоже не хотят уступать... В Тюменской области процветают ограбления.

На карте России выглядит так:

Суровый русский север, суровая Сибирь... Кавказ меркнет.

Суровый русский север, суровая Сибирь... Кавказ меркнет.

Некоторые наблюдения по России:

  • наибольшее количество преступлений совершается в Москве и Московской области, на втором месте -- Свердловская и Иркутская области

  • в удельных показателях тройка лидеров -- Тюменская область, Республика Тыва и Архангельская область; в первых двух превалируют грабежи, в Тыве -- высокая доля нападений и убийств

  • наиболее преступными регионами в целом являются Сибирь (Иркутская область, Тыва, Забайкалье, Хабаровский край, Кузбасс, Томская область, Тюменская область), Архангельская область и Пермский край

  • наиболее безопасными регионами, согласно официальным данным, является Кавказ (может, просто мало данных?), Центральный и Южный ФО, а также ЯНАО, ХМАО и Камчатка

Что же, наш небольшой обзор на этом завершен. Ссылка на файлы проекта выше (и вот еще раз). В будущем планирую развивать тему и делать новые публикации на Хабре.

Берегите себя в это непростое время! 🖐

Авторство: 
Копия чужих материалов
Комментарий редакции раздела Аналитика

Вернул в раздел Аналитика после того, как Олежа поправил три графика. Изначально на habre были ошибки.

За что Олежа большое спасибо! В изначальной редакции на хабре численность населения России была умножена на 2 (посчитаны сумма и подсуммы по регионам). У меня как то такая ошибка тоже была. 

 
 Речь про них

Следует отметить, что на habre на момент публикации моего комментария, ошибку так и не обнаружили. У нас же мне написали раза 4 как минимум. Плюс Олежа уже успел переделать. 

Я при публикации все данные не проверил, а лишь выборочно. Поэтому не отловил ошибку. Как говорится, глаза хорошо, а сообщество АШ лучше. Всем спасибо. 

(с) brekotin

Комментарии

Аватар пользователя Олежа
Олежа(9 лет 4 месяца)

В общем, автор работы пошел по пути суммирования регионов, чтобы получить в итоговые данные по всей стране. Тот момент, что таблица содержит строки "Российская федерация", не учёл. Кроме того, файл с криминальными данными в столбце "регион" содержит разные артефакты типа "ГУ МВД России по г.Санкт-Петербургу и Ленинградской области", а также в нём и в файле с регионами имеются разные интересные взбрыки типа "Архангельская область (с а/о)" и "Архангельская область (без а/о)". В итоге, при суммировании по столбцам сумма превышает число по строке "Российская федерация" на несколько тысяч. А если удалить подозрительные элементы, то не дотягивает до неё на несколько сотен. При слиянии таблиц несовпадающие элементы, конечно, удаляются, но строки "Архангельская область (с а/о)" и "Архангельская область (без а/о)" и аналогичные содержат оба файла, в итоговый попадают обе такие строки, и сумма всё-равно плывёт.

В общем, мне надоело ломать голову, и я не мудрствуя лукаво отфильтровал итоговый после слияния файл по строкам "Российская федерация" и засунул в блоки рисования графиков. Полученные графики ниже под спойлером.

 

Прошу проверить графики на предмет ошибок. КАМРАДЫ, ПОДКЛЮЧАЙТЕСЬ!

 

Сергей! Надеюсь, теперь всё правильно. Статью надо снова исправлять.smile1.gif

Аватар пользователя advisor
advisor(12 лет 3 месяца)

Оказывается ты не только флудить можешь. )

Аватар пользователя Олежа
Олежа(9 лет 4 месяца)

Подумаешь! Я ещё и вышивать могу, и на машинке — тоже…(С)

Аватар пользователя advisor
advisor(12 лет 3 месяца)

ага ,а еще мозги выесть ложечкой... ))

Аватар пользователя Олежа
Олежа(9 лет 4 месяца)

Тю, против некоторых местных в этом деле я что посох увязший в песке. 

Аватар пользователя Remchik
Remchik(12 лет 2 месяца)

Пока разные статистические методики к одному знаменателю не приведут, сравнивать напрямую нельзя. А всякие приколы бывают, типа помрет раненый в больнице, а не на тротуаре и вот он уже в убийства не попал.

Аватар пользователя Rodriguez
Rodriguez(7 лет 2 месяца)

Какие смачные комментарии на хабре, прямо "ну и что что нападений в 100 раз больше, а вы их домики видели? За такие домики и умереть не жалко"

Комментарий администрации:  
*** отключен (систематическое паникерство, набросы) ***
Аватар пользователя mk2
mk2(8 лет 5 месяцев)

И огромное количество "У нас власти скрывают, принижают и не раскрывают"

Аватар пользователя User007
User007(3 года 1 месяц)

Хабр та еще помойка, попробуй напиши что-нибудь, что протеворечит мнению толпы и тебя заминусуют. Если бы Хабр  был во времена Коперника, они бы сожгли его без всяких  сантиментов.

Аватар пользователя Stepnyak
Stepnyak(2 года 3 месяца)

С учетом сведений из недавних материалов АШ по систематическому разграблению  железнодорожных контейнеров  организованными и полуорганизованными бандами в США , а также недавнего материала  "Русстрат" - «Калифорнийская мечта»: прокурор от Сороса разрешил жителям Лос-Анджелеса грабить поезда "  -  приведенная статистика по грабежам в США может быть существенно занижена.  Причина  -  в декриминализации подобных преступлений прокурорами и законодателями штатов и , соответственно - в отсутствие возбуждаемых уголовных дел по фактам явных грабежей.   

 

 

Страницы