Закон Ципфа в школе и дома

Аватар пользователя bom100

Закон Ципфа («ранг—частота») — эмпирическая закономерность распределения частоты слов естественного языка: если все слова языка (или просто достаточно длинного текста) упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n (так называемому рангу этого слова, см. шкала порядка). Например, второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и так далее.

 

Автором закономерности является французский стенографист Жан-Батист Эсту (фр. Jean-Baptiste Estoup), который описал её в 1908 году в работе «Диапазон стенографии». Закон был впервые применён для описания распределения размеров городов немецким физиком Феликсом Ауэрбахом в работе «Закон концентрации населения» в 1913 году и носит имя американского лингвиста Джорджа Ципфа, который в 1949 году активно популяризировал данную закономерность, впервые предложив использовать её для описания распределения экономических сил и социального статуса.

Объяснение закона Ципфа, основанное на корреляционных свойствах аддитивных марковских цепей (со ступенчатой функцией памяти) было дано в 2005 году.

Закон Ципфа математически описывается распределением Парето. Является одним из базовых законов, используемых в инфометрии.

                       Закон Ципфа: График для частот слов из статей русской ВП с рангами от 3 до 170

Приложения закона

Джордж Ципф в 1949 году впервые показал распределение доходов людей по их размерам: самый богатый человек имеет вдвое больше денег, чем следующий богач, и так далее. Это утверждение оказалось справедливым для ряда стран (Англия, Франция, Дания, Голландия, Финляндия, Германия, США) в период с 1926 по 1936 год.

Этот закон также работает в отношении распределения городской системы: город с самым большим населением в любой стране в два раза больше, чем следующий по размеру город, и так далее. Если расположить все города некоторой страны в списке в порядке убывания численности населения, то каждому городу можно приписать некоторый ранг, то есть номер, который он получает в данном списке. При этом численность населения и ранг подчиняются простой закономерности, выражаемой формулой:

{\displaystyle P_{n}=P_{1}/n},

где P_{n} — население города n-го ранга;  P_1 — население главного города страны (1-го ранга).

Эмпирические исследования подтверждают данное утверждение.

В 1999 году экономист Ксавье Габэ описал закон Ципфа как пример степенного закона: если города будут расти случайным образом с одинаковым среднеквадратичным отклонением, то в пределе распределение будет сходиться к закону Ципфа.

Согласно выводам исследователей по отношению к городскому расселению в Российской Федерации, в соответствии с законом Ципфа:

  • большинство городов России лежит выше идеальной кривой Ципфа, поэтому ожидаемая тенденция — продолжение сокращения численности и людности средних и малых городов за счёт миграции в крупные города;
  • соответственно 7 городов-миллионников (Санкт-Петербург, Новосибирск, Екатеринбург, Нижний Новгород, Казань, Челябинск, Омск), находящиеся ниже идеальной кривой Ципфа, имеют существенный резерв роста населения и ожидают прирост населения;
  • существуют риски депопуляции первого города в ранге (Москвы), поскольку второй город (Санкт-Петербург) и последующие крупные города сильно отстают от идеальной кривой Ципфа в связи со снижением спроса на рабочую силу при одновременном росте стоимости проживания, включая, прежде всего, стоимость покупки и аренды жилья.

 

 

Авторство: 
Копия чужих материалов
Комментарий автора: 

Для тех кто заинтересовался: статья (перевод) - Степенные законы, распределения Парето и закон Зипфа http://www.cognitivist.ru/er/kernel/power_laws_7.xml

 

По поводу высказывания - "существуют риски депопуляции первого города в ранге (Москвы), поскольку второй город (Санкт-Петербург) и последующие крупные города сильно отстают от идеальной кривой Ципфа"  в рамках статичных границ автор возможно прав. Но если рассматривать в динамике и представить себе что мы имеем дело с живым организмом (государством) и рост Москвы указывает на прирастании России крупными городами, так чтобы все встало на место ? На Западе таких городов нет. Они есть на Востоке и Юге .. 

Комментарии

Аватар пользователя Demiare
Demiare(5 лет 1 месяц)

Автор методологически не прав, поскольку применяет статистику там, где она не применима (про прогноз Москва-Питер). Самый важный нюанс :

В 1999 году экономист Ксавье Габэ описал закон Ципфа как пример степенного закона: если города будут расти случайным образом с одинаковым среднеквадратичным отклонением, то в пределе распределение будет сходиться к закону Ципфа.

Москва является столицей. Это даёт ей некоторые "конкурентные" преимущества не относящиеся к случайности, т.е. некоторый детерминированный фактор. И его надо бы сначала как-то исключить :)

UPD. Тем более, в связи с относительно недавним распадом СССР и продолжающимися перетоками населения на территориях СНГ применение статистических моделей мягко говоря - сомнительно.

Аватар пользователя bom100
bom100(9 лет 3 месяца)

А раньше Москва не была столицей ? А Путин и Медведев и ближайшее окружение у нас не из Питера ? А Собянин у нас из Москвы ? Все это случайные факторы..

Разве Вашингтон самый большой город в США ???

Аватар пользователя Demiare
Demiare(5 лет 1 месяц)

Статистические методы не должны применяться для анализа, если в их временную шкалу попадает фундаментальное системное изменение исследуемого объекта (за исключением случаев, когда их и используют для анализа непосредственно этого изменения).

В данном случае во временную шкалу влезает распад СССР - следовательно все выводы ложны. Нужно дождаться стабилизации ситуации в России как в стране России, а не как в осколке бывшего СССР. На это нужно время.

UPD. Как пример - статистическое исследование закономерностей количества лошадей не должно проводится на отрезке включающем появление автомобиля, ибо оно тогда покажет чушь :) Нужно или строго до, или строго после. Но в рамках движения населения "после" прошло ещё слишком мало времени.

Аватар пользователя bom100
bom100(9 лет 3 месяца)

Закон Цапфа - эмпирический закон. Это не закон Всемрного тяготения.

http://kvant.mccme.ru/pdf/1998/01/kv0198arnold.pdf  - вот почитайте и покритикуйте ... Арнольда

Аватар пользователя Demiare
Demiare(5 лет 1 месяц)

"тяжело вздыхаю". Начнём с простого - какой же он эмпирический, если вы сами пишите, что российские города ему не соответствуют? :)

Во-вторых ещё раз - статистика требовательна к входящим данных, нельзя "совать чё хошь", а закономерности описывают реальные процессы, а не просто "должны быть всегда".

Если вы не поняли сложное объяснение, объясню по-простому. Как думаете - будет ли этот "закон" Цапфа соблюдаться для современных городов США взятых исключительно на бывшей территории Конфедерации? Не а.

Аватар пользователя bom100
bom100(9 лет 3 месяца)

Да все понятно мне - нам в России (распределении) не хватает для нормализации - сельского населения Средней Азии и нескольких столиц  бывших союзных республик. На что указывает закон Цапфа ? На то что  у нас до сих пор не возникло НОВОГО организма - нововой страны (с правильным распределением) .. Так это проблема решается либо депопуляцией крупных городов (Москва и Питер) - об этом говорили вы. Либо присоединением/восстановлением новых (старых) территорий (о чем говорил я). Мы оба признаем что распределение нарушено и должно быть восстановлено. Только рассматриваем различные пути восстановления распределения.

Аватар пользователя Demiare
Demiare(5 лет 1 месяц)

На что указывает закон Цапфа ? На то что  у нас до сих пор не возникло НОВОГО организма - нововой страны (с правильным распределением)

Вот, вот - это уже правильный вывод. Как новое распределение будет сформировано - депопуляцией Москвы, притоком населения из СНГ или ещё как - из закона Цапфа уже не вытекает, тут нужно уже поднимать полный набор данных : миграция, экономика и т.д. и т.п. и на основе этого считать.

Аватар пользователя bom100
bom100(9 лет 3 месяца)

Закон Цапфа работает независимо от процессов происходящих в стране. Так что миграция и пр. тут не при чем. Во многих странах он не работает. Вот и все.

Скрытый комментарий Повелитель Ботов (без обсуждения)
Аватар пользователя Повелитель Ботов

Перспективный чат детектед! Сим повелеваю - внести запись в реестр самых обсуждаемых за последние 4 часа.

Комментарий администрации:  
*** Это легальный, годный бот ***