
Обзор книги «Как лгать при помощи статистики», отличная книга для расширения кругозора
Книга отлично подойдет , как для тех, кто давно "в теме", так и для тех людей, чья профессиональная деятельность никак не связана со статистикой.
Стоит читать? Да! Почему? Опишу в статье.
Статистика - то, что окружает каждого из нас, данная книга поможет разобраться с тем, как грамотно можно "подтасовывать" данные в статистике.
Для кого эта книга?
Книга рассчитана на широкую аудиторию, так как её тематика и материал будут полезны, как для опытных и компетентных людей, так и для тех, кто крайне далёк от статистики.
Книга состоит из 10 глав. Далее кратко и главное предметно постараюсь рассказать о том, что есть интересного и “полезного” в книге.
Глава 1. Выборка изначально необъективна

В самой первой главе автор начинает с раскрытия того аспекта, насколько важна первоначальная выборка данных.
Обычно, выборки, что используются в статистических исследованиях, имеют много искажений. Для предметного понимания:
Если вам надо опросить днем людей с интересующим вас вопросом и для этого вы выходите на улицу, то идет первое искажение вашей выборки, ведь в ней не будут задействованы те люди, что в данный момент находятся у себя дома.
Если вы пойдете по квартирам и будете стучаться в дверь, общаться с теми, кто дома, появляется следующее искажение выборки, вы не застаёте тех, кто сейчас на работе.
Хорошо, вам приходит идея опрашивать людей по вечерам, когда многие люди идут домой с работы или же уже находятся дома, но и тут искажение, вы не учитываете в своей выборке тех людей, что любят посещать кино или же посетить увеселительное заведение.
Всё это отлично рассмотрено в первой главе. Так что, теперь мы с вами понимаем , что в разное время и в разных условиях мы постоянно получаем разную выборку, объективность и точность которой также будет изменчива, в зависимости от первоначальных условий.

Глава 2. Грамотно выбранное среднее

В этой главе автором удачнее всего рассмотрен знакомый многим жизненный пример – средний зарплатный показатель.
Когда мы встречаем такое понятие, как средняя зарплату, автор предлагает первым делом задать самим себе вопрос:
Кого включает в свою выборку данная средняя зарплата. В пример приводится случай из истории, когда одна сталелитейная компания из Америки заявляла, что средняя зарплата их сотрудников выросла на 107% за промежуток 1940-1948 гг., но было одно но, этот показатель включал значительно большее число частично занятых сотрудников.
Для понимания, если в 1941 году сотрудник работал полнедели, а в 1942 он уже работал полную рабочую неделю, то зарплата такого сотрудника возрастает в два раза. Таких вариаций изменений условий и времени труда много, что крайне показательно для того, как можно манипулировать понятием “среднее”.
Глава 3. Нюансы, о которых скромно умалчивают

В этой главе автор знакомит нас с следующими понятиями:
Критерий значимости – та штука, что показывает, какая вероятность того, что полученная в ходе испытаний (исследования) цифра отражает реальный результат, а не случайное значение.
Размах исследуемого признака – если простыми словами, то это разность между наибольшим и наименьшим значениями результатов наблюдений.
Краткий вывод по всей главе сводится к следующему: не доверяйте тем исследованиям, где не уточнены:
Критерий значимости
Размах исследуемого признака
Отсутствуют какие-либо пояснения и формулы расчетов
Нет подписей данных на осях графиков
Глава 4. Много шума практически из ничего ( насколько объективен IQ тест)

Автор рассматривает ситуацию, когда нам необходимо самостоятельно измерить размеры огромного числа полей, причем измерять нужно без рулетки и иного рода измерителей, а шагами.
Так как мы живем в России, буду писать метр, а не ярд, для легкости восприятия.
В среднем погрешность подобной деятельности составит 3 м на каждые 100 м. Грубо говоря, на каждые 100 м погрешность ± 3 м.
Далее автор рассматривает IQ тест, что имеет погрешность 3%.
К примеру, если у Алексея IQ 88 +-3, а у Анастасии IQ 91 +-3, получается в одном из случаев, Алексей может иметь IQ 88 + 3 = 91 против 91 – 3 = 88 у Анастасии и оказаться умнее.
В целом, автор ведёт к тому, что не совсем верно оценивать IQ человека по абсолютному значению, а куда корректнее делать это диапазоном, в нашем случае это диапазон IQ у Алексея 85-91 и у Анастасии 88 – 94.
Не сказать, что я согласен с автором в этом моменте, большая это тема для споров, но теория интересная)
Идём далее.
Глава 5. График – лучше не бывает

Вся суть данной главы сводится к тому, как незначительную числовую разницу в графике можно представить, как что-то грандиозное и великое.
Предлагаю обратить внимание на верхний рисунок. Фонд зарплаты госслужащих США в 1937 г. вырос с 19 500 000 $ до 20 000 000$. Если исходить из числовых значений, то рост в период с июня по ноябрь 1937 года составляет всего 2.56 %, но на графике же рост выглядит куда значительнее, согласитесь?
Считаю это крайне интересным и показательным примером того, как можно исказить график с той целью, чтобы зрительного всё выглядело куда иначе, нежели есть на самом деле.
Глава 6. Схематичная картинка

Сама по себе глава достаточно объемная и интересная, но чтобы кратко передать её суть, предлагаю рассмотреть следующий пример из книги.
Мощность производства сталелитейной промышленности США в 1930-е годы составляла 10 млн тонн чугуна.
В 1940-е же мощность сталелитейной промышленности выросла на 42.5% и уже составляла 14.25 млн тонн чугуна.
Но, если бегло взглянуть на схематичную картинку, что образно должна нам показать изменение объема мощности выпускаемой продукции, может быть создано впечатление, что рост не 42.5%, а все 300%.
Этот пример отлично показывает, как зрительно искаженный образ может менять восприятие числовых значений. Подобное, к сожалению, нередко встречается и в наши дни.
Глава 7. Псевдообоснованная цифра

В данной главе автор пытается раскрыть нам следующее:
Если у вас не получается доказать то, что вы хотите доказать, то продемонстрируйте нечто иное и настаивайте на том, что это то же самое.
Из всех примеров, что были рассмотрены в книге, более всего мне запомнился пример с лекарством.
Его краткая суть в следующем:
Если вы не имеете возможности доказать того, что ваше лекарство лечит от простуды, то никто не мешает вам напечатать результаты лабораторного исследования: полкапли лекарства помещенные в пробирку через 11 секунд может уничтожить 31 108 бактерий.
Вы, в свою очередь отражаете действительную информацию, но насколько это близко к тому, что ваше лекарство реально лечит от простуды – вопрос открытый. Так это и работает)
Глава 8. И снова “после – значит вследствие”

Идея данной главы в том, что заблуждения всегда обнаруживаются в статистических данных, замаскированные в гуще внушительных цифр.
Автор предлагает не поддаваться заблуждению “после – значит вследствие” и подвергать любое утверждение тщательному анализу.
В главе рассмотрены также типы ложной корреляции. Больше всего мне хотелось бы рассмотреть следующий рассмотренный в книге тип корреляции.
Фиктивная корреляция – когда ни одна из переменных не оказывает никакого влияния на другую, но при этом корреляция между переменными подтверждается расчетами.
Понравилось в данной главе также рассуждение автора о производителе зубной пасты.
Если вы производите зубную пасту, что должна защищать от кариеса, ваша задача это отбрасывать неугодные вам результаты и делать акцентах на тех, что подходят для ваших целей.
Глава 9. Как производить стастикуляции
Статикуляция – это статистические манипуляции.
Автор предлагает рассмотреть следующие манипуляции с данными:
Подбор подходящих средних величин ( как в главе 2 “Грамотно выбранное среднее”)
Искажение диаграмм ( как в главе 5 “Трюки с графиками”)
Сложение неслагаемого
Манипуляция индексами
Манипуляция с процентами
Больше всего понравилось рассмотрение примера манипуляции с процентами.
Лучшим и показательным считаю привести пример следующих изображений из книги


Глава 10. Как поставить статистика на место

В заключительной главе автор предлагает всегда задавать 5 критических вопросов к тем, кто производил то или иное статистическое исследование:
Кто это говорит? Первое, на что советует обращать внимание автор, на предвзятость статистических данных, о том, кто производит исследования, насколько он заинтересован в том или ином исходе.
Откуда ему это известно? Не смещенная ли выборка, достаточно ли велика выборка, достаточно ли рассмотренно случаев, чтобы выявленная корреляция была значима.
Чего не хватает? Указывается ли степень достоверности и есть ли другие цифры, что могут помочь оценить значение данных?
Не подменен ли объект исследования? Будьте внимательны к тому, не производилась ли подмена при переходе от исходных значений к выводам?
Есть ли в этом смысл? Пожалуй, самый важный вопрос, ведь далеко нередко статистические исследования не имеют никакой практической пользы. Автор рассматривает пример, что в период с 1947 по 1952 г. число телевизоров в домах жителей США возросло на 10.000%. Но, также автор предлагает экстраполировать это на следующие 5 лет, что привело бы к тому, что количество телевизоров будет стремиться к двум миллиардам. Тут есть над чем подумать.


Комментарии
счётомотам посвящается:
техническое: неудобно читать с такими крупными картинками, попробуйте уменьшить их размер в настройках вставки. И кажись, есть опция по нажатию на картинку, чтобы она открывалась крупнее.
Увы, писал с телефона.
Сожалею о неудобстве чтения.
Благодарю за конструктивные комментарии.
Классический ход Счетовода это доказательство истинности стат данных при помощи самих статданных. Тут как раз упомянут как один из методов манипуляции.
Благодарю вас, уважаемый, за ваш комментарий.
Должен сообщить вам о том, что Счетовод тут ни причем.
Как можно? В мыслях не было!
Я ведь специально указал в авторских комментариях:
Помимо всего перечисленного, есть еще одна очень важная и принципиальная "манипуляция". Это отсутствие интерпретации приводимых цифр и их воздействия на существующую структуру экономики.
К примеру большие цифры роста, для "саудовской Аравии" говорят лишь о скорости вывоза сырья. А для условного "Китая" о росте сложности и взаимосвязей в экономике.
В первом случае можно сказать, - экономики как таковой нет. Есть просто "распродажа".
В другом - это действительно рост экономического "хозяйственного" развития.
Поскольку статистика не погружается в структурные экономические взаимосвязи, - то сами по себе цифры (без этого погружения и его описания) не говорят об экономике вообще ничего.
Это просто шум.
Согласен
Согласен, Счетовод конечно не все,
Автор мешает в кучу статистику и прогнозы.
дел
А чё не так то, уважаемый?
всё ок. вопрос снял, как Вы видели. :)
ночь в дороге был, не увидел на телефоне. Заметил и сразу вопрос снял.
Ну, за справедливость!