Российский ученый Сергей Шпилькин, известный своими исследованиями статистических аномалий в результатах российских выборов, в своем фейсбуке сообщил о том, что на сайте Центризбиркома РФ невозможно скопировать данные со страницы с результатами выборов.
Таблица с данными в браузере отображается корректно, однако при попытке скопировать и вставить текст, либо при чтении исходного кода страницы, вместо чисел в некоторых ячейках виден только случайный набор символов.
Ссылка на страницу с примером: http://www.primorsk.vybory.izbirkom.ru/region/izbirkom?action=show&root=...
Судя по всему, реализовано это генерацией специальных CSS-стилей и специальных шрифтов, причем при каждом обновлении страницы названия стилей и шрифтов разные.
О причинах подобной обфускации пока что ничего неизвестно, однако, как предполагает сам ученый и комментаторы в фейсбуке, сделано это для затруднения автоматизированного анализа результатов выборов независимыми аналитиками.
Upd. Пользователь @jtraub также заметил, что кроме использования сгенерированных шрифтов для подстановки символов, в страницу также вставляются дополнительные скрытые span'ы для затруднения парсинга.
Upd2. @nin-jin предложил изящный 25-строчник на JS, который легко преобразовывает страницу в нормальный текст с помощью html2canvas и tesseract.
Upd3. @strayge предложил решение на Python с улучшенной точностью.
alexsword: Рукожоп негодует!
Комментарии
вынесу в комментарии примечательный диалог из комментов к статье:
Х.з..
Я вроде не великий учёный, и мобильник обычный дешманский.. ( может что данные старые.. но скопировалось по ссылке)
____________
дык, там и пишут, что обфускация только в Хроме, а на другие браузеры у кровавого режима денег не хватило :-)
Для типа ученого записать ручками 4 цифры стало намеком на фальсификацию)))
PS: Ссылки на сайт с Хабра равносильны средней DDoS-атаке , и известны так называемым "хабр-эффектом".
Иными словами, когда количество переходов пользователей составит, скажем, миллион в секунду - сайт ляжет.
И такого "ученого" можно подозревать в виртуальных диверсиях во время проведения выборов.
Зато хоть новое умное слово узнали от товарища учёного ))
..( кто из других специальностей родом... я ранее не встречал )
обфусцировал
вот что скопировалось на самом деле у вас
Чудеса да и только...
На вид вроде нормально выглядит, а читается каракулями)
html - hyper text markup language
там много можно придумать спецсимволов и пустых тегов, которые не отображаются браузером
они вроде не руками копируют, а программой анализируют страницу по шаблону. избирком им шаблон порвал.
Прогресс.. карандашом нынче не модно считать в столбик)
Новой вид доказательств фальсификации - у некого индивида не получается копировать...
Уровень однако пробивает дно.
ПС. У меня нормально копируется в эдже (движок там хрома). Или это было с намёком что гугл мешает проводить выборы в РФ?
Нет. Возможно, это намёк, что однажды мы вместо цифр увидим капчу.
На мой взгляд, люди, допустившие и реализовавшие такое, должны быть наказаны за искажение опубликованных данных по результатам голосования. Сильно наказаны.
Какой то рукожоп, а не ученый. Не можешь сделать элементарную операцию так хоть не позарился бы выкладывая это. Вроде не старый а уже в маразме.
Надо узнать у учОного, с какой целью он собирался скопировать данные.
дык, не секрет, с целью продемонстрировать, что они сфальсифицированы. Посмотри на награды
герояученого:сразу видно - светлый человек.
в хроме нормально... или у него какой-то другой тырнЭт...
какой коварный лежим...
Сложно назвать учёным человека, который постоянно применяет гауссиану для анализа результатов выборов. Область применения распределения Гаусса - выборка случайных величин. При этом голосование - осознанное решение граждан, как и явка на выборы. Впрочем, и рассчитана писанина Шпилькина на людей необразованных.
дык недообфусцированный он))
Но лет десять уже с этой чушью носится ) Хотя ему неоднократно объясняли.
Так и не понял, где проблема. Пошел на сайт, выбрал Республику Коми, выделил данные в таблице и скопировал в ворд и ексель. Никаких проблем не испытал. Я что-то делаю не так?
Попробуйте перед копированием обругать кровавый режим.
Если не получится, то всё сложнее, и Вам придётся попытаться получить зарубежный грант на защиту свободных выборов.