Что знают о вас городские камеры

Аватар пользователя ТАСС

Российские разработчики создали самую быструю в мире систему распознавания лиц, которая уже используется в соцсетях и на улицах Москвы. Зачем городу знать вас в лицо — в материале ТАСС

Разработчик технологии распознавания лиц NtechLab стал победителем в двух из трех номинаций международного конкурса Face Recognition Prize Challenge. Это не единственная победа московского стартапа, который два года назад начинался с трех выпускников технических вузов.

С ранней версией своего софта, написанного на трех простых компьютерах, они обошли на другом конкурсе команду из Google. Тогда и пришло признание, а конкретнее: инвестиции, создание сервиса FindFace для распознания лиц пользователей "ВКонтакте" и заказ на подключение нескольких тысяч камер в Москве к системе распознавания лиц (синхронизирован с базой МВД для поиска преступников и пропавших людей). В 2017 году стартап привлек $1,5  млн от венчурного фонда Impulse VC. 

Щелкнуть пальцами не успеете

"В конкурсе участвовали 16 команд: четыре из России, наверное, столько же из Китая, остальные из США и Европы, — перечисляет Артем Кухаренко, один из создателей стартапа. — И результаты конкурса, и число участников из разных стран — говорящие. Российские разработки биометрических систем считаются сильными. Хотя в этот раз другие российские технологии не прошли в призовые тройки".

NtechLab стала победителем в двух номинациях из трех — "Скорость идентификации" и "Точность верификации" и получила за это $25 тыс. В номинации "Точность идентификации" заняла второе место, первой стала китайская компания Yitu.

"Скорость — это наше преимущество. Наша поисковая система находит нужную фотографию в двухмиллионной базе за 500 наносекунд. Это пять тысячных секунды. Это быстрее, чем щелчок пальцами, — объясняет Кухаренко. — В общем, за одну секунду мы можем 200 раз посмотреть базу из 2 млн снимков. А наш ближайший соперник на конкурсе смог показать скорость — 10 поисков по такой базе за секунду. Все дело в алгоритме — это "мозг" технологии. Мы держим его в секрете, но если объяснять упрощенно: другие системы сравнивают исходный снимок с каждым снимком из этой базы. То есть делают 2 млн сравнений. А если база увеличится до 20 млн фотографий — им придется сравнивать 20 млн раз. Мы придумали индекс, который работает немного по-другому и быстрее всех".

КАКИЕ ВИДЫ БИОМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ СУЩЕСТВУЮТ

Сейчас в мире активно развиваются системы идентификации по лицу и по голосу. Онлайн-сервисы могут совмещать и использовать оба способа. Давно известные системы — верификация по радужке глаз, по отпечаткам пальцев. Еще один продвинутый способ — определение по рисунку вен. Необычных кейсов в этой сфере создается много, например, китайские разработчики придумали систему распознавания по походке.

Точность верификации — это когда система сравнивает две фотографии и определяет: это снимки одного человека или разных людей. "Может применяться на границе, — говорит Артем. — Если человек не похож на свою фотографию в паспорте, то сотрудники тратят время, чтобы его рассмотреть".

Точность идентификации — это "задача, когда нужно найти одного человека в базе", рассказывает Кухаренко. "Точность зависит от объема базы. Чем больше база, тем сложнее искать. По базе в тысячу снимков наша система показывает 99% точности. В сервисе FindFace для "ВКонтакте" поиск идет среди 500 млн фотографий, там точность 80%", — уточняет Артем. 

Искусственный интеллект можно обучать бесконечно, объясняет создатель стартапа. Сегодня в его команде больше 40 человек, есть отдельная лаборатория по глубинному машинному обучению, где роботов учат "думать". Но, по его мнению, 100-процентная безупречность машин — это утопия.

"Я не думаю, что какой-либо робот, который специализируется на биометрии, научится совсем никогда не ошибаться. Но эта технология уже работает лучше человека. Если человеку дать базу из 10 тыс. снимков, его точность через некоторое время от усталости упадет до нуля. Робот останется на том же уровне".

Биометрия в зачаточном состоянии

Биометрия — та сфера, где технологии находятся лишь в зачаточном состоянии, считает Кухаренко, и любые новости о том, что в каких-то китайских городах электронные "контролеры" в автобусах сканируют ваше лицо и списывают плату за проезд с банковского счета, надо делить надвое. 

"Если где-то внедрили пилотный проект, новости могут показывать все в преувеличенном размере, — объясняет Кухаренко. — В Китае умеют масштабировать хорошие технологии, но сказать, что там разработки намного лучше, чем у других, нельзя. В России есть уникальные проекты с биометрией. Наша московская сеть камер, которые распознают лица, самая большая в мире. В Китае, в США есть свои уникальные проекты, но представление о том, что в какой-либо стране все вокруг напичкано системами идентификации людей, неверно".

Успехи россиян в этой сфере связаны не в последнюю очередь с тем, что давно прошли времена, когда у талантливых программистов была стойкая "мечта эмигранта". "Я хочу развивать свою технологию и могу этим заниматься в России, — рассказывает о ценностях 27-летний Кухаренко. — Все хотят работать с интересными задачами. Если не находят здесь возможность — уезжают. Среди моих знакомых в моей профессии уехали, наверное, процентов 20: едут в США, Канаду, Великобританию. Некоторые уже вернулись. Меня с командой тоже несколько раз приглашали в большие компании в разных странах, но у нас и здесь все получается".

Этическая дилемма

На каждом форуме по теме биометрических систем треть программы отводится под обсуждение этических вопросов. Любой человек сможет сфотографировать вас на улице и найти все ваши аккаунты в соцсетях. Здравствуй, навязчивая реклама и ненужное внимание от посторонних людей, говорят критики системы.

Но Кухаренко уверен, что занимается не изобретением социальной бомбы, а созданием продукта, который сделает мир лучше. "Зато эта технология поможет в поиске пропавших людей, в быстром и эффективном поиске преступников", — говорит он.

Что касается возможного навязчивого внимания в социальных сетях, то и здесь у Кухаренко есть ответ: "Есть настройки приватности. По опыту работы нашего сервиса FindFace, если пользователь "ВКонтакте" запрещает показывать его в поиске, то он автоматически "вылетает" из базы и его нельзя найти. Конечно, как и любая технология, система распознавания лиц имеет положительные и отрицательные стороны с этической точки зрения, но здесь больше плюсов".

Промоутер уже может сфотографировать вас на улице, найти аккаунт и отправлять рекламные сообщения. Вероятно, скоро рекламщики начнут чаще пользоваться возможностями биометрии, считают эксперты. "Если промоутер при этом не будет распространять ваше фото, то очень сложно его остановить", — рассказывает о юридической стороне адвокат Сергей Головин.

А вот коллекторы, по его словам, не смогут сфотографировать должника и стыдить его в социальных сетях. "Им запрещено оказание психологического давления на должника и совершение действий, унижающих честь и достоинство", — объясняет он.

Тем временем в мире уже появляются стартапы по созданию технологий, которые позволяют скрыть вас от "всевидящих камер". Есть приложение с картой, которая показывает, где стоят камеры. Есть одежда со специальными отражателями, которые бликуют и не дают "большому брату" вас рассмотреть.

Хотя в городе эти технологии, как объясняют эксперты, внедряют не для того, чтобы следить за мыслями в ваших аккаунтах, а для разработки социальных программ. Чиновники смогут точнее знать количество людей, проживающих в городе, и их потребности. "Городская администрация оказывает множество услуг. Для жителей работают школы, больницы, детские сады, общественный транспорт, — говорит Сергей Головин. — В идеале город мог бы предсказывать загруженность дорог, нагрузку на социальную инфраструктуру и действовать не по факту, а с опережением".

Авторство: 
Авторская работа / переводика

Комментарии

Аватар пользователя qdsspb
qdsspb(12 лет 4 месяца)

  Готовьтесь нечестные люди.

   Столичная сеть состоит из 160 тысяч видеокамер и охватывает 95% подъездов жилых домов, однако пока к системе NtechLab было подключено около 3 тысяч устройств. Алгоритмы анализируют видеозаписи в режиме реального времени, отслеживают перемещения людей, сравнивают результаты поиска с базами данных, устанавливают личность человека, а также его пол и возраст.
 Система на базе нейросетей находит лицо за несколько секунд. "Алгоритм NtechLab предъявляет минимальные требования к изображениям, которые предстоит анализировать, и может работать со съемкой лиц практически с любого ракурса даже при плохом освещении", — цитирует ТАСС основателя компании Артема Кухаренко.
   Доступ к системе имеют 16 тысяч пользователей: в основном это сотрудники правоохранительных органов, государственных и муниципальных организаций. Каждый вход в систему фиксируется.
  За два месяца испытаний технология распознавания лиц помогла задержать шестерых преступников, находившихся в федеральном розыске, рассказал агентству Bloomberg глава департамента информационных технологий Москвы Артем Ермолаев. По его словам, на поддержку системы видеонаблюдения городские власти ежегодно тратят 5 миллиардов рублей. Развертывание технологии NtechLab на все 160 тысяч камер привело бы к трехкратному увеличению расходов, поэтому пока система распознавания лиц применяется избирательно — в тех районах, где она действительно нужна.

Аватар пользователя И-23
И-23(9 лет 2 месяца)

Только *вход* в систему?
Должно журналироваться также каждое действие.
С *публичной* отчётностью.

Аватар пользователя Системник
Системник(9 лет 9 месяцев)

Иш какой! smiley

А как же попродавать налево инфу? Хтож от такого клада откажется? Теперь можно будет разбойничать и пресить лохов с помощью крутой техники, купленной за счёт тех же лохов. laugh

Аватар пользователя Pavel-ch
Pavel-ch(9 лет 6 месяцев)

ага- особенно в смысле "качества" камер отличился Ростелеком, поставлявший 2 года по подъездам Москвы неработающие пустышки.

если так много камер, что почему полиция имеет очередь из глушняков по обворовываниям в подъездах и во дворах ?

"качество камеры не позволяет идентифицировать нападавших" -  не слышали такое по новостям ? может не хотят ? а скорее не могут. тем паче, что хранить это все можно только временно - там поток данных такой...

даже системы по штрафам хранят не видео-поток, а фото-факт, куда уж по камерам и определениям персон.

может это и к лучшему - большой брат смотрит, но иногда он слеповат и глуховат

Аватар пользователя TekBoris
TekBoris(8 лет 11 месяцев)

В моем доме воров нашли именно по камере у двери подъезда. Чурки приехали на авто и сняли с моей машины бампер. Так на камере было видно и номер машины и их рожи. Нашли мой бампер тупо приехав по адресу этих чурок их номера машины. Пошли открыли гараж и там он родимый. Ментам даже напрягаться особо не пришлось. Так что это работает.

Аватар пользователя jawa
jawa(8 лет 1 месяц)

"качество камеры не позволяет идентифицировать нападавших"

В инете полно примеров фоток, с которыми полиции приходится работать.

Представьте себе скрин 1024*768, где один угол выбелен осветительным фонарём, а другой -в темноте, и из этой полутьмы высовывается дико размытая рожа (пикселизация и  jpg - алгоритмы сглаживания во все поля). Как эту рожу можно хоть с чем-то сравнить - я не понял.

 

Вот, кстати, пример видео, мужик с размытой рожей спокойно подошёл ночью и стырил номер:

Аватар пользователя qdsspb
qdsspb(12 лет 4 месяца)

А я милого узнаю по походке...

Как китайцы.

Аватар пользователя IS-80
IS-80(7 лет 6 месяцев)

В инете полно примеров фоток, с которыми полиции приходится работать.

Представьте себе скрин 1024*768, где один угол выбелен осветительным фонарём, а другой -в темноте, и из этой полутьмы высовывается дико размытая рожа (пикселизация и  jpg - алгоритмы сглаживания во все поля). Как эту рожу можно хоть с чем-то сравнить - я не понял.

В плане борьбы с преступлениями очень перспективная штука. Идентифицировать человека можно по лицу, одежде, фигуре, манере движения, маршруту движения, если добавить звук, то по речи. Развивать в сторону камер с более высоким разрешением, большей частотой кадров, с записью звука, с возможностью работы в разным диапазонах спектра электромагнитного излучения, устанавливать больше камер и в оптимальных точках.

Комментарий администрации:  
*** Отключен (систематические немотивированные оскорбления, срач) ***
Аватар пользователя Wasp
Wasp(12 лет 9 месяцев)

Многовато что-то 15 млрд. за такой системы на ежегодную поддержку. Она у них на боевом плутонии работает?

Аватар пользователя homosapenis
homosapenis(12 лет 9 месяцев)

Не за горами распознавание по ДНК. Продвигать эту технологию будут под предлогом борьбы с инфекциями.

Мда, аж тоскливо от такого будущего стало, полная предсказуемость и контроль.

Аватар пользователя Нехороший
Нехороший(8 лет 6 месяцев)

Хреново дело.

А по поводу соцсетей: нормальные люди знают, что это такое и не пользуются, а если уж очень надо, то делают это от чужого имени и проксируют трафик.

Комментарий администрации:  
*** Отключен (розжиг, провокатор, горы инфомусора) ***
Аватар пользователя Некто
Некто(9 лет 1 месяц)

Лажа все это и переживать преждевременно. Чтобы был эффект и должное покрытие надо задействовать городские и прочие охранные камеры. Но с подобных камер это работать не будет, для нормального распознавания должны быть условия близкие к идеальным. Надо чтобы она прямо в рожу смотрела, а не висела на высоте 3-6 метров и распознавала, в основном, макушки и затылки. 

Аватар пользователя Radiohead
Radiohead(9 лет 7 месяцев)

Вот по этому они и подключили всего 3000 камер к этой системе)

Остальные 157 тысяч камер не могут дать им картинку нужного качества.

Так что спим спокойно!

Аватар пользователя Некто
Некто(9 лет 1 месяц)

Думаю все еще проще, наверняка их система не может "переваривать" в реалтайме больше 3000 камер. В идеале само распознавание и индексация морды должна происходить на стороне камеры, а сервер только обрабатывает готовые индексы. Но это явно не тот случай. Ребята так гордятся изобретением индексации изображений как-будто остальные сравнивают снимки всякий раз заново и попиксельно.

Аватар пользователя Dreka
Dreka(8 лет 9 месяцев)

почему везде где только можно говорят Искусственный интеллект - хотя по сути это статистическая модель, которую создаёт и направляет человек. ИИ там и близко не пахнет.

Аватар пользователя jaff_13
jaff_13(12 лет 1 месяц)

за 500 наносекунд. Это пять тысячных секунды.

это действительно Кухаренко сказал?

тогда возникает вопрос - кто ж там на самом деле пишет?

Аватар пользователя Vit999
Vit999(8 лет 9 месяцев)

500 нс и 2 млн. фотографий. Да, что-то тут не сходится. Время на обработку одной фотографии и быстродействие процессора.

Аватар пользователя jaff_13
jaff_13(12 лет 1 месяц)

во-первых, оно же и в последних - 500 нс= 0,5 мкс= 0,0005 мс.

а никак не 5 мс.

ошибочка на 4 порядка  - даже не знаю, как интерпретировать.

Аватар пользователя ильягоряч
ильягоряч(8 лет 2 месяца)
Комментарий администрации:  
*** Отключен (спам, манипуляции) ***
Аватар пользователя jawa
jawa(8 лет 1 месяц)

Наша поисковая система находит нужную фотографию в двухмиллионной базе за 500 наносекунд. Это пять тысячных секунды.

1) 5 наносекунд - это 5 десятимиллионных

2) думаю база находится на жестком диске, а у них только головку с позиционировать по адресу на поверхности диска ~ 0.2-1 миллисекунды, если верить mhdd и прочим Викториям. А пока в базе данных найдёт по запросу что-то - ещё уйдёт сколько-то времени.

3) Передача данных через интернет - тем более не мгновенна(это если политкорректно назвать пинги иногда достигающие полсекунды и более )

Аватар пользователя sgv
sgv(12 лет 7 месяцев)

База кешируется в памяти ОЗУ там и осуществляется поиск.
 

Аватар пользователя mr.Iceman
mr.Iceman(12 лет 9 месяцев)

Вкуривайте GridGain.

Аватар пользователя breduin
breduin(9 лет 5 месяцев)

по моему скромному имху, эти технологии были бы гораздо полезнее в управлении дорожным движением. Чтобы светофоры как-то коррелировали с плотностью потока, для организации реверсивного движения, для управления потоками в масштабах сразу города.

Ситуация, когда широченный проспект забит утром в одну сторону, вечером - в другую, при этом встречная сторона пуста, есть разбазаривание народного государственного добра и личного времени граждан.

Разработчики систем лицераспознавания могут предложить заинтересованным лицам, например, администрации района/города, непосредственно измерять коэффицент счастья жителей путем подсчета лиц с улыбками.