Статьи

Распознавание лиц с помощью нейронных сетей уже перестало быть предметом научной фантастики и благополучно перешло в реальный мир, став при этом одним из самых популярных изобретений в области программного обеспечения для анализа изображений. Хотя многие люди до сих пор считают, что это зловещая технология, которая, подобно «большому брату» из романа-антиутопии Джорджа Оруэлла, помогает собирать данные о населении страны, практическое применение ПО для распознавания лиц на самом деле находится за пределами вселенной книги, с которой большинство людей его ассоциируют. 

По иронии судьбы многие из программ разрабатываются как раз для защиты населения от злоумышленников. Давайте поговорим о том, что такое система распознавания лиц, для чего она нужна, как работает и где применяется в современном мире.

"

Что такое система распознавания лиц? 

Технология, созданная для распознавания и идентификации человеческих лиц на изображениях или видео, которая позволяет после формирования отпечатка лица найти правильные совпадения с ним в большом массиве данных.  

Как устроена система? 

Идентифицирование биометрических черт происходит в несколько этапов:  

  • Обнаружение

При подключении технологии распознавания лиц к системе видеонаблюдения, программа начинает сканировать поле видеозахвата на предмет, по очертаниям напоминающий лицо. При обнаружении такового, нейросеть переходит к следующему этапу, на котором оцениваются положение, ориентацию и размер головы. 

  • Стандартизация

Изображение захваченного лица масштабируется и поворачивается таким образом, чтобы его можно было конвертировать в формат, требуемый для последующей регистрации. Программа считывает геометрию лица, выделяя ключевые факторы, такие как: расстояние между глазами, подбородком и лбом, толщину губ и носа и т. д. Результатом обработки является создание лицевой подписи. 

  • Представление

После формирования лицевой подписи система преобразовывает ее в уникальный код. Такое кодирование облегчает вычислительное сравнение вновь полученной информации с сохраненными базами ранее записанных данных.

  • Сопоставление

На заключительном этапе вновь полученные данные лица сравниваются с сохраненными. В том случае, если они совпадают с одним из изображений, программное обеспечение уведомляет об этом конечного пользователя.

Все ли так просто? 

Во время процесса распознавания лиц на изображениях или видео возникают различные проблемы, которые нелегко преодолеть. Вот некоторые из них: 

  • Освещение

В зависимости от освещения, система может не сработать должным образом.

"

  •  Поза

Иногда из-за позы, которую человек принимает во время захвата изображения, лицо не попадает в кадр. 

"

  •  Возраст 

Некоторые части лица продолжают расти на протяжении всей жизни, поэтому лицо одного и того же человека в разном возрасте, возможно, будет отличаться на фотографиях, имеющихся в базе. 

"

  •  Окклюзия

Из-за маски, солнцезащитных очков, прически, бороды, косметики и т. д. могут быть частично скрыты некоторые черты лица. 

"

  •  Качество изображений

Если изображения взяты из различных источников и стандартизированы, то вполне вероятно, придется изменить разрешение для некоторых из них, что негативно скажется на их качестве.

"

Чтобы справиться со всеми этими проблемами, конкретный способ распознавания лиц чаще всего использует несколько алгоритмов и методов для стандартизации данных и улучшения возможностей распознавания.

Для чего нужна эта технология? 

Программное обеспечение для распознавания лиц имеет бесчисленное множество применений в коммерческом сегменте, а также в сфере безопасности и видеонаблюдения. 

Существуют две основные задачи, которые выполняют продукты по распознаванию лиц. 

  • верификация: хорошим примером является разблокировка смартфонов по идентификации лица;
  • распознавание: часто используется в системах безопасности и наблюдения. (например, распознавание лиц правоохранительными органами). 

Перейдем от теории к практике.

Где применяется? 

Безусловно, ведущей страной в этой области является Китай, где соблюдение законов на всей территории страны почти полностью контролирует искусственный интеллект. Сегодня довольно сложно найти место в любом городе Китая, где нет камер. В 2015 году Министерство общественной безопасности этой страны начало свою работу по созданию самой обширной в мире базы данных распознавания лиц, а уже сегодня частота ошибок нейросетей составляет лишь 0,008%, то есть только 8 из 1000 сканирований могут быть идентифицированы неверно. Для понимания масштабов, Китай — это 1,4 миллиарда населения, которое контролируется более 176 миллионами камер.

Однако контроль за соблюдением общественного порядка — далеко не единственный способ применения технологии. Если не упоминать про социальные рейтинги, информацию о которых можно найти на различных форумах, то многие рестораны общественного питания в Китае уже проводят платежные операции с помощью всего одного взгляда в камеру, а некоторые компании в стране пошли еще дальше и сделали цифровой отпечаток лица единственным возможным шансом попасть в офис. 

В России в рассматриваемой области пока нет столь масштабных экспериментов национального уровня. На сегодняшний день только в Москве развернута сеть из 105 тысяч смарт-устройств, благодаря которым за 10 дней новогодних праздников в этом году удалось задержать 34 злоумышленника, находящихся в федеральном розыске.

Стоит заметить, что эта технология новая для нашей страны, и поэтому только начинает использоваться в различных организациях. Например,  московским метрополитеном, который, может быть, когда-то возьмет на вооружение и опыт китайских коллег.

"

В дополнение, сегодня некоторые отечественные IT-компании применяют нейросети, которые помогают идентифицировать и отследить преступника.  Так,  данные на современных гаджетах  — прямой цифровой след, который оставляет за собой любой человек. Полученная из устройств информация, чаще всего, содержит тысячи фото и видео, которые можно исследовать. 

Современное программное обеспечение «Мобильный Криминалист Эксперт Плюс»  позволяет после извлечения данных из устройства не только проанализировать лица на изображениях и соотнести их с контактами, но и сгруппировать лица, похожие друг на друга, а также выявить знакомых между собой людей по фотографиям.  

Результаты исследования находятся в разделе «Лица», в котором всего по одному клику также можно просмотреть все изображения в извлечении, относящиеся к определенной персоне. 

"

Более того, нейросети используются в этом программном продукте не только для работы с лицами. «МК Эксперт Плюс» обладает возможностью оптического распознавания текста на изображениях. 

"

А также выявляет на них угрозы со скоростью до 15 изображений в секунду. 

Всего выделяется 14 категорий угроз: 

  • порнография;
  • экстремизм;
  • насилие;
  • наркотики;
  • алкоголь;
  • оружие;
  • азартные игры;
  • нагота;
  • жестокое обращение с детьми;
  • удостоверения личности;
  • деньги;
  • транспорт;
  • чаты;
  • документы. 

"

Несмотря на то, что искусственные нейронные сети прочно вошли в нашу жизнь, для России система распознавания лиц — это все еще новая технология, и большая часть работы, проводимой в этой области, носит экспериментальный характер и направлена, в основном, только на первичное обучение алгоритмов. Тем не менее, сегодня некоторые IT-компании уже активно внедряют эту технологию в системы видеонаблюдения и в свои программные продукты, которые используются для исследования данных из цифровых носителей правоохранительными органами.