29 июля 2014
Машинное зрение в 3D: технологии, алгоритмы, возможности. Часть 6. Компьютерное зрение сегодня: успехи и перспективы
А.Ю. Соколов,
Начальник отдела перспективных разработок
компании Вокорд
Д.Н. Заварикин
Президент ГК Вокорд
Итак, мы познакомились с алгоритмами компьютерного трехмерного зрения, основными направлениями и методами в этой области.
Давайте вернемся к исходному вопросу, с которого начиналась статья: удалось ли человеку создать систему, которая лучше, точнее и правильнее оценивает реальность по стереоизображениям и, главное, может быстрее и правильнее принять требуемое решение?
Достижения компьютерного зрения на сегодняшний день огромны. Достигнутая точность вычисления трехмерной сцены роботом может быть сопоставима и даже выше, чем у человека. Приведем несколько примеров.
Компьютер играет в настольный теннис
В этом проекте компьютерная программа с помощью системы камер, установленных в помещении, вычисляет положение, скорость, траекторию теннисного шарика. Дальше система принимает решение и управляет механической ракеткой для игры в пинг-понг (рис. 27)

Рис. 27 Робот играет в настольный теннис
Видео в реальном времени можно посмотреть здесь:
Стерео камеры для безопасности движения автомобиля.
Стереокамера, установленная спереди автомобиля, оценивает расстояние и предотвращает столкновения с пешеходом [16], Рис 28. Скорость реакции и точность вычисления расстояния от машины до человека – заметно выше. Поставьте себя на место водителя: насколько точно Вы сможете в уме «оценить» расстояние до впереди идущего автомобиля или препятствия, вовремя среагировать на выскочившего на дорогу пешехода? Компьютер это делает точно, практически мгновенно, и принимает обоснованное решение о торможении с учетом текущей скорости автомобиля [16].

Рис. 28. Стереосистема для предотвращения столкновения с пешеходом [16].
Робототехника
Компьютерное стереозрение имеет огромное значение для управления автоматическими аппаратами, особенно в условиях, когда человек не имеет возможности непосредственно управлять роботом. На марсоходе «Оpportunity» установлена система камер [17], которые вычисляют трехмерную сцену и определяют безопасную траекторию, см Рис. 29.

Рис. 29. Трехмерная сцена, вычисленная на «Opportunity»
Автоматическое распознавание лица
В настоящий момент у нас нет доступной информации о сравнении трехмерной компьютерной системы распознавания лица со способностями человека. Но вот что можно сказать про двумерное распознавание (очевидно, что трехмерная система еще добавляет информацию для компьютера, и должна теоретически улучшать результат):
В 2006 году институтом NIST было проведено исследование, в котором эффективность распознавания по фотографии машинным алгоритмом сравнивалась с человеческим [18]. Был сделан вывод, что для простых изображений разработанные учеными лучшие алгоритмы уже могут превосходить распознавание человеком. А вот для сложных фотографий, в которых меняется ракурс, освещение, мимика человека, компьютерные алгоритмы по-прежнему заметно проигрывают, см. Рис. 30.

Рис. 30 Сравнение алгоритмов распознавания с человеком. По материалам [18]
В 2014 году было заявлено, [19] что автоматическое распознавание обогнало человека. В этом эксперименте было собрано для сравнения примерно 13 тыс. изображений лиц из интернета у 6 тыс. человек. Изображения характеризовались сложным ракурсом, разными условиями съемки. Некоторые примеры изображений одинаковых людей приведены на рисунке 31.Вы можете уверенно решить, что на соседних снимках изображены одинаковые люди?


Рис. 31. Примеры фотографий в тестах автоматического распознавания в сравнении с распознаванием человеком [19]
Машинный алгоритм продемонстрировал точность распознавания 98.5%, а человек – на 1% меньше [19].
Таким образом, компьютерное зрение уже во многих областях стремительно догнало и практически превышает способности человека. По-видимому, мы стоим на пороге новой эры, в которой трехмерное зрение и алгоритмы машинного распознавания образов будут занимать лидирующее место и внедряться повсеместно в нашу обычную жизнь. Хотелось бы верить, что новые технологии будут использоваться на благо человечества, так, как это было когда-то сформулировано в известных законах робототехники писателем-фантастом Айзеком Азимовым. Но, к сожалению, человечество с упорством продолжает использовать новые идеи и технологии для разработки оружия. Хотели бы Вы в ближайшем будущем встретить на улице роботов, таких как на видео по ссылкам ниже, которые дополнительно к способностям передвигаться и нести оружие будут уметь распознавать людей, производить сравнение обнаруженного лица в базе данных с вероятностью лучше, чем у человека?
Литература.
[16] Sergiu Nedevschi, Member, IEEE, Silviu Bota, and Corneliu Tomiuc. IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, VOL. 10, NO. 3, SEPTEMBER 2009 Stereo-Based Pedestrian Detection for Collision-Avoidance Applications http://is.ulsan.ac.kr/files/announcement/315/StereoBasedPedestrianDetection.pdf
[17] http://marsrover.nasa.gov/technology/is_autonomous_mobility.html
[18] http://biometrics.nist.gov/cs_links/face/frgc/FaceRecognitionAlgorithmsSurpassHumans.pdf
[19] [https://medium.com/the-physics-arxiv-blog/2c567adbf7fc.]