Специалисты из исследовательского отдела компании Google представили коллегам новый метод детектирования пешеходов с помощью нейросетей. Метод показывает впечатляющие результаты – человеческую фигуру удается распознать с точностью 73,8% при скорости съемки 15 FPS по тесту Calthech Pedstrian, который использует базу данных из 50 000 распознанных и отмеченных пешеходов в различных условиях.
Результаты теста далеки от совершенства, но смотрятся весьма неплохо на фоне альтернативных разработок. К примеру, метод распознавания под названием WordChannels при скорости съемки 16 FPS показывает точность 57,7%. Другая методика – VeryFast при более высокой скорости съемки (до 100 FPS) дает только 50% точности.
Группа исследователей из Google запускала систему машинного зрения на устаревшем графическом ускорителе от NVidia – K20 Tesla GPU. Использование GPU-ускорителей в нейросетях сейчас является перспективным направлением в решении сложных задач в режиме реального времени.
На данный момент приоритетной задачей группы исследователей Google Research является увеличение точности распознавания без ущерба для скорости съемки. И это очень сложная задача, поскольку системе приходится работать в реальном времени и динамическом окружении.