Программисты из Калифорнийского университета в Сан-Диего объединили сложные алгоритмы компьютерного зрения и нейрокомпьютерного интерфейса, чтобы найти мины в гидроакустических изображениях океана. Исследование показывает, что новый метод значительно ускоряет обнаружение, по сравнению с существующими методами, преимущественно визуального осмотра экспертом по обнаружению мин.
«Компьютерное зрение и человеческое зрение — у каждого есть свои сильные стороны, которые объединяются, чтобы работать вместе, — сказал Райан Кастнер, профессор компьютерных наук в школе Джейкобс Инжиниринг в Калифорнийском университете в Сан-Диего. — Например, компьютеры очень хороши в поиске тонких, но математически точных структур, а люди имеют способность рассуждать о вещах более целостным образом, чтобы увидеть общую картину. Мы показали, что объединение этих подходов повышает производительность».
Исследователи работали с военно-космической и военно-морской боевыми системами Тихоокеанского центра в Сан-Диего для сбора данных 450 гидроакустических изображений, содержащих 150 инертных ярко-оранжевых мин, установленных в тестовых полях в заливе Сан-Диего. Данные были собраны с подводного аппарата, оснащенного гидролокатором.
В ходе исследования шесть испытуемых показали полный набор данных, прежде чем он был обнаружен с помощью алгоритмов компьютерного зрения. Затем они проверили набор данных изображений с помощью минно-поисковых алгоритмов компьютерного зрения. После показали результаты участникам, оснащенным электроэнцефалограммой. Испытуемые обнаружили мины гораздо быстрее, когда изображения уже были обработаны с помощью алгоритмов.
Алгоритмы – это ряд классификаторов, работающих последовательно, чтобы улучшить скорость и точность. Классификаторы предназначены для захвата изменения в интенсивности пикселей между соседними участками изображения. Система ставит перед собой цель обнаружить 99,5 процентов истинных и генерировать только 50 процентов ложных срабатываний при каждом проходе через классификатор. В результате истинные результаты остаются высокими, в то время как ложные срабатывания уменьшаются с каждым проходом.
«Человеческое восприятие может делать вещи, которые мы не можем выполнить с компьютерным зрением, — говорит Крис Барнгровер, член научно-исследовательской группы Кастнера. — Но компьютерное зрение не устает. Таким образом, нам показалось естественным объединить их вместе».