Новый метод повышает точность технологий компьютерного зрения

Обработка изображений и компьютерное зрение важны для множества приложений, от автономных транспортных средств до обнаружения аномалий в медицинских изображениях.Технологии компьютерного зрения используют алгоритмы для сегментации или выделения объектов на изображении. Например, выделение контура пешехода на фоне оживленной улицы.Эти алгоритмы полагаются на определенные параметры — запрограммированные значения — для сегментации изображений.

Например, если есть изменение цвета, которое пересекает определенный порог, программа компьютерного зрения интерпретирует его как разделительную линию между двумя объектами. И этот конкретный порог — один из параметров алгоритма.Но здесь есть проблема. Даже небольшие изменения параметра могут привести к очень разным результатам компьютерного зрения.

Например, если человек, переходящий улицу, входит и выходит из тени, это повлияет на цвет, который видит компьютер, и компьютер может затем «увидеть» исчезающего и вновь появляющегося человека или интерпретировать этого человека и тень как одиночный большой объект, например, автомобиль.«Некоторые параметры алгоритма могут работать лучше, чем другие, в любом заданном наборе обстоятельств, и мы хотели знать, как объединить несколько параметров и алгоритмов, чтобы создать лучшую сегментацию изображения с помощью программ компьютерного зрения», — говорит Эдгар Лобатон, доцент кафедры электротехники и компьютеров. инженер в NC State и старший автор статьи о работе.

Лобатон и доктор философии. Студент Цянь Гэ разработал методику, которая собирает данные сегментации из нескольких алгоритмов и объединяет их, создавая новую версию изображения.

Это новое изображение затем снова сегментируется в зависимости от того, насколько постоянным является любой данный сегмент во всех исходных алгоритмах ввода.«Визуально результаты этого метода выглядят лучше, чем любой отдельно взятый алгоритм», — говорит Лобатон. «Однако характер этой работы не согласуется с существующими метриками для измерения точности компьютерного зрения. Поэтому нам необходимо разработать новые средства оценки точности компьютерного зрения — это наш будущий проект».Лобатон отмечает, что новую технику сегментации изображения можно использовать в реальном времени, обрабатывая 30 кадров в секунду.

Частично это связано с тем, что большинство вычислительных шагов можно выполнять параллельно, а не последовательно.Документ «Сегментация изображений на основе консенсуса посредством топологической персистентности» будет представлен 1 июля на конференции IEEE по компьютерному зрению и распознаванию образов в Лас-Вегасе, штат Невада.

Работа была выполнена при поддержке Национального научного фонда в рамках гранта CNS- 1239323.