Автоматическое выделение движущихся объектов в последовательности видеоизображений – это одна из важнейших задач анализа изображений. В основе большого количества методов выделения движущихся объектов лежит принцип выявления изменений изображений во времени.

Имеется множество практически важных ситуаций, в которых возникает задача автоматического обнаружения, локализации и классификации стабильных изменений, имеющих место в обрабатываемой последовательности кадров. При этом решение необходимо принимать в реальном масштабе времени, т.е. в темпе поступления кадров изображения. В качестве объектов могут выступать люди, автомашины, детали на конвейере и т.п.

В данной работе задача обнаружения и выделения движущегося фрагмента решается на основе анализа изменений фоновой и шумовой составляющих наблюдаемой сцены в последовательности кадров. Предполагается, что система представляет собой неподвижную видеокамеру, подключенную к компьютеру, и. следовательно, сдвиг изображения в целом отсутствует.

Считаем, что дискретное изображение объекта представляет собой связное множество точек с неизвестными яркостями. Под связностью здесь и далее будем понимать расположение точек объекта в соседних ячейках дискретного растра. При наблюдении за объектом, перемещающемся на сложном фоне, наиболее характерной является ситуация, когда фоновое изображение расположено в пространстве дальше, чем объект. В этом случае на наблюдаемом изображении объект слежения, перемещаясь, закрывает собой участок фона, расположенный за ним. В основу алгоритма автоматического обнаружения и выделения стабильных изменений, возникающих в последовательности кадров, легла идея оценки и последующего анализа стабильных изменений, возникающих в каждой точке изображения во времени (Рис. 1).

Наблюдая за изменениями, имеющими место на изображении во времени, мы имеем возможность оценить как сам фон, так и искажающую его помеху. Таким образом, появляется реальная u1074 возможность отделить полезный сигнал, создаваемый динамическим объектом, от шума и относительно стабильного фонового уровня.

Поэтому, в разработанном алгоритме применяется параллельное вычисление оценок уровней яркости точек фона и оценок величины изменения уровней яркости точек фона.

схема проекта в области проектирования систем безопасности
Рис. 1. Последовательность статических изображений


Оценки уровней яркости точек фона ( g( i, j,n) формируем путем рекуррентного межкадрового усреднения одноименных точек. Т.е. получаем сглаженное («эталонное») изображение фона:

уравнение 1


где l(i, j,n) - уровень яркости точки (i, j) в n -ом кадре наблюдаемой сцены; β1 - параметр экспоненциального рекурсивного фильтра, выбираемый в диапазоне 0÷1. Для выяснения характера возможных изменений уровней яркости точек фона во времени, вычисляем оценки величины изменения уровней яркости точек фона μ

уравнение 2


где β - параметр экспоненциального рекурсивного фильтра, выбираемый в диапазоне 0÷1. При β = 1 в качестве оценки величины изменения уровней яркости точек фона выбирается величина изменения уровней яркости точек фона взятая из первого кадра, при β = 0 осуществляется покадровая смена оценок величины изменения уровней яркости точек фона, а при 0 < β < 1 оценки величины изменения уровней яркости точек фона формируются путем межкадрового усреднения. При проведении вычислений выбиралось равным 0,98 т.к. при этом удается оптимально сочетать возможность обновления эталона с подавлением помех, имеющих место на обрабатываемом изображении.

Расчет оценок изменения величины уровня яркости наряду с оценками уровня яркости, ведется независимо для каждой точки наблюдаемого изображения. Таким образом, на основе полученных оценок уровня яркости и оценок величины изменения уровня яркости, в каждой точке принимается решение о принадлежности ее к фону или предположительно, объекту. Т.е. можно записать

уравнение 3


где ( h( i, j,n) - уровень яркости точки, принадлежащей изображению объекта; k - некоторый пороговый коэффициент. Так как μΔ , по существу, представляет собой оценку дисперсии величины изменения уровня яркости, то значение k целесообразно принимать на уровне 3.

УДК 519.688
Автор: И.Б. Кондратенков

Институт проблем передачи информации им. А.А. Харкевича РАН
Читайте также: