Адрес: 142704, г. Москва, пос. Мосрентген, Институтский проезд, д. 2

Новые алгоритмы сжатия для охранных систем видеонаблюдения

На страже цифровое видео


"Стандарты, разработанные для сжатия видеосигнала, предоставляют сегодня новые возможности для улучшения качества работы систем цифрового видеонаблюдения. Это значительно повышает актуальность применения новых стандартов сжатия в охранных си­стемах видеонаблюдения ..."



Стандартизированные алгоритмы


Утверждение о том, что в охранных системах видеонаблю­дения применяются наиболее перспективные цифровые технологии, вряд ли сегодня может быть подвергнуто сомнению.
В цифровых системах видеосигнал, как известно, преобразуется в последовательность бит, которая сжимается за счет небольшой потери в спектре сигнала и далее за счет удаления статистической пространственной и временной избыточности ин­формации.

В настоящее время для сжатия видео существует несколько различных стандартов. Назовем основ­ные из них:

MJPEG - стандарт, подобный стандарту для сжатия статических картинок JPEG, но в отличие от последнего MJPEG предназначен для видео. Каждый кадр при этом сжимается независимо.

MPEG-1 и 2 - первые стандарты с компенсацией движения между кадрами - характеризуются невысокой степенью сжатия. Сейчас использу­ются в цифровом телевизионном вещании сов­местно с сопутствующими стандартами для пе­редачи данных по наземным, спутниковым и мобильным каналам: у нас и в Европе DVB-T, S, Н, в США - ATSC. Для приемлемой передачи сигнала телевизионного разрешения достаточ­но канала 6-8 Мбит/с.

Н.261 - первый "реальный" стандарт для цифро­вых видеоконференций, транслируемых по уз­кополосным каналам связи. В нем используется компенсация движения между кадрами. Разре­шение видеокартинки QCIF (176 х 144) либо CIF (352 х 288). Типичные потоки для CIF-разрешения и последовательностей с небольшим дви­жением ("говорящая голова") - не более 380 кбит/с.

Н.263 - модификация Н.261 с улучшенной системой кодирования коэффициентов дискрет­ного косинусного преобразования (ДКП). Ком­пенсация движения с точностью до 1/2 пикселя между кадрами. Оба стандарта (Н.261 и Н.263) составляют основу протокола Н.323, являющимся базовым для видеоконференции по IP.

Н.263++ – дальнейшее развитие Н.263. Стандарт реализует большое сжатие за счет усложнения математических преобразований. Добавлена двунаправленная компенсация движения между кадрами. Н.263++дополнен различны­ми приложениями для повышения эффектив­ности, такими, как внутрикадровое предсказа­ние элементов изображения, компенсация дви­жения со взвешенными коэффициентами и др.

MPEG-4 - стандарт, основанный на Н.263++. Главным образом он предназначен для хране­ния и передачи видео в Интернете. Хорошее ка­чество видео телевизионного разрешения до­стигается при потоке 2-4 Мбит/с.

Н.264 (или иначе MPEG-4, часть 10) - новый стандарт сжатия. Рассмотрим этот стандарт ни­же.

MPEG7 и MPEG21 - предназначены для хране­ния мультимедийной информации, сжатой другими алгоритмами, но эти стандарты не яв­ляются алгоритмами для сжатия самого видео.

Перечисленные стандарты имеют дополнительно собственные небольшие отличия (профили), по принципу "от более простого к более сложному". Например, начиная с Н.263 и выше может ис­пользоваться как относительно простой кодер Хаффмана, в котором каждый передаваемый символ занимает целое число бит, так и арифме­тический кодер (позволяющий кодировать каж­дый символ дробным количеством бит). Ариф­метический кодер повышает сжатие на 15-20%, но требует значительно больших вычислительных ресурсов.



Алгоритм-победитель


В 1990-х гг. международным сообществом был выдвинут долгосрочный проект H.26L по разра­ботке "самого лучшего" (наукоемкого) алгоритма для сжатия видео. Для его реализации заинтере­сованные организации представили свои концеп­ции в комитет по H.26L. Рассматривались самые разные идеи - вейвлеты, афинные преобразова­ния, фрактальные методы и т.д.

Уже к 2000 г. был отобран "победивший" алго­ритм, который основывался на блочном кодиро­вании, доведенном до совершенства. В этом но­вом стандарте видеоизображение кодируется блоками переменного размера (начиная от 16 х 16 пикселей до самого мелкого представления блоками по 4 х 4 пикселей). В нем используется двухуровневое иерархическое кодирование коэффициентов, новая схема внутрикадрового предсказания, включая предсказания по диагонали, а также новая схема межкадрового предсказания с выбором наилучшего предыдущего кадра, изменен основной алгоритм ДКП, внесены и некоторые другие изменения. В результате был соз­дан новый стандарт Н.264, который сейчас вошел в MPEG-4 в виде дополнительной главы 10 - Ad­vanced Video Coding. Более подробно основы Н.264 рассмотрены в труде Я. Ричардсона "Видео­кодирование".

По данным различных исследований, при равном визуальном качестве Н.264 обеспечивает при­мерно на 40% большее сжатие по сравнению с MPEG-4. Принято считать, что в настоящее вре­мя Н.264 является самым эффективным алгорит­мом сжатия видео (одновременно и самым слож­ным для реализации). Основные черты нового стандарта - низкий уро­вень шума и высокая четкость контуров при сверхвысокой степени сжатия. Эти качества дела­ют данный стандарт особенно интересным для применения в системах охранного наблюдения (задача распознавания контуров). Названный стандарт пригоден также и для высо­кокачественного видео и для телевидения высо­кой четкости. Уже сейчас на рынке появились ап­паратные кодеры Н.264 для передачи видео по IP-сетям в виде отдельных устройств, компьютер­ных плат и интегральных микросхем.



Нестандартные алгоритмы


Помимо стандартизированных алгоритмов для сжатия видео существуют собственные разработ­ки различных компаний. К таким разработкам, например, относятся кодер Windows Media ком­пании Microsoft и закрытый алгоритм компании RealVideo. Качество сжатия примерно соответ­ствует качеству MPEG-4.

Некоторые компании, представленные на рынке охранных систем видеонаблюдения (среди российских - ISS и ITV), используют алгоритмы сжатия видео с применением вейвлет-преобразований. Вейвлет-методы наиболее подходят для изо­бражений высокого пространственного разре­шения, характеризующегося большой степенью корреляции между соседними пикселями. Обычно для кодирования кадра используется несколько последовательных вейвлет-преобра­зований. Основу вейвлет-методов составляет великолепная локализация базисных функций, как в обычном так и в частотном пространстве. Кроме того для вейвлетов отсутствуют блочные искажения, присущие MPEG кодерам.

Использование вейвлет-алгоритмов для сжатия видео имеет тем не менее свои сложности связанные с необходимостью применения фильтров преобразования в большой области кадра над большим числом пикселей (именно при этом при­менение вейвлетов наиболее эффективно), что трудно согласуется с известными блочными мето­дами компенсации движения между кадрами. Не все участки изображения выгодно кодировать с компенсацией движения, что усложняет использование фильтров без разрывов для большого числа пикселей. Кроме того, даже для одного ста­тического кадра при невысоком разрешении по­рядка телевизионного и ниже распространенные вейвлет-алгоритмы (например, известный алго­ритм Zero-Tree) могут быть менее эффективны, чем предложенная в Н.264 двухуровневая схема кодирования статического кадра.

Между вейвлетами и блочным кодированием идет борьба - большие картинки лучше сжи­маются вейвлетами, а видеопоследовательно­сти - кодерами типа MPEG (сейчас - Н.264). Одним из примеров эффективных алгоритмов сжатия на основе вейвлетов, реализующих ком­пенсацию движения между кадрами, является программный кодер компании ИДМ. При отсутавии компенсации движения вейвлет -кодеки заведомо уступают алгоритмам MPEG-4 и Н.264 по параметру качество/степень сжатия.



В заключение


Для кодирования видео сейчас существует боль­шой набор алгоритмов. Чем сложнее и совре­меннее алгоритм, тем лучшее качество достигается при заданном сжатии. Практически все со­временные алгоритмы используют компенсацию движения как средство для улучшения сжатия. Появление на рынке оборудования, в котором используется стандарт сжатия Н.264, предоста­вляет новые возможности для улучшения каче­ства передачи видео в охранных системах ви­деонаблюдения.



А.Ю. Соколов
ведущий разработчик, к.ф.-м.н.
ЗАО "Компания Безопасность"
Читайте также: