На страже цифровое видео


"Стандарты, разработанные для сжатия видеосигнала, предоставляют сегодня новые возможности для улучшения качества работы систем цифрового видеонаблюдения. Это значительно повышает актуальность применения новых стандартов сжатия в охранных си­стемах видеонаблюдения ..."



Стандартизированные алгоритмы


Утверждение о том, что в охранных системах видеонаблю­дения применяются наиболее перспективные цифровые технологии, вряд ли сегодня может быть подвергнуто сомнению.
В цифровых системах видеосигнал, как известно, преобразуется в последовательность бит, которая сжимается за счет небольшой потери в спектре сигнала и далее за счет удаления статистической пространственной и временной избыточности ин­формации.

В настоящее время для сжатия видео существует несколько различных стандартов. Назовем основ­ные из них:

MJPEG - стандарт, подобный стандарту для сжатия статических картинок JPEG, но в отличие от последнего MJPEG предназначен для видео. Каждый кадр при этом сжимается независимо.

MPEG-1 и 2 - первые стандарты с компенсацией движения между кадрами - характеризуются невысокой степенью сжатия. Сейчас использу­ются в цифровом телевизионном вещании сов­местно с сопутствующими стандартами для пе­редачи данных по наземным, спутниковым и мобильным каналам: у нас и в Европе DVB-T, S, Н, в США - ATSC. Для приемлемой передачи сигнала телевизионного разрешения достаточ­но канала 6-8 Мбит/с.

Н.261 - первый "реальный" стандарт для цифро­вых видеоконференций, транслируемых по уз­кополосным каналам связи. В нем используется компенсация движения между кадрами. Разре­шение видеокартинки QCIF (176 х 144) либо CIF (352 х 288). Типичные потоки для CIF-разрешения и последовательностей с небольшим дви­жением ("говорящая голова") - не более 380 кбит/с.

Н.263 - модификация Н.261 с улучшенной системой кодирования коэффициентов дискрет­ного косинусного преобразования (ДКП). Ком­пенсация движения с точностью до 1/2 пикселя между кадрами. Оба стандарта (Н.261 и Н.263) составляют основу протокола Н.323, являющимся базовым для видеоконференции по IP.

Н.263++ – дальнейшее развитие Н.263. Стандарт реализует большое сжатие за счет усложнения математических преобразований. Добавлена двунаправленная компенсация движения между кадрами. Н.263++дополнен различны­ми приложениями для повышения эффектив­ности, такими, как внутрикадровое предсказа­ние элементов изображения, компенсация дви­жения со взвешенными коэффициентами и др.

MPEG-4 - стандарт, основанный на Н.263++. Главным образом он предназначен для хране­ния и передачи видео в Интернете. Хорошее ка­чество видео телевизионного разрешения до­стигается при потоке 2-4 Мбит/с.

Н.264 (или иначе MPEG-4, часть 10) - новый стандарт сжатия. Рассмотрим этот стандарт ни­же.

MPEG7 и MPEG21 - предназначены для хране­ния мультимедийной информации, сжатой другими алгоритмами, но эти стандарты не яв­ляются алгоритмами для сжатия самого видео.

Перечисленные стандарты имеют дополнительно собственные небольшие отличия (профили), по принципу "от более простого к более сложному". Например, начиная с Н.263 и выше может ис­пользоваться как относительно простой кодер Хаффмана, в котором каждый передаваемый символ занимает целое число бит, так и арифме­тический кодер (позволяющий кодировать каж­дый символ дробным количеством бит). Ариф­метический кодер повышает сжатие на 15-20%, но требует значительно больших вычислительных ресурсов.



Алгоритм-победитель


В 1990-х гг. международным сообществом был выдвинут долгосрочный проект H.26L по разра­ботке "самого лучшего" (наукоемкого) алгоритма для сжатия видео. Для его реализации заинтере­сованные организации представили свои концеп­ции в комитет по H.26L. Рассматривались самые разные идеи - вейвлеты, афинные преобразова­ния, фрактальные методы и т.д.

Уже к 2000 г. был отобран "победивший" алго­ритм, который основывался на блочном кодиро­вании, доведенном до совершенства. В этом но­вом стандарте видеоизображение кодируется блоками переменного размера (начиная от 16 х 16 пикселей до самого мелкого представления блоками по 4 х 4 пикселей). В нем используется двухуровневое иерархическое кодирование коэффициентов, новая схема внутрикадрового предсказания, включая предсказания по диагонали, а также новая схема межкадрового предсказания с выбором наилучшего предыдущего кадра, изменен основной алгоритм ДКП, внесены и некоторые другие изменения. В результате был соз­дан новый стандарт Н.264, который сейчас вошел в MPEG-4 в виде дополнительной главы 10 - Ad­vanced Video Coding. Более подробно основы Н.264 рассмотрены в труде Я. Ричардсона "Видео­кодирование".

По данным различных исследований, при равном визуальном качестве Н.264 обеспечивает при­мерно на 40% большее сжатие по сравнению с MPEG-4. Принято считать, что в настоящее вре­мя Н.264 является самым эффективным алгорит­мом сжатия видео (одновременно и самым слож­ным для реализации). Основные черты нового стандарта - низкий уро­вень шума и высокая четкость контуров при сверхвысокой степени сжатия. Эти качества дела­ют данный стандарт особенно интересным для применения в системах охранного наблюдения (задача распознавания контуров). Названный стандарт пригоден также и для высо­кокачественного видео и для телевидения высо­кой четкости. Уже сейчас на рынке появились ап­паратные кодеры Н.264 для передачи видео по IP-сетям в виде отдельных устройств, компьютер­ных плат и интегральных микросхем.



Нестандартные алгоритмы


Помимо стандартизированных алгоритмов для сжатия видео существуют собственные разработ­ки различных компаний. К таким разработкам, например, относятся кодер Windows Media ком­пании Microsoft и закрытый алгоритм компании RealVideo. Качество сжатия примерно соответ­ствует качеству MPEG-4.

Некоторые компании, представленные на рынке охранных систем видеонаблюдения (среди российских - ISS и ITV), используют алгоритмы сжатия видео с применением вейвлет-преобразований. Вейвлет-методы наиболее подходят для изо­бражений высокого пространственного разре­шения, характеризующегося большой степенью корреляции между соседними пикселями. Обычно для кодирования кадра используется несколько последовательных вейвлет-преобра­зований. Основу вейвлет-методов составляет великолепная локализация базисных функций, как в обычном так и в частотном пространстве. Кроме того для вейвлетов отсутствуют блочные искажения, присущие MPEG кодерам.

Использование вейвлет-алгоритмов для сжатия видео имеет тем не менее свои сложности связанные с необходимостью применения фильтров преобразования в большой области кадра над большим числом пикселей (именно при этом при­менение вейвлетов наиболее эффективно), что трудно согласуется с известными блочными мето­дами компенсации движения между кадрами. Не все участки изображения выгодно кодировать с компенсацией движения, что усложняет использование фильтров без разрывов для большого числа пикселей. Кроме того, даже для одного ста­тического кадра при невысоком разрешении по­рядка телевизионного и ниже распространенные вейвлет-алгоритмы (например, известный алго­ритм Zero-Tree) могут быть менее эффективны, чем предложенная в Н.264 двухуровневая схема кодирования статического кадра.

Между вейвлетами и блочным кодированием идет борьба - большие картинки лучше сжи­маются вейвлетами, а видеопоследовательно­сти - кодерами типа MPEG (сейчас - Н.264). Одним из примеров эффективных алгоритмов сжатия на основе вейвлетов, реализующих ком­пенсацию движения между кадрами, является программный кодер компании ИДМ. При отсутавии компенсации движения вейвлет -кодеки заведомо уступают алгоритмам MPEG-4 и Н.264 по параметру качество/степень сжатия.



В заключение


Для кодирования видео сейчас существует боль­шой набор алгоритмов. Чем сложнее и совре­меннее алгоритм, тем лучшее качество достигается при заданном сжатии. Практически все со­временные алгоритмы используют компенсацию движения как средство для улучшения сжатия. Появление на рынке оборудования, в котором используется стандарт сжатия Н.264, предоста­вляет новые возможности для улучшения каче­ства передачи видео в охранных системах ви­деонаблюдения.



А.Ю. Соколов
ведущий разработчик, к.ф.-м.н.
ЗАО "Компания Безопасность"
Читайте также: