MPEG-2, или строительство цифровых систем видеонаблюдения

№ 9’2004
PDF версия
Разработка современных систем безопасности, будь то малое предприятие, небольшой офис или просто помещение, на сегодня является одной из самых быстроразвивающихся отраслей и у нас, и за рубежом.

Разработка современных систем безопасности, будь то малое предприятие, небольшой офис или просто помещение, на сегодня является одной из самых быстроразвивающихся отраслей и у нас, и за рубежом. Главными компонентами таких систем всегда оставались слежение и мониторинг, их сейчас реализуют с помощью видеонаблюдения. Удобство работы и качество реализации этих компонент играли и играют, пожалуй, решающую роль при выборе системы безопасности. Посему именно их, в первую очередь, и пытаются реализовать максимально эргономичными, качественными и простыми в эксплуатации.

На сегодняшний день системы видеонаблюдения можно условно разделить на два распространенных типа — устаревающий аналоговый (для слежения используются видеокамеры, аналоговая система коммуникаций, мониторы и аналоговые средства хранения данных) и «частично цифровые» (аналоговые средства хранения заменены на цифровые). Последний вид систем часто выполняется в виде специализированной платы с несколькими видеовходами, устанавливаемой в персональный компьютер. К плате кабелями подключаются видеокамеры, данные хранятся на ПК, иногда реализуется аппаратное сжатие видео.

К сожалению, недорогих и полностью цифровых систем видеонаблюдения, т.е. в которых вся передаваемая информация представлена в цифровой форме, почти нет, а те, что есть — дороги. А ведь такой переход вывел бы системы безопасности на совершенно новый уровень: позволил бы значительно упростить систему коммуникаций, повысить качество видео, реализовать новые ранее недоступные возможности. Помочь в решении этой проблемы разработчикам систем наблюдения смогут только современные системы цифрового телевидения, точнее, методы, технологии и элементная база, применяемая здесь. Рассмотрим их подробнее. Разговор начнём с технологий.

С момента возникновения первых цифровых телесистем началась и активная разработка методов и алгоритмов сжатия видеоданных. Это и понятно, ведь для качественной оцифровки телевизионного сигнала шириной 6 МГц необходимо работать с частотой дискретизации не менее 12 МГц. При 8-разрядном кодировании скорость передачи сигнала яркости (для черно-белой картинки) получится порядка 100-120 Мбит/с. Добавим сюда цветовую информацию, служебные сигналы и значение скорости достигнет 270 Мбит/с. Обработать в реальном времени, передать и сохранить такой поток зачастую не под силу и современным компьютерным системам. Выход из сложившейся ситуации был один — применение эффективных систем сжатия. И настоящим прорывом в этой области стало появление стандарта MPEG.

MPEG

Стандарт сжатия MPEG разработан Экспертной группой кинематографии (Moving Picture Experts Group — MPEG). MPEG это стандарт сжатия звуковых и видео файлов в более удобный для загрузки или пересылки формат.

На данный момент официально существуют и действуют пять стандартов: MPEG-1, MPEG-2, MPEG-4, MPEG-7 и MPEG-21. Существовал еще и стандарт MPEG-3, однако принципиальных улучшений по сравнению с MPEG-2 он не давал и разработка его была заброшена. Краткие характеристики стандартов приведены в таблице 1.

Таблица 1. Характеристики стандартов MPEG
  MPEG-1 MPEG-2 MPEG-4 MPEG-7 MPEG-21
Стандарт ISO/IEC 11172 ISO/IEC 13818 ISO/IEC 14496 ISO/IEC 15938 ISO/IEC 21000
Назначение Кодиро-

вание аудио и видео
Кодиро-

вание аудио и видео
Низко-

скоростное кодирование аудио и видео
Интерфейс описания мультиме-

дийного контента
Открытая структура доступа к средствам мультимедиа
Скорость ~1 , 5 Мбит/сек от 4 до 80 Мбит/сек от 16 до 4000 Кбит/сек
Дата разработки 1992 г. 1994г. 1998г. 2001г. 2001г.

Из существующего семейства стандартов, для нас в первую очередь интересны те, что используются для кодирования видео. Рассмотрим их.

MPEG-1

По стандарту MPEG-1 потоки видео и звуковых данных передаются со скоростью 150 килобайт в секунду (с такой же скоростью считывает данные с компакт диска односкоростной CD-ROM) и управляются путем выборки ключевых видео кадров и заполнением только тех областей, что изменяются между кадрами.

MPEG-1 был разработан и оптимизирован для работы с разрешением 352 ppl (point per line — точек в строке) * 240 (line per frame — строк в кадре) * 30 fps (frame per second — кадров в секунду). Используется цветовая схема — YCbCr (где Y — яркостная плоскость, Cb и Cr — цветовые плоскости).

Принцип работы MPEG

Каждый кадр (frame) в MPEG может быть следующего вида:

  • I (Intra) — исходный (ключевой) кадр, который кодируется как обыкновенная картинка. I-кадры играют роль опорных при восстановлении остальных изображений.
  • P (Predicted) — предсказанные кадры, описывающие различия между текущим и предыдущим кадрами (типа I или P);
  • B (Bidirectional) — интерполированные в двух направлениях (вперед и назад) кадры, содержащие лишь указатели на предыдущие или последующие кадры типа «I» или «P».

Последовательность кадров может быть, например, такая: » IBBPBBPBBPBBIBBPBBPB …»

Нужно заметить, что прежде чем декодировать » B» кадр требуется декодировать два » I» или » P» кадра. Существуют разные стандарты на частоту, с которой должны следовать » I» кадры, приблизительно 1-2 в секунду, соответствующие стандарты есть и для » P» кадров (каждый 3 кадр должен быть » P» кадром).

Для большего сжатия в » B» и » P» кадрах используется алгоритм предсказания движения на выходе которого получается:

  • вектор смещения (вектор движения) блока который нужно предсказать относительно базового блока.
  • разница между блоками (которая затем и кодируется).

Так как не любой блок можно предсказать на основании информации о предыдущих, то в » P» и » B» кадрах могут находиться » I» блоки (блоки без предсказания движения). Метод кодировки блоков (либо разницы, получаемой при методе предсказание движения) основываются на дискретном косинусном преобразовании (ДКП).

ДКП предусматривает разбиение кадра на блоки по 64 (8х8) отсчета, называемые сигнальными матрицами. Суть здесь в том, что в результате исходная сигнальная матрица преобразуется в матрицу частотных коэффициентов такого же размера. Она уже не имеет прямой геометрической связи с положением отсчетов сигнала в растре, а просто является удобной формой математической записи, в которой частотные коэффициенты дискретного косинусного преобразования можно рассматривать как двумерный спектр изображения в горизонтальном и вертикальном направлениях.

ДПК-спектр очень удобен для сжатия данных. Одной из его особенностей является то, что основной «вес» его составляющих концентрируется в небольшой области вблизи нулевых частот, а амплитуды высокочастотных составляющих или очень малы, или равны нулю. При этом передаются только те коэффициенты, которые превышают пороговую величину, а остальные считаются нулевыми. Введение порога, естественно, приводит к потерям информации и, соответственно, к снижению качества восстановленного изображения, однако при оптимальном выборе величины порога такое ухудшение окажется практически незаметным.

Что касается звука, то форматы его кодирования существующие в MPEG делятся на три части: Layer I, Layer II, Layer III (который, сейчас еще называют как mp 3 или mpeg 3, что, в общем-то, неверно.). Layer III обеспечивает самое большое сжатие но, соответственно, требует больших ресурсов для кодирования.

Принципы кодирования звука основаны на том факте, что человеческое ухо несовершенно и на самом деле в несжатом звуке с качеством аудио компакт диска (16 бит, 44.1кГц) передается много избыточной информации. Принцип сжатия использует эффект маскировки некоторых звуков для человека (например, если идет сильный звук на частоте 1000 Гц, то более слабый звук на частоте 1100 Гц уже не будет слышен человеку, также будет ослаблена чувствительность человеческого уха в периоды в 100 мс после и 5 мс до возникновения сильного звука). Психоакустическая модель, используемая в MPEG, разбивает весь частотный спектр на части, в которых уровень звука считается одинаковым, а затем удаляет звуки не воспринимаемые человеком.

Аудио параметры MPEG -1 включают поддержку частот дискретизации: 48, 44,1, 32 кГц; сигналы могут быть следующих типов — Single channel (моно), dual channel (два моно канала), stereo (стерео), intensity stereo (интенсивное стерео), Joint stereo (разновидность «стерео»).

Последним ключевым моментом сжатия видео и аудио данных является синхронизация. Видео поток содержит заголовок, затем несколько групп картинок (заголовок и несколько картинок необходимы для того, чтобы обеспечить произвольный доступ к картинкам в группе вне зависимости от их порядка). Звуковой поток состоит из пакетов, каждый из которых состоит из заголовка и нескольких звуковых кадров. Для синхронизации в третий — системный поток, встраивается таймер, работающий с частотой 90 кГц — метка, по которой происходит увеличения временного счетчика в декодере, и метка начала воспроизведения (Presentation Data Stamp). «Метка начала» вставляется в картинку или в звуковой кадр, чтобы объяснить декодеру, когда их воспроизводить.

К несчастью, MPEG-1 обеспечивал качество видеоизображения более низкое, даже чем аналоговое видео, передаваемое по телевизионному стандарту. Поэтому вскоре, на смену ему пришел более совершенный MPEG -2.

MPEG2

Компрессия по стандарту MPEG-2 кардинально изменила положение вещей. Суть его работы основана на том, что более 97% цифровых данных, представляющих видео сигнал дублируются, т.е. являются избыточными и могут быть сжаты без ущерба качеству изображения. Алгоритм MPEG-2 анализирует видеоизображение в поисках повторений, называемых избыточностью. В результате процесса удаления избыточности формат MPEG-2 обеспечивает превосходное видеоизображение при более низкой скорости передачи данных. По этой причине, современные средства поставки видеопрограмм, такие как цифровые спутниковые системы и DVD, используют именно стандарт MPEG-2. По сравнению с MPEG-1 изменения произошли как в звуковой, так и в видео-части.

  • Основные изменения в видео:
    • поддержка стандартов цветности: 4:4:4, 4:2:2;
    • разрешение кадра до 16383 х 16383;
    • возможность кодирования видео с чересстрочной разверткой;
    • наличие режимов масштабирования;
  • Изменения в звуке:
    • поддержка частот дискретизации: 16, 22,05, 24 кГц.
    • поддержка многоканального звука (возможность иметь 6 полноценных каналов: левый, правый, центральный, два задних и низкочастотный).
    • введен механизм AAC (Advanced Audio Coding) — стандарт обеспечивает очень высокое качество звука на скорости 64 кбит/с на канал (допускается от 8 до 96 кбит/с), возможно использование 48 основных каналов, 16 низкочастотных каналов для звуковых эффектов, 16 многоязыковых каналов и 16 каналов данных.

Сегодня цифровое телевидение немыслимо без стандарта MPEG-2. Можно сказать, что оно вообще смогло выйти за порог студий лишь благодаря методам компрессии, основанным на «схожести» последовательных изображений и несовершенстве нашего зрения. Для цифрового телевещания алгоритмы сжатия MPEG-2 позволяют без заметной потери качества снизить первоначальную скорость передачи приблизительно в 20 раз. Если же не предъявлять высоких требований к качеству, то скорость можно снизить в 50 и даже 100 раз.

Что касается DVD , то видеосигнал, хранящийся на DVD-видеодиске получается сжатием студийного видеосигнала CCIR-601 так же по алгоритму MPEG-2. Если изображение сложное или быстро изменяется, возможны заметные на глаз дефекты сжатия вроде дробления или размытости изображения. При скорости 3,5 Мб/с дефекты сжатия иногда бывают заметны. При скорости 6 Мбит/с сжатый сигнал почти не отличается от оригинала.

MPEG-4

MPEG-4 — это стандарт для низкоскоростной передачи видеоданных, в настоящее время получивший наибольшее распространение в компьютерной технике, как стандарт хранения сжатого видео приличного качества в сравнительно небольшом объеме (полуторачасовой фильм умещается на компакт диске объемом 650 — 700 Мбайт). Суть кодирования MPEG -4 следующая:

  • картинка разделяется на различные элементы, называемые media objects (медиа объекты).
  • описывается структура этих объектов и их взаимосвязи, чтобы затем собрать их в видеозвуковую сцену.
  • алгоритм позволяет изменять сцену, что обеспечивает высокий уровень интерактивности для конечного пользователя.

В свою очередь, медиа объекты, из которых состоит видеозвуковая сцена, объединены в иерархическую структуру:

  • неподвижные картинки (например, фон)
  • видео-объекты (говорящий человек).
  • аудио-объекты (голос, связанный с этим человеком).
  • текст, связанный с данной сценой.

и другие.

Такой «поэлементный» способ представления данных позволяет:

  • перемещать и помещать медиа объекты в любое место сцены;
  • трансформировать объекты, изменять геометрические размеры;
  • собирать из отдельных объектов составной объект и проводить над ним какие-либо операции;
  • изменять текстуру объекта (например, цвет), манипулировать объектом (заставить ящик передвигаться по сцене);
  • изменять точку наблюдения за сценой.

Стандарт MPEG-4 является более ресурсоемким по сравнению со своими предшественниками. Кроме того, существует огромное количество кодеков (их число и сейчас постоянно увеличивается за счет появления новых версий), которые работают по этому алгоритму и они, по большей части, не совместимы друг с другом. На практике это выливается в большие проблемы при попытке производителей реализовать поддержку MPEG-4 в различной аппаратуре. Например, в некоторых DVD проигрывателях поддержка этого стандарта введена. Однако с выходом обновленных версий кодеков, DVD проигрыватель уже не сможет декодировать по-новому сжатые фильмы. Это в свою очередь приводит к тому, что производители DVD устройств с поддержкой MPEG-4 вынуждены постоянно выпускать обновленные «прошивки» для своих устройств. Вышеперечисленных недостатков лишен MPEG-2, который хоть и имеет меньшую степень сжатия, зато не испытывает проблем с совместимостью. Именно поэтому, на сегодня наибольшее распространение в «не компьютерной» аппаратуре, получил именно он, широко воплотившись, как уже говорилось, в бытовых системах цифрового телевидения и в видеоаппаратуре.

Аппаратный MPEG

Аппаратные кодировщики и декодировщики стандарта MPEG-2 используются сейчас повсеместно. А раз так, то почему бы не использовать их для построения цифровых систем наблюдения? Разработка аппаратуры на их базе позволит почти полностью отказаться от аналоговых форм представления сигналов. Позволить, например, повысить помехозащищенность или облегчить удобный переход на цифровые радиоканалы. Ведь достаточно только оснастить каждую видеокамеру контроллером с кодировщиком и вся информация дальше будет передаваться в «цифре». Введя в систему интерфейс IDE , мы сможем напрямую подключить к такой камере обычный жесткий диск, обеспечив, таким образом, возможность хранения архива видео материалов не только на центральном пульте, но и в самой камере. Надежность такой системы от случайной или умышленной потери данных значительно возрастает. Кроме того, не стоит забывать и о появлении новой возможности — записи звука. MPEG-2 поддерживает два моно-канала, это означает возможность подключения и записи голоса сразу с двух независимых микрофонов. Создание таких систем сегодня — это уже реальность.

Давайте теперь рассмотрим аппаратные компоненты, которые предлагают для решения подобных задач лидеры современной IT индустрии, например, фирма Fujitsu.

Кодировщик MB86391

MB86391 — однокристальный кодировщик в MPEG-2. Поддерживает стандарты кодирования видео: MPEG-1 «ISO/IEC11172-2» и MPEG-2 MP@ML «ISO/IEC13818-2″ (аббревиатура MP@ML является сокращением от » Main Profile and Main Level «, это параметры, оговаривающие алгоритмы и параметры сжатия); форматы видео сигнала — NTSC и PAL. Максимальная скорость сжатого видеопотока — 15 Мбит/с. Поддерживаются стандарты кодирования звука MPEG-1 L ayer-1/2 «ISO/IEC11172-3» с битрейтом до 448 кбит/с и частотами дискретизации — 32 кГц, 44,1 кГц, 48 кГц. Процессом сжатия видео и аудио данных занимается интегрированный 32-разрядный RISC процессор со сменной прошивкой. Что касается остальных характеристик MB86391, то наиболее примечательны, с точки зрения разработчика аппаратуры, следующие :

  • интерфейс входного видео сигнала: ITU-R656;
  • интерфейс входного аудио сигнала: I 2 S;
  • число звуковых каналов: 2 (поддерживаются: моно, стерео, Dual и Joint stereo );
  • потребление: около 550 мВт;
  • диапазон рабочих температур: от -20 ° С до +85 ° С;
  • корпус: HQFP-208.

Для работы требуется внешняя память SDRAM, используемая в качестве буфера.

Кодировщик MB86393

Кодировщик MB86393 — родственник уже описанной выше модели (структурная схема приведена на рис.1). Главные отличительная особенность — наличие «компьютерного» интерфейса PCI v .2.2, что сразу ориентирует данный продукт на применение в платах, устанавливаемых сразу в персональные компьютеры. Другая особенность — наличие встроенной в микросхему памяти, позволяющей сократить размеры печатной платы и стоимость самой аппаратуры. Расплатой за усовершенствования явилось небольшое повышение потребляемой мощности (около 800 мВт) и «офисный» рабочий температурный диапазон от 0°С до +70°С. Микросхема поставляется в корпусе FLGA 288.

Рис.1. Структурная схема MB86393
Рис.1. Структурная схема MB86393

Особенности

Оба представленных модуля имеют последовательный интерфейс для прошивки (firmware) во внутреннюю память RISC процессора. Кристалл MB86391 оснащен шиной внешней памяти. У MB86393 присутствует дополнительный порт ввода-вывода общего назначения ( GPIO ).

Что касается входных видео и аудио интерфейсов MB86391 и MB86393 , то они цифровые. Это означает, что при использовании данных кодировщиков необходимо будет применять дополнительные промежуточные компоненты преобразования поступающей аналоговой информации в понятную для кодеров цифровую форму. Например, для приема видеосигнала можно использовать видеодекодер Philips SAA7113H, для предварительной обработки стерео звука подойдет аудио-АЦП.

Для облегчения процесса понимания принципов работы новых микросхем, а также облегчения процесса их использования, Fujitsu предлагает комплекты и платы для разработки. Например, MB86391-E/B Development Kit , поможет быстро освоиться с возможностями MB86391. В комплект входят две платы со всеми необходимыми элементами, установлены разъемы для подключения источников видеосигналов ( S — video /композитного), разъем для смены прошивки firmware через RS -232. К омплект ПО для ОС Windows прилагается .

Декодеровка

Видео и аудио информации сжатая с помощью кодировщиков по алгоритму MPEG-2 может затем сохраняться на каком-либо носителе (например, на жестком диске ПК) для дальнейшего просмотра, либо сразу передаваться на устройства отображения, например на дисплей, или обычный телевизор. В первом случае, обратное преобразование «MPEG-2 в видео» будет выполняться программными средствами компьютера и не потребует никакой дополнительной аппаратуры. Во втором случае, для просмотра потребуется аппаратно перекодировать данные. Сделать будет несложно, воспользовавшись декодерами, например, той же фирмы Fujitsu .

Декодеры SmartMPEG

SmartMPEG — интегрированные декодеры, изготовленные по современной КМОП технологии (0,18 микрон). Семейство SmartMPEG представлено несколькими моделями: МВ86Н20 (стандартная версия), МВ86Н21 (с дополнительным декодером NDS ICAM ), МВ86Н22 ( c расширенным диапазоном рабочих температур: от -40 ° С до +85 ° С ), МВ86Н23 (с функцией Macrovision ).

Основное назначение декодеров SmartMPEG — использование в приставках для приема и декодирования спутниковых каналов. При этом они, естественно, поддерживают и работу с кодировщиками MB86391 и MB86393, но обладают при этом более широкими возможностями, такими как:

  • поддержка форматов видеосигнала PAL/NTSC/SECAM;
  • поддержка стандартов декодирования видео: MPEG2 ISO/IEC 13818-2 (@ML);
  • декодирование аудио MPEG-1 L ayer-1/2;
  • наличие встроенного 32-разрядного RISC процессора ( ARC Tangent A 4 130,5 МГц);
  • интерфейс внешней SDRAM памяти (16/32-разрядной емкостью от 64 Мбит.до.1 Гбит) используемой и в качестве видеобуфера и доступной процессору;
  • 5 видео ЦАП для аналогового видео/аудио;
  • цифровой видео вход/выход ITU-R 656;
  • интерфейс смены прошивки процессора;
  • интерфейс подключения жесткого диска ( IDE );
  • интерфейс 7-сегментных индикаторов (5 цифр);

Питание кристаллов 1,8 и 3,3 В (для портов ввода/вывода). П отребление около 700 мВт (100 мВт в режиме ожидания). Для ускорения вывода на рынок законченных устройств, разрабатываемых на базе семейства SmartMPEG, фирма Fujitsu бесплатно поставляет Fujitsu Driver Application Programming Interface (FAPI) — полный комплект драйверов для быстрой разработки пользовательского комплекта ПО.

Подводя итоги

Можно с уверенность констатировать, что на сегодняшний день на рынке современных, цифровых телевизионных технологий появилось довольно много устройств, которые можно эффективно применять для построения и других видов аппаратуры, в первую очередь специализированного назначения, такой как высоконадежные многофункциональные системы наблюдения. Там где раньше передача видео сигналов осуществлялась в аналоговом виде, сейчас возможен простой переход к более удобной цифровой форме. Такой переход позволяет:

  • улучшить качество передаваемого изображения за счет исключения помех, наводимых на сигнал во время его передачи по каналам связи;
  • применять новейшие цифровые видеокамеры (с совместимым цифровым интерфейсом);
  • уменьшить число проводов используемых для приема видео от нескольких источников, за счет возможности передачи пакетов данных по общему кабелю с временным разделением;
  • уменьшить затраты на введение новых коммуникаций за счет возможности подключения источников видео сигнала с помощью контроллеров на базе MPEG декодеров к уже существующим локальным сетям ( Ethernet );
  • обеспечить более удобный инструмент для долговременного хранения данных, в том числе и средствами обычного персонального компьютера;
  • производить запись и хранение, помимо видео данных, соответствующих им голосовой аудио информации.

Ссылки:

  1. Собственная информация КТЦ-МК
    www.cec-mc.ru/comp/mpeg/mpeg2.shtml
  2. Фирма Fujitsu
    www.fme.fujitsu.com
  3. www.ixbt.com
  4. www.mpeg-4.ru
  5. www.chiariglione.org
  6. www.mpeg.org

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *