Характеристики декоррелирующих преобразований для задачи сжатия изображений
В современном информационном мире цифровые изображения занимают значительную часть. Бурное развитие Интернета, компьютерной, копировальной и фототехники привело к широкому использованию цифровых изображений и обусловило большой интерес к разработке эффективных алгоритмов компрессии таких изображений. Применение алгоритмов, обеспечивающих высокую степень сжатия, позволяет увеличить скорость передачи данных по каналам связи и эффективность их хранения.
Различают алгоритмы сжатия изображений без потерь и алгоритмы сжатия с потерями. Последние представляют наибольший интерес, поскольку позволяют добиться значительной степени сжатия без существенного ухудшения качества изображения.
Любое реальное изображение обладает высокой избыточностью, обусловленной сильной пространственной корреляцией его элементов. Выполнение пространственной декорреляции позволяет уменьшить объем передаваемых данных, не уменьшая количество информации, содержащейся в изображении. Также реальные изображения содержат информацию, которую человек не может увидеть, ее удаление позволяет добиться высокой степени компрессии. Подавляющее большинство современных методов сжатия с потерями статических изображений основано на устранении пространственной корреляции и удалении несущественных для человеческого зрения деталей.
Процедура пространственной декорреляции элементов изображения основана на его отображении в область пространственных частот при помощи одного из видов линейных преобразований (преобразования Фурье, дискретного косинусного преобразования (ДКП), дискретного преобразования Карунена-Лоэва (ДКЛ) и других). Отсчеты изображения в области пространственных частот обладают существенно меньшей корреляцией, чем отсчеты исходного изображения. Выбор базиса преобразования в значительной степени определяет эффективность разрабатываемого алгоритма компрессии изображений.
Для простоты (но без потери общности) предположим, что исходное изображение f имеет размер Ν·Ν пикселей. Тогда его можно представить в виде:
где B = {gm}0≤m<N2 — базис преобразования, <f, gm> — скалярное произведение изображения fна m-базисную функцию.
Для достижения высоких степеней сжатия базис преобразования B необходимо выбирать таким образом, чтобы обеспечивать максимально возможную локализацию энергии изображения в частотной области. Это эквивалентно тому, что большая часть коэффициентов преобразования fB[m] = <f, gm> будет равна нулю. Также желательно, чтобы энергия сигнала концентрировалась в области низких частот, так как человеческое зрение существенно менее чувствительно к ошибкам высокочастотных компонент.
В качестве базисных можно выбрать заранее определенные функции, либо функции, найденные на основе статистических критериев. Поскольку в настоящее время отсутствует стохастическая модель, объединяющая разнообразные структуры изображений, в качестве таковой часто используется гаус-совский случайный процесс. Известно, что для гауссовского случайного процесса дисперсия ошибок минимизируется в базисе Карунена-Лоэва [1].
Рассмотрим следующие виды декоррели-рующих преобразований:
- дискретное преобразование Карунена-Лоэва (ДКЛ);
- сингулярное преобразование;
- дискретное косинусное преобразование (ДКП);
- дискретное вейвлет-преобразование (ДВП).
ДКЛ интересно тем, что оно обеспечивает на выходе набор некоррелированных коэффициентов и, как было отмечено выше, оптимально в смысле минимума дисперсии ошибки восстановления для гауссовского случайного процесса. ДКЛ реализует разложение изображения по собственным векторам его ковариационной матрицы. Элементы ковариационной матрицы в данном случае вычисляются как:
где f [k] — вектор-строка k матрицы изображения f L{} — оператор усреднения.
В формуле (2) не учитывается пространственная корреляция элементов изображения в вертикальном направлении. Развитием ДКЛ можно считать сингулярное преобразование матрицы изображения:
f= υ·Δ·νΤ, (3)
где U — левая матрица собственных векторов ковариационной матрицы изображения, V — правая матрица собственных векторов ковариационной матрицы изображения, Δ — диагональная матрица сингулярных значений матрицы изображения (равных квадратному корню из соответствующих собственных значений), упорядоченных в порядке убывания.
Фактически сингулярное разложение матрицы изображения эквивалентно последовательному применению ДКЛ к матрице изображения сначала в горизонтальном, а затем в вертикальном направлении.
ДКП выбрано в качестве объекта исследования по причине его применения в широко распространенных алгоритмах сжатия, осно-ванных на стандарте JPEG. Однако, в отличие от JPEG, ДКП применялось к целому изображению, а не к его отдельным блокам, что позволило улучшить качество реконструированного изображения.
Применение ДВП в решении задач сжатия статических и динамических изображений в настоящее время широко исследуется в научных центрах всего мира. Результаты многочисленных исследований позволяют сделать вывод о том, что алгоритмы сжатия изображений, основанные на ДВП, — одни из наиболее перспективных. Авторы из широкого спектра вейвлет-базисов для сравнения с перечисленными выше методами выбрали вейвлет Хаара (как наиболее простой), биортогональный вейвлет 4/4 (так как он показал наилучшие результаты при высоких коэффициентах сжатия среди вейвлетов, исследованных нами) и биортого-нальный вейвлет 9/7 (так как он широко применяется в алгоритмах сжатия, основанных на стандарте JPEG-2000). Вычисление ДВП для биортогональных базисов выполнялось с использованием лифтинг-схемы [2].
Сравнение методов сжатия статических изображений проводилось следующим образом. К исходному изображению применялось декоррелирующее преобразование. Из полученных коэффициентов преобразования оставлялись N0 коэффициентов, имеющих наибольшее абсолютное значение, а затем выполнялось обратное преобразование. (Способы кодирования расположения значимых коэффициентов в данной статье не рассматриваются.) В качестве метрики искажения использовалось пиковое отношение сигнал/шум (ПОСШ, PSNR):
где f — исходное изображение, f — реконструированное изображение, Ν — количество строк (столбцов) в изображении.
Для сравнения методов сжатия были выбраны стандартные тестовые полутоновые изображения: Lena, Barbara и GoldhiU. Размер изображений — 512·512. Глубина вейвлет-преобразования — 5. Моделирование производилось в среде LabView 9.
На рис. 1-3 представлены графики зависимости ПОСШ от количества значимых коэффициентов, характеризующие качество реконструированного изображения. Приведенные графики показывают, что лучшими характеристиками среди рассмотренных методов обладают те, что основаны на использовании биортогональных
Рис. 1. График зависимости ПОСШ от количества значимых коэффициентов, выраженного в процентах, для тестового изображения Lena
Рис. 2. График зависимости ПОСШ от количества значимых коэффициентов, выраженного в процентах, для тестового изображения Barbara
Рис. 3. График зависимости ПОСШ от количества значимых коэффициентов, выраженного в процентах, для тестового изображения Goldhill
ДВП. Отметим, что худшими характеристиками обладает метод, основанный на сингулярном разложении матрицы изображения.
На рис. 4-9 приведены примеры изображений, реконструирован-ных по 1% и 5% значимых коэффициентов. Методы сжатия, верхний ряд (слева направо): ДКЛ, сингулярное преобразование, ДКП; нижний ряд: вейвлет Хаара, биортогональный вейвлет 9/7, биортогональ-ный вейвлет 4/4.
Рис. 4. Изображение Lena, реконструированное по 1% коэффициентов
Рис. 5. Изображение Barbara, реконструированное по 1% коэффициентов
Рис. 6. Изображение Goldhill, реконструированное по 1% коэффициентов
Рис. 7. Изображение Lena, реконструированное по 5% коэффициентов
Рис. 8. Изображение Barbara, реконструированное по 5% коэффициентов
Рис. 9. Изображение Goldhill, реконструированное по 5% коэффициентов
Визуальное сравнение реконструированных изображений подтверждает преимущество ДВП перед остальными рассмотренными преобразованиями. Также стоит отметить, что качество реконструированного изображения, полученного с использованием ДКП, не хуже, чем у изображения, реконструированного при помощи ДКЛ.
Таким образом, можно сделать вывод, что использование детерминированных базисов в целом предпочтительнее базисов, вычисленных с использованием статистических критериев. Это объясняется отсутствием адекватной стохастической модели, охватывающей все разнообразие классов изображений. Высокая вычислительная сложность статистических методов также затрудняет их использование в задачах сжатия изображений. Необходимо отметить, что из рассмотренных методов сжатия изображений лучшие результаты показали методы, основанные на дискретном вейвлет-преобразовании. Перспективность использования дискретного вейвлет-преобразования в задачах сжатия изображений объясняется его гибкостью, возможностью конструирования базисов с заданными характеристиками, хорошими декорре-лирующими свойствами и существованием быстрых алгоритмов вычисления.
Литература
- Малла С. Вейвлеты в обработке сигналов / Пер. с англ. М.: Мир, 2005.
- Воробьев В. И., Грибунин В. Г. Теория и практика вейвлет-преобразования. СПб.: ВУС, 1999.