Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений

Тип работы:
Реферат
Предмет:
Кибернетика


Узнать стоимость

Детальная информация о работе

Выдержка из работы

11. Тихонов В. И., Харисов В. Н. Статистический анализ и синтез радиотехнических устройств и систем. М.: Радио и связь, 1991.
12. Банди Б. Методы оптимизации: Вводный курс. М.: Радио и связь, 1988. Сергей Викторович Соколов
Павел Александрович Кучеренко —
Рекомендована кафедрой автоматики и телемеханики на ж. -д. транспорте
Сведения об авторах д-р техн. наук, профессор- Ростовский государственный университет путей сообщения, кафедра автоматики и телемеханики на ж. -д. транспорте, Ростов-на-Дону
аспирант- Ростовский государственный университет путей сообщения, кафедра автоматики и телемеханики на ж. -д. транспорте, Ростов-на-Дону- E-mail: pavelpost83@mail. ru
Поступила в редакцию 21. 05. 08 г.
УДК 004. 627
Ю. В. Лужков
МЕТОД АДАПТИВНОГО СКАЛЯРНОГО КВАНТОВАНИЯ В СХЕМАХ НЕОБРАТИМОГО СЖАТИЯ ИЗОБРАЖЕНИЙ
Рассматривается проблема адаптивной генерации матриц квантования. Для схем сжатия изображений с потерей качества, использующих спектральные преобразования, предложен способ адаптивного скалярного квантования спектральных коэффициентов на основе весового критерия и рассмотрены способы определения этого критерия.
Ключевые слова: сжатие изображений, адаптивное квантование, весовой критерий, JPEG.
Введение. В настоящее время одним из распространенных форматов сжатия изображений с потерей качества является JPEG (Joint Photographic Experts Group) [1]. Разработаны и другие схемы сжатия (см., например, работы [2, 3]), эффективность которых существенно превосходит алгоритмы на основе дискретных спектральных преобразований. Однако вследствие широкой распространенности последних перед исследователями встает следующий вопрос: возможно ли модифицировать существующую схему компрессии таким образом, чтобы повысить степень сжатия, не меняя при этом алгоритм декомпрессии? Решение этой задачи позволит вносить изменения в существующие программы-компрессоры, не заботясь о наличии у пользователей специального (модифицированного) программного обеспечения для декомпрессии изображений.
В применяемых алгоритмах сжатия используются некоторые параметры по умолчанию. Например, в формате JPEG к таким параметрам относятся матрицы квантования и таблицы Хаффмана: они сохраняются в заголовке сжатого файла, и формат допускает самостоятельное определение пользователем их значений, что является одним из путей повышения степени компрессии. Так, известны несколько подходов к составлению матриц квантования в формате JPEG (например, [4, 5]), которые, однако, не являются универсальными и требуют сравнительно большого объема вычислений.
В настоящей статье рассматривается обобщенный подход к адаптивному скалярному квантованию коэффициентов спектра, предлагаемый способ прост в реализации и может быть применен, в частности, для формата JPEG.
Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений 13
Адаптивное квантование сигнала. Квантование — способ обработки сигнала, сопряженный с внесением в него искажения. Суть квантования сводится к разбиению диапазона значений сигнала 2 на конечное число интервалов с последующим выбором одного значения для представления любой величины из данного интервала. При векторном квантовании — это разбиение пространства возможных значений векторной величины на конечное число областей. Наиболее полный аналитический обзор вопросов квантования приведен в работе [6]. Так, пусть заданы множество интервалов? = {Si- / е Ъ} и множество точек
С = {у1- / е Ъ}, тогда функция квантования сигнала 2 определяется как г) = уг- для г е. При равномерном скалярном квантовании множество интервалов можно представить в виде
где, А — параметр, или шаг, квантования- величина ё задает смещение интервалов относи-
Тогда операция квантования может быть сведена к простому делению с округлением:
где [•] - операция округления до ближайшего целого.
При восстановлении сигнала z привносится ошибка e: z = q (z) — e.
Методы адаптивного квантования могут быть разделены на две группы: адаптивное скалярное квантование- векторное и кодовое квантование.
Адаптивность в скалярном квантовании достигается путем индивидуального выбора параметра квантования, А для каждого квантуемого значения.
Адаптивное скалярное квантование на основе весового критерия. Предлагаемый в настоящей статье подход основан на статистическом анализе коэффициентов спектра. Этот подход может быть использован в схемах сжатия (например, JPEG) при условии, что окно сканирования сигнала имеет постоянный размер.
Так, пусть дана последовательность коэффициентов спектра, разбитая на M одинаковых блоков по N значений в каждом, при этом n = 0, N -1 — номер (позиция) коэффициента в данном блоке, т. е. каждый коэффициент имеет аналог в любом другом блоке. Суть предлагаемого подхода заключается в следующем: для каждого n-го номера вычисляется значение специального весового критерия, и значение параметра квантования данного коэффициента спектра тем больше, чем меньше соответствующее ему значение весового критерия.
Таким образом, идея метода основана на том, что процедура квантования выполняется с учетом некоторой статистической информации о сигнале, заданном как z = {z0 0,…, Zn _1 m-i), полученной от M блоков для каждого порядкового номера n. Функция квантования (1) в этом случае будет обозначаться как q (z, n), а функция параметра квантования — как A (z, n).
Введем критерий T, назвав его весом спектрального коэффициента. Величина T отражает степень значимости спектральных коэффициентов zn m, имеющих одинаковый порядковый номер n, для всех M блоков, m = 0, M -1. Рассмотрим некоторые способы определения критерия T. Первый из возможных способов основан на статистике максимальных значений:
Si =[d + Ai, d + A (i +1)), i e Z,
тельно нуля, ё е [-А / 2, А /2) — / - номер интервала, который и является кодируемым объектом.
(1)
где zm, max
1, zn, m zm, max- cn = j | m=0 0, |zn, m ^ zm, max,
максимальный по модулю спектральный коэффициент в данном блоке.
m, max & gt-
m, max& gt-
Такой способ вычисления критерия пригоден в том случае, если нет выраженной концентрации энергии сигнала на определенных спектральных позициях. Однако, как показали, например, эксперименты с дискретным косинусным преобразованием (ДКП), в 99% случаев коэффициент с номером 0 определяется как максимальный, причем для более чем 90% номеров п значение критерия Т равно 0, что препятствует практическому использованию данного критерия в схемах сжатия на основе ДКП.
Другой способ вычисления Т является развитием предыдущего и основан на пороговом ограничении спектральных коэффициентов:
M-1
Tn = ^ cn, m=0
cn = & lt-
& gt- P- & lt- p,
о & lt- p & lt- zm
где Р — порог ограничения.
Использование порогового ограничения позволяет решить проблему непропорционального распределения энергии сигнала, присущую первому способу. Однако основной недостаток порогового вычисления Т — необходимость определения значения Р.
Следующий алгоритм вычисления Т оперирует средними амплитудами спектра, не используя при этом порог Р:
1
M-1
Tn M ^ |Zn, m| M m=0
(2)
Достоинством данного способа является отсутствие обязательной дополнительной обработки сигнала (для определения порога P). К недостаткам можно отнести операции с числами с плавающей запятой (при использовании предыдущих способов выполняется просто увеличение счетчиков на единицу).
На рис. 1, а, б представлена зависимость T (n), вычисленная по формуле (2) для коэффициентов ДКП при M = 8×8 = 64: а — результаты вычислений для матрицы яркости Y изображений & quot-Lena"- и & quot-Oldman"-, б — для хроматических матриц изображения & quot-Oldman"-. На графиках значения T упорядочены так, чтобы значения критерия не возрастали. Как видно, динамика изменения величины T достаточно резкая, что в некоторых случаях может привести к чрезмерному квантованию малозначимых спектральных коэффициентов.
а)
Т 100
10
0,1
0,01
--изображение & quot-Lena"- - изображение & quot-Oldman"-

ill
1 I 1 41 51 61 п
1 1 1 ^ 1 1 1 1 1 1 1 1 1
б) т 10
0,1
0,01
0,001
— - Cb
¦у 1 1 L 3 1 4 1 51 61 п


Рис. 1
Скорректировать ситуацию можно, выбирая в качестве значения критерия максимальные амплитуды коэффициентов:
Тп = тах 2п, т. (3)
1
1
Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений 15 Обратимся далее к определению функции А (г, & quot-). Пусть ее значения ограничены диапазоном [1, a2 ], 0 & lt- о & lt- a2. Введем линейную функцию от T:
E (T) = о! + ^ Т& quot- (С12 -al).
Тшах Тшт
Также может использоваться нелинейная функция от Т, что достигается введением корректирующей функции /:
1 (Тшах)-1 (Т& quot-)
E (T) = a1 +
f ((max) f (Tmin)
(a2 -a1) —
(4)
Поскольку любое значение критерия Tn в общем случае зависит от всех коэффициентов исходного спектрального вектора z, то функция E также зависит от z. Фактически это есть функция параметра квантования сигнала A (z, n). Введем обозначение f (z, n) = f (Tn). Тогда формула (4) окончательно принимает следующий вид:
f (z& gt- n max)-f (z& gt-n)
A (z, n) = A (T) = a1 +
f (zn max)-f (zn min)
(a2 — a1)•
(5)
Таким образом, функция параметра квантования локализована в диапазоне от с1 до с2. Варьируя ее форму, можно осуществлять квантование коэффициентов спектра с данным порядковым номером с большим или меньшим шагом: см. рис. 2, а (значения Т упорядочены по возрастанию). На рисунке кривая 1 соответствует линейному преобразованию, кривая 2 — преобразованию с использованием функции 1. Так, пусть известно, что высокочастотным коэффициентам спектра соответствуют малые значения Т. Тогда для подавления высоких частот достаточно задать функцию 1 с таким расчетом, чтобы ее энергия на начальном участке была большой.
Примеры корректирующих функций 1 приведены на рис. 2, б.
--1-sin (nx/2) — - - - - 1-sin3(nx/2)

* 1
С V ^^^ V

I" ^^^^
Тпах m 0 Рис. 2
0,2
0,4
0,6
0,8
Квантование с различным шагом реализовано, например, в формате JPEG. Однако значения параметра, А не вычисляются адаптивно, а представлены значениями по умолчанию. Рассмотрим возможность применения предложенного подхода для адаптивной генерации матриц квантования в схеме JPEG. В формуле (5) будем использовать линейную корректирующую функцию и критерий максимальных амплитуд (3).
x
Т
На рис. 3, а приведены графики стандартных функций параметра квантования в формате JPEG, а на рис. 3, б — графики значений А, сгенерированных адаптивным способом для изображения & quot-Oldman"-. В обоих случаях значения упорядочены в соответствии с «зигзаг& quot--сканированием. Как видно, отличие сгенерированных значений от стандартных достаточно велико.
а)
б)
Д 120
80
40
Д 120
80
40
60 n
20
40
60 n
Рис. 3
График зависимости Т (п) для изображения & quot-ОЫшап"- представлен на рис. 4, а. На рис. 4, б показаны результаты сжатия этого изображения с применением функций квантования, данных по умолчанию (кривая 1), и функций, сгенерированных в рамках эксперимента (кривая 2). По оси абсцисс — среднее число бит на пиксел (Ь), по оси ординат — пиковое отношение сигнала к шуму (РБКК). Анализ результатов показывает, что разница в степени сжатия составляет до 20% в пользу адаптивного подхода при одинаковых значениях РБК^
а)
Т 1000
800 600 400 200
б)
PSNR, дБ
1 1 — Y
1 Cb, Cr

1 1 1
1 1 1 Д 1
& gt- 1 & quot- k —.
100
90
80
70

r L
r + A ф
и
11 21
31 41 51 61 n
b, бит/пиксел
Рис. 4
Заключение. Предложенный способ адаптивного скалярного квантования коэффициентов спектра основан на вычислении критерия значимости коэффициентов спектра. Как показали эксперименты, применение рассмотренного подхода в схеме JPEG позволяет получить выигрыш по степени сжатия до 20% по сравнению с использованием стандартных матриц квантования.
При практическом использовании рассмотренного метода квантования необходима модернизация только компрессора, а для просмотра изображений достаточно применения стандартного JPEG-декомпрессора, что является важным достоинством предложенного решения.
0
0
0
0
2
4
6
1
Система автоматического распознавания речевых команд
17
СПИСОК ЛИТЕРАТУРЫ
1. Wallace G. K. The JPEG still picture compression standard // IEEE Trans. Consumer Electronics. 1992. Vol. 38, N 1. P. 18−34.
2. Shukla R. Rate-distortion optimized tree-structured compression algorithms for piecewise polynomial images // IEEE Transact. on Image Processing. 2005. Vol. 14, N 3. P. 343−359.
3. Dalai M., Leonardi R. L-inf norm based second generation image coding // Proc. of Intern. Conf. on Image Processing. 2004. P. 3193−3196.
4. Ratnakar V., Livny M. Extending RD-OPT with global thresholding for JPEG optimization // Proc. of the Conf. on Data Compression. 1996. P. 379−386.
5. Fung H. T., Parker K. J. Design of image-adaptive quantization tables for JPEG // J. of Electronic Imaging. 1996. Vol. 4, N 2. P. 144−150.
6. GrayR. M., NeuhoffD. L. Quantization // IEEE Transact. on Information Theory. 1998. Vol. 44, N 6. P. 2325−2383.
Сведения об авторе — аспирант, Санкт-Петербургский государственный университет информационных технологий, механики и оптики, кафедра вычислительной техники- E-mail: luzhkov@inbox. ru
Поступила в редакцию 24. 11. 08 г.
УДК 004. 522
К. К. Гладышев, Е. А. Шульгин СИСТЕМА АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧЕВЫХ КОМАНД
Приводится описание системы автоматического распознавания речевых команд, состоящей из нескольких уровней: оцифровки сигнала- выделения первичных признаков речевых сигналов на основе линейных спектральных корней- поиска распознаваемой команды по базе эталонов с использованием методов динамического программирования- семантической коррекции распознанной последовательности символов по орфоэпическому словарю. Разработанная система может быть использована в сфере речевых технологий.
Ключевые слова: распознавание речи, динамическое программирование, линейное предсказание.
Полноценная замкнутая система распознавания речи (СРР) состоит из множества взаимосвязанных уровней [1−4]. Общая эффективность работы такой системы непосредственно зависит от качества реализации каждого уровня. Подобное построение системы связано с физиологическими процессами, происходящими при восприятии речи человеком. На выходе слухового аппарата человека формируется набор сигналов, которые в дальнейшем обрабатываются мозгом и преобразуются в последовательности осмысленных речевых единиц.
Обобщенно можно выделить следующие уровни человеческой системы восприятия речи [5]:
— физическое восприятие колебаний звука в ухе с помощью специального органа — улитки-
— преобразование звуковых колебаний в определенную последовательность информативных сигналов и передача их через нейроны в головной мозг-
Юрий Валерьевич Лужков
Рекомендована кафедрой вычислительной техники

ПоказатьСвернуть
Заполнить форму текущей работой