АДАПТИВНЕ ПіДВИЩЕННЯ ЯСКРАВОСТі ЗОБРАЖЕНЬ В ЗАДАЧАХ БіНАРИЗАЦії ТЕКСТОВИХ ДОКУМЕНТіВ

Тип работы:
Реферат
Предмет:
Экономические науки


Узнать стоимость

Детальная информация о работе

Выдержка из работы

¦а о
У цій статті наведені методи та алгоритми попередньої оцінки якості зображення та глобально-адаптивного підвищення яскравості. Показано, що зображення з підвищеною яскравістю можна бінаризувати з використанням простих глобальних порого-вих методів
Ключові слова: оцінка зображення,
покращення, яскравість, адаптивна бінаризація, зображення документа
?----------------------------------?
УДК 004. 932
АДАПТИВНЕ ПІДВИЩЕННЯ ЯСКРАВОСТІ ЗОБРАЖЕНЬ В ЗАДАЧАХ БІНАРИЗАЦІЇ ТЕКСТОВИХ ДОКУМЕНТІВ
В этой статье представлены методы и алгоритмы предварительной оценки качества изображения и глобально-адаптивного повышения яркости. Показано, что изображения с повышенной яркостью можно бинаризировать с использованием простых глобальных пороговых методов
Ключевые слова: оценка изображения, улучшение, яркость, адаптивная бинаризация, изображение документа
?-------------------------------------?
Methods and algorithms of preliminary estimate of image quality and global adaptive increase of luminance are present in this paper. It is shown that image with the promoted luminance could be binarized with the use of simple global thresholding binarization methods
Key words: estimate image, enhancement, adaptive binarization, brightness, document image
--------------------? ?----------------------
1. Введення
На сьогодні активно розвивається декілька нових напрямків стосовно розробки методів, алгоритмів та застосувань бінаризації, основні з них — розпізнавання текстів у мобільних терміналах, перетворення в електронну форму архівних рукописних документів, розпізнавання стародрукованих архівних документів тощо.
В залежності від характеристик вхідного зображення, задачу бінаризації можна розділити на наступні класи:
— бінаризація в задачах виділення текстових сегментів з кольоровими символами-
— бінаризація кольорових зображень документів з ахроматичним текстом-
— бінаризація текстових документів у градаціях сірого.
У кожному з цих класів задач розробляються свої методи та алгоритми. Найбільш широко бінаризація зображень використовується в системах оптичного розпізнавання символів (ОРС). Відомо, що надійність розпізнавання текстів суттєво залежить від якості
В. І. З, а г р е б н ю к
Кандидат технічних наук, доцент* Контактний тел.: (048) 723−12−84 E-mail: vampiter@rambler. ru
Д. Д. Л е н і к
Викладач*
Контактний тел.: (048) 720−77−06 E-mail: ddlenik@ukr. net Кафедра автоматизації та управління технологічними
процесами
Одеська національна академія зв’язку ім. О. С. Попова вул. Ковальська, 1, м. Одеса, Україна, 65 020
цифрового зображення документу. Стосовно ахроматичних зображень документів, якісним зображенням документу прийнято вважати таке, гістограма, або щільність розподілу рівнів сірого якого є бімодальною, тобто рівні сірого символів суттєво відрізняються від рівнів сірого фону, а сам фон є однорідним. На практиці якісне зображення скоріше всього є виключенням. У переважній більшості випадків зображення документів мають низьку якість: неоднорідний фон, наявність шумів, низький контраст символів тощо. Іншими словами, кожне зображення має свій, не бімодальний розподіл щільності градацій сірого або контекст. Все це надзвичайно ускладнює процедуру бінаризації.
Оскільки, не існує методів, що дозволяли б оцінити якість вхідного зображення, навіть, якщо воно представлене в градаціях сірого, то не зважаючи на те, що за двадцять років було запропоновано досить значну кількість методів та алгоритмів бінаризації текстових документів, на сьогодні, ця проблема не є остаточно вирішеною. Практично у всіх методах бінаризації, з наведених вище класів, використовуються від одного до декількох емпіричних параметрів, які підбираються в інтерактивному режимі, з урахуванням якості зо-
браження документу. Звичайно, що в такому випадку, задовільна якість бінаризації і подальше розпізнавання тексту досягається лише на обмеженій множині, близьких за контекстними характеристиками, зображень.
Звідси, стосовно задачі бінаризації можна виділити наступні актуальні проблеми, а саме:
— оцінка якості зображення документу та його покращення-
— розробка адаптивних методів бінаризації з урахуванням контексту зображення без використання емпіричних коефіцієнтів.
2. Аналіз існуючих методів бінаризації
В загальному методи бінаризації розділяють на дві групи: глобальна бінаризація та локальна бінаризація. У методах глобальної бінаризації значення порогу задається або розраховується для всього зображення. Глобальна бінаризація ефективна, коли гістограма вхідного зображення — бімодальна, тобто, коли яскравість символів достатньо чітко відрізняється від яскравості фону [1]. На практиці зображення з такими характеристиками можна отримати лише за умови високої якості самого документу.
У випадках, коли якість документу низька (рис. 1), на його зображенні рівні сірого змінюються в діапазоні
I є[іті",Ітах], який менше динамічного діапазону рівнів сірого у обраній системі, присутні шуми, фон є неоднорідним, а контраст між символами та фоном — незначний. У таких випадках використовується переважно локально-адаптивна порогова бінаризація.
Рис. 1. Приклад зображення документу низької якості
Одними із перших методів локальної адаптивної порогової бінаризації є метод Ніблека [2]. У цьому методі значення порогу Т обирається в межах певної околиці пікселу (маски) розміру N х N (N = 2к +1), що бінаризується, виходячи зі співвідношення:
Т = т + к о
де т — середнє значення I, а о — середньоквадра-тичне відхилення в межах маски- к — це емпірична константа, яка підбирається так, щоб забезпечити найбільш якісну бінаризацію. Даний метод в областях з плавною зміною рівнів сірого призводить до виникнення артефактів та шумів (рис. 2).
1. Х/еІУ'-
4**1
Рис. 2. Бінаризація з використанням методу Ніблека
Щоб усунути недоліки методу Ніблека, виходячи з припущення, що значення I символів тексту розташовані ближче до мінімально можливого значення (наприклад, до нуля), а значення I пікселів фону (не текстових областей) ближче до максимально можливого значення (наприклад, 255 в динамічному діапазоні [0,255]), у [3,4] запропоновано обчислювати локальне значення порогу з рівності:
т=m (1+k (RT1))'
де R — середина динамічного діапазону рівнів сірого, а k — емпірична константа, значення якої підбирається для певного класу зображень з однаковим розподілом градацій сірого. Запропонований метод дає кращі результати у текстових областях, а що стосується фону, то як і у методі Ніблека при бінаризації виникають артефакти.
У [5] запропонована модифікація методу Саувола [3] з врахуванням локального, в межах маски, контрасту та максимального глобального контрасту. З урахуванням цього для визначення порогу використовується наступне співвідношення:
T = (1 — k). m + k. Il + k-О--(m -1*),
max (oi) '- '-
де ISL — глобальне мінімальне значення рівнів сірого- max (оі) — максимальне значення середньоква-дратичного відхилення по всім частинам зображення, що мають розмір маски- k — емпірична константа. Як і в розглянутих раніше методах, в області фону при невдалому виборі розміру маски, при бінаризації виникають артефакти та шуми.
У [6] запропонований локально адаптивний метод бінаризації, що враховує особливості розподілу градацій сірого в області рядків тексту. У даному методі бінаризація включає три етапи: початкова сегментація для виділення пікселів що належать рядкам тексту- покращення символів з використанням інформації про їх найближче оточення, контрастування та згладжування текстових областей- остаточна бінаризація.
У [7] розглянуто метод бінаризації з використанням кластерного аналізу. Запропонований метод, за ідейним змістом є алгоритмом К-середніх та використовується для кластеризації зображення у градаціях сірого на два кластери, за умови хорошої якості зображення. Метод полягає у ітераційному пошуку, з використанням гістограми, мінімуму функції:
2
f (m1,m2)=Е?ni (І-mi) ,
i=1 kSi
де пІ - кількість пікселів, що мають І -й рівень градацій сірого І e[0,L -1], І- кількість рівнів градацій сірого на зображені- mi — центр і -го кластера- Si
— кластери.
Ітерації виконуються до тих пір поки центри кластерів або функція f (m1,m2) не перестануть змінюватися. Для отриманої кластеризації визначається глобальне значення порогу
m* + m*
т = 1___^
2 '-
де т та т
остаточні значення центри класте-
рів.
У [8] запропоновано метод бінаризації, що використовує процедуру попереднього покращення зображення. Ця процедура полягає в ітеративному підвищенні яскравості та еквалізації зображення. Підвищення яскравості здійснюється за відомою формулою:
іі+і (х, у) = 1 — т + іі (Х, У),
тут Т — середньоарифметичне значення нормованої яскравості всього зображення на і -й ітерації, або поріг для бінаризації, який динамічно змінюється- Іі+1 (х, у), Іі (х, у) — нормовані значення яскравості з діапазону [0,1] на (і +1) -й та і-й ітераціях, відповідно. Після підвищення яскравості найменше значення рівнів сірого буде дорівнювати І™п = 1 — Ті + Ітіп, де Ітіп
— мінімальне значення до підвищення яскравості. Для того щоб забезпечити якомога більшу відмінність між фоном та текстом здійснюється еквалізація зображення за формулою:
Іі+1 (х, у) = 1 —
1 — Іі+1 (х, у)
обрати, для того щоб забезпечити безпомилкове розпізнавання тексту.
У високоякісному зображенні документу, тобто зображенні, яке можна безпосередньо бінаризувати, яскравість однорідного фону повинна дорівнювати ^ - максимально можливому рівню сірого (яскравості) у обраній кольоровій системі. Будемо вважати, що символи тексту мають найменший рівень сірого ітіп, або чорний колір — ітіп = 0. На границях символів є пікселі у яких яскравість змінюється в деякому діапазоні так, щоб забезпечити згладжування границь та якісне візуальне сприйняття форми символу. Частка таких пікселів у кожному символі значно менше частки чорних пікселів. З урахуванням цього середнє значення яскравості МЬч буде пропорційним відношенню (пт — р)/(пт), де пт — кількість пікселів на зображенні- р — кількість чорних пікселів. Тоді для оцінки середньої яскравості можна використовувати співвідношення:
пт — рТС,
Мкч =-------------И і?
1 — Е,
Знайдемо оцінку дисперсії:
де Еі -мінімально можливе значення яскравості.
Поріг для бінаризації динамічно перевизначаєть-ся у ході покращення зображення. Як підкреслюють автори, недоліком методу є відсутність умови згідно з якою можна було б визначити, коли необхідно припинити ітераційне покращення зображення, тому для кожного класу зображень необхідно підбирати кількість ітерацій.
Наведені вище методи розроблені для бінаризації цифрових зображень документів, що характеризуються складним контекстом та мають низьку якість. Для забезпечення якісної бінаризації необхідно підбирати, для кожної сукупності близьких за контекстом зображень, таку комбінацію розміру маски та значень емпіричних констант, що забезпечує мінімізацію помилок при розпізнаванні тексту. Що стосується зображень документів хорошої якості, то для їх бінаризації достатньо використовувати прості методи бінаризації, наприклад, глобальну порогову бінаризацію, де у якості порогу обирається середнє значення рівнів сірого. Отже, більшість проблем бінаризації можна зняти, якщо попередньо встановлюється якість вхідного зображення документу. Якщо відома якість вхідного зображення, то по крайній мірі можна визначитись з вибором такого методу бінаризації, що в даних умовах є найбільш ефективним.
Тому метою даної роботи є розробка методу та алгоритму визначення якості зображення документу та її покращення, так щоб спростити подальшу бінаризацію.
3. Визначення якості зображення документу та її адаптивне підвищення
Для бінаризації цифрових зображень текстових документів, що у більшості випадків є ахроматичними, необхідно вирішити низку проблем. По перше: необхідно визначити, який з методів бінаризації слід
о-=-І ?(1, — м")2. р (пті-р)(і:")2.
п-тХ=0У=^'- У ч/ (пт)
Якщо врахувати той факт, що практично для всіх якісних зображень текстових документів р/(пт)& lt-<- 1, то тоді МЬч = і?., а
(1)
Звідси слідує, що для якісних ахроматичних зображень документів МЬч є практично інваріантною, а дисперсія пропорційна щільності чорних пікселів.
Виходячи з отриманих результатів сформулюємо умову, при виконанні якої якість зображення є достатньою для безпосередньої бінаризації
Ма є
1-
р_
пт
(2)
де Ма — середня яскравість зображення документу. У тому випадку, коли мінімальне значення і?іп яскравості символів тексту і?іп & gt- Ітіп, то необхідно виконати перетворення:
¦ху =
Р, -І-)
та для визначення якості зображення скористатися формулою (2).
Якщо для деякого зображення Ма не задовольняє умові (2), то доцільно виконати процедуру покращення якості зображення. У якості такої процедури розглянемо ітераційне підвищення яскравості та еква-лізацію зображення.
Для підвищення яскравості зображення на першому етапі обчислюється середнє значення яскравості М та встановлюється її максимальне значення Ітах. Збільшимо глобально яскравість зображення використовуючи наступне лінійне перетворення:
о
ік+=ітах — мк+ікУ
ху тах к ху
де і!ку — яскравість пікселу (х, у) на к-й ітерації, І^1 — яскравість цього ж піксела на к + І-й ітерації. Після такого перетворення, середнє значення яскравості на к + 1-й ітерації Мк+1=І^ах, а яскравість пікселів зображення буде змінюватись у діапазоні [і^Л^], де Іїї=^ + І"і. -Ми. Що стосується І", то її значення буде визначатись зі співвідношення:
На рис. 3 наведені результати бінаризації різних за контекстом зображень
ПРЕДИСЛОВИЕ
ПРЕДИСЛОВИЕ
Настоящая книга написана з соо са «Техническая электродинамика», окнх институтах связи Министерства Предполагается, что студентами & gt-
Настоящая книга написала я соо са «Техническая электродинамика», & lt-жих инстчгутя* свнзи Министерства Предполагается, что студентами)
а)
Ік+і |2Іх-Мк, 2І1х-Мк& lt-І-х тах 2йах-Мк& gt-І-х
Тепер необхідно виконати перетворення еквалізації гістограми згідно співвідношення:
гк
ОГЛАВЛЕНИЕ
Предисловие ¦ ¦ ¦ ¦ '-
Основные. аЯйзааченйя. ¦ ¦
1. ОСНОВЫ ТЕОРИИ г ЛЕКТРОМ Глава 1. Электромагнитное поле
1 1 Общие еведеян*.. ¦
1. 2? Векторы электромагиитноге^- о
б)
ОГЛАВЛЕНИЕ
Предисловие ¦ ¦ ¦ ¦ ¦ ¦
Основные обозначения ,. — ¦
1. ОСНОВЫ ТЕОРИИ ПЛЕКТРОМ
в)
ОГЛАВЛЕНИЕ
Общие СОДЄНИЯ ¦ ¦ ¦
Векторы электром, а -штюго
Предисловие ¦ ¦ ¦ ¦ ¦
Основные обозначения.. ¦ ¦
1. ОСНОВЫ ТЕОРИИ? ЛЕЮ РОМ Гласа 1.
1.1. Ойщие
1.2. Векторы
д)
є)
Ік
тк+1 _ ху _ ік+1 — ік+1
(ік+і - ік-+і). ху тіп)
Процедура покращення зображення закінчується, коли дисперсія (1) перестане змінюватись, тобто буде виковуватись наступна умова:
рк _ рк+1.
Создание форм с помощьи]
Для создания формы с помощью мастера панели Формы запустил. Мастер форм щелчка помощью мастера и выполнить следующие дейс
1. Выбрать таблицы (или запросы), и га
Форму. & lt-.: ,
2. Выбрать внешний вид формы.
3. Выбрать спил оформления формы.
4.
Создание форм с помощью
Для создания формы с помощью мастера панели Формы запустить Мастер форм щелчю"
Создание форм с помощьи
Для создания формы с помощью мастера лаяели Формы залустгь Мастер форм щелчко" помощью мастера и выполнять следующие дейс ] Выбрать таблицы (или запросы) и га
4. Выполнить сохранение формы с задані
ж)
з) е)
Рис. 3. Результати покращення та бінаризації зображень: а), б), в) — вхідні зображення- г), д), є) — покращені, в градаціях сірого- ж), з), е) — бінаризовані
Сформулюємо алгоритм визначення якості документу та її адаптивного покращення. Він буде складатись з наступних кроків.
Крок 1. Обчислити мінімальне і?іп та максимальне
Наведені зображення (рис. 3) розрізняються за контекстом, а саме: у зображення в першому рядку
Ітах значення яскравості зображення документу та за- середнє значення рівнів сірого Ма1 = 148,59, серед-
дати початкове значення лічильника ітерацій к = 1.
Крок 2. Якщо виконується одна з умов ^ & gt- ітіп або ітах & lt- ітах, то виконати лінійне перетворення
ІС
-(і -Iа-).
ху тіп)
Крок 3. Обчислити середнє значення Ма та підрахувати кількість чорних пікселів рк.
Крок 4. Якщо Ма & gt- і?
1-
р
п-т
то алгоритм за-
кінчено: зображення можна бінаризувати.
Крок 5. Запам’ятаємо значення Р = рк.
Крок 6. Підвищити яскравість зображення згідно формули І^1 = І^ах -Ма +Іхт, та знайти І^ах, 1^.
Крок 7. Виконати перетворення еквалізації
ньоквадратичне відхилення оа1 = 35,17 максимальна яскравість Ітах1 = 230, а у зображення з другого рядка Ма2 = 128,63, оа2 = 32,65 та Ітах2 = 218. Обидва зображення мають однакову мінімальну яскравість. У зображенні третього рядка — Ма3 = 205,83, оа3 = 43,63 та
Ітах3 = 255, Ітіп3 = 6.
Для перевірки ефективності методу було оброблено 100 зображень документів отриманих зі сканеру з розподільними здатностями 300, 600 та
1200 арі.
У всіх випадках, коли різні частини зображення практично не розрізняються за розподілом рівнів сірого, були отримані задовільні результати покращення якості зображення та його бінаризації.
І к+1 ____
_(ік+1 -і^).
ху тіп)
Крок 8. Обчислити середнє значення Ма та кількість чорних пікселів на перетвореному зображенні рк+1.
Крок 9. Якщо рк+1 Ф Р, то Р _ рк+1, к _ к +1 та перейти до кроку 6, інакше алгоритм закінчено. Зображення можна бінаризувати.
З використанням цього алгоритму було розроблене застосування щодо покращення якості зображення та його глобальної бінаризації з порогом, що дорівнює М,.
Рис. 4. Результати покращення зображення
На рис. 4 наведено зображення у якому можна виділити дві частини з різним контекстом. При глобальному покращенні якості такого зображення текст у його правій частині втрачається, оскільки символи мають більші значення рівнів сірого ніж символи у правій частині зображення.
На рис. 5 наведені результати бінаризації правої частини зображення з рис. 4, а на рис. 6 — його лівої частини.
г
І
Тк+1 Тк+1
тах тіп
Э
strong contrast Colin L. Powe 11 firm charac ter
strong conh strong contrast Colin І. Г"- Colin LPowr! firm character firm charai-ln
Рис. 5. Результати покращення та бінаризації лівої частини зображення рис. 4: зліва — вхідне зображення- посередині
— покращене, в градаціях сірого- справа — бінаризоване
to her predecessor, Impressed by the behind a gentle ap-
to her predecessor. to her predecessor. Impressed by 1 he Impressed by the behind a gentle ap behind a gentle ap-
Рис. 6. Результати покращення та бінаризації правої частини зображення рис. 4: зліва — вхідне зображення-
посередині - покращене, в градаціях сірого- справа
— бінаризоване
Права частина зображення має такі характеристики: Ма _ 107,87, оа _ 23,73, І^ _ 165 та ^ _ 15, а ліва частина зображення (див. рис. 4) — Ма _ 158,9, Оа _ 22,73, Ітах _ 202 та ^ _ 44.
Якщо обробляти ці частини зображення окремо, то отримаємо задовільні результати покращення їх
якості та бінаризації. Тому подальше удосконалення запропонованого методу повинно полягати у розробці методів більш детального аналізу контексту зображення та локально-адаптивного підвищення яскравості.
Висновок
За результатами виконаних досліджень можна зробити наступні висновки:
— запропонований метод попередньої оцінки якості зображення дозволяє визначити зображення які мають практично бімодальну гістограму рівнів сірого та можуть бути бінаризовані з використанням глобального порогового методу-
— результатом адаптивного підвищення яскравості зображень низької якості, частини якого не суттєво розрізняються за контекстом, є зображення з однорідним фоном та бімодальною гістограмою рівнів сірого-
— у тому випадку, коли різні частини зображення суттєво розрізняються за контекстом, адаптивне підвищення яскравості може супроводжуватись втратами корисної інформації.
Література
1. Trier D. Evaluation of Binarization Methods for Document Images / D. Trier, T Taxt // IEEE Trans. Pattern Analysis and Machine Intelligence. -1995.- vol. 17, pp: 312−315.
2. Niblack W. An introduction to digital image processing / W. Niblack // Englewood Cliffs Prentice Hall, N.J. — 1986. — pp. 115−116.
3. Sauvola J. Adaptive document image binarization / J. Sauvola, M. Pietikainen // Patt. Recogn. — 2000 — vol. 33, pp. 225−236.
4. Zhang Z. Restoration of images scanned from thick bound documents / Z. Zhang and C. L. Tan // Proc. Int. conf. Image Processing.
— 2001. — vol. 1, pp. 1074−1077.
5. Wolf С. Extraction and recognition of artificial text in multimedia documents. / С. Wolf and J. -M. Jolion // Patt. Anal. Appl. — 2004.
— vol. 6, no. 4, pp. 309−326.
6. Leedham G. Comparison of Some Thresholding Algorithms for Text/Background Segmentation in Difficult Document Images. / Graham Leedham, Chen Yan, Kalyan Takru, Joie Hadi Nata Tan and Li Mian // School of Computer Engineering — 639 798.
7. Feng M. Contrast adaptive binarization of low quality document images / Meng-Ling Feng, Yap-Peng Tan // IEICE Electronics Express — 2004. — Val. 1, No. 16. — 501−506.
8. Zhu Y. Document Image Binarization Based on Stroke Enhancement / Yuanping Zhu, Chunheng Wang, Ruwei Dai // Proceedings of the 18th International Conference on Pattern Recognition. — 2006.
9. Dong L. An Optimization-Based Approach to Image Binarization / Liju Dong, Ge Yu // Proceedings of the Fourth International Conference on Computer and Information Technology. — 2004.
10. Kavallieratou E. A Binarization Algorithm specialized on Document Images and Photos / Ergina Kavallieratou // Proceedings of the 2005 Eight International Conference on Document Analysis and Recognition. — 2005.
Ll

ПоказатьСвернуть
Заполнить форму текущей работой