Идентификация изображений рукописных символов на основе преобразования масштаба и сортировки полярных координат

Тип работы:
Реферат
Предмет:
Кибернетика


Узнать стоимость

Детальная информация о работе

Выдержка из работы

О пятом факторе ничего определённого априори сказать нельзя, так как эксперт мог в двух опросах дать различные по своей непротиворечивости ответы. Но при оценке согласованности необходимо помнить, что эксперт работает с качественными оценками из табл. 2, а не с числами, им соответствующими. Например, согласно табл. 13 эксперт считает, что цена (300) слабо значимое, чем цена (450) — цена (450) очевидно значимое, чем цена (250) — в свою очередь цена (300) — одинаковая значимость по сравнению с ценой (250).
Выводы. Таким образом, разработанное информационное обеспечение для оценки согласованности экспертных знаний позволяет делать важные выводы относительно доверия знаниям экспертов, что является актуальным при разработке нечётких регуляторов и систем принятия решений в условиях неопределённости.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Колесников А. В. Гибридные интеллектуальные системы: теория и технология разработки. — СПб.: Изд-во СПбГТУ, 2001. — 600 с.
2. Финаев В. И., Игнатьев В. В. Системы управления на основе объединения классической и нечеткой моделей объекта. — М.: Физматлит, 2013. — 156 с.
3. Захаров В. Н., Ульянов С. В. Нечёткие модели интеллектуальных промышленных регуляторов и систем управления. IV Имитационное моделирование. //Техническая кибернетика, № 5, 1994. — С. 168−202.
4. Методы робастного нейро-нечеткого и адаптивного управления / Под ред. Н. Д. Егупова.
— М.: Изд-во МГТУ им. Н. Э. Баумана, 2002.
5. Saaty T.L. Measuring the fuzziness of sets // Journal of Cybernetics. — 1974. — Vol. 4.
6. Пупков К. А., Коньков В., Т. Интеллектуальные системы. — М.: Изд-во МГТУ им.
Н. Э. Баумана, 2003. — 348 с.
7. Прикладные нечеткие системы / Под ред. Т. Тэрано, К. Асан, М. Оугэно: Пер. с япон.
— М.: Мир, 1993.
8. Финаев В. И. Модели систем принятия решений: Учеб. пособие. — Таганрог: Изд-во ТРТУ, 2005. — 118 c.
Статью рекомендовал к опубликованию д.т.н., профессор В. Е. Золотовский.
Каид Вадиа Ахмед Абдо — Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Южный федеральный университет" — e-mail: wadea@mail. ru- г. Таганрог, ул. Петровская, 17- тел.: 89 514 972 879- кафедра систем автоматического управления- аспирант.
Qaid Wadeea Ahmed Abdo — Federal State-Owned Autonomy Educational Establishment of Higher Vocational Education «Southern Federal University" — e-mail: wadea@mail. ru- 17, Petrovskya street, Taganrog, Russia- phone: +79 514 972 879- the department of automatic control systems- postgraduate student.
УДК 681.3. 06: 681. 323 (519. 6)
Я. Е. Ромм, А.С. Дзюба
ИДЕНТИФИКАЦИЯ ИЗОБРАЖЕНИЙ РУКОПИСНЫХ СИМВОЛОВ НА ОСНОВЕ ПРЕОБРАЗОВАНИЯ МАСШТАБА И СОРТИРОВКИ ПОЛЯРНЫХ КООРДИНАТ
Рассматривается распознавание графических представлений рукописных символов на примере строчных букв русского алфавита различного почерка и средней степени искажения. Ставится задача устойчивой целочисленной идентификации и классификации объектов рассматриваемого типа. Предлагается метод реализации поставленной задачи на основе масштабирования с предварительной обработкой точек изображения и поиска
экстремальных радиусов полярных координат при помощи сортировки. Дан алгоритм вычисления толщины контура изображения символа, описывается метод обработки полярных координат уникально-обособленных точек и получения на его основе целочисленных идентификаторов изображения рукописного символа. Предлагается совмещение данного подхода с методом идентификации рукописных символов на основе вложенных последовательностей экстремумов, в результате которого достигается повышение устойчивости идентификации. Приводятся результаты программного и вычислительного эксперимента получения уникально-обособленных точек, а также результаты их обработки и формирования с применением метода вложенных последовательностей экстремумов. Даны примеры целочисленных идентификаторов в виде матриц перестановок индексов экстремальных радиусов и их углов. Предложен принцип идентификации на основе матриц, строками которых являются перестановки индексов.
Идентификация изображений рукописных символов- вложенные последовательности экстремальных признаков в полярных координатах- целочисленные идентификаторы- перестановки индексов- уникально-обособленные точки изображения- масштабирование изображения- вычисление толщины линии контура.
Ya.E. Romm, A.S. Dzuba
THE IDENTIFICATION OF IMAGES HANDWRITTEN SYMBOLS BASED ON SCALE TRANSFORMATION AND SORTING POLAR COORDINATES
The recognition of graphical representations of the handwritten symbols on the example of lowercase Russian letters, which are different by handwriting and have the average degree of distortion, is considered. The goal is a stable identification based on integer’s signs and classification the objects of this type. A method based on scaling with preprocessing of image points and searching local extreme radii of polar coordinate by sorting is proposed. An algorithm for calculating the symbol image outline thickness is given. A method for processing a polar coordinate of unique-isolated points and based on it an algorithm for obtaining integer’s identifier of a handwritten symbol image are described. It is proposed to combine this approach with a method of identifying handwritten symbols based on nested sequences of extrema to achieve the increased stability identification as a result. The results of program and calculation experiment to produce unique-isolated points, as well as the results of their processing and forming method using nested sequences extrema, are given. There are examples of integer’s identifiers in the form of matrices permutation of the indices of extreme radii and their angles. The principle of identification based on matrix whose rows are permutations of the indices is proposed.
Identification of handwritten symbols- polar coordinate- extreme radius- integer’s identifiers- permutation of the indices- unique-isolated points of image- image scaling- the thickness of the outline the symbol image.
Введение. Проблема «оффлайновой» идентификации рукописных символов представляет собой достаточно сложную задачу и требует решения универсального в том смысле, что оно должно быть инвариантно относительно расположения, размера, поворота, степени искажения и шумов распознаваемого объекта. Существуют методы распознавания изображений рукописных символов в случае их незначительных искажений, при этом методы зависят от положения символа [6−9]. В целом эта проблема сохраняется для изображений рукописных символов со средней и высокой степенью искажения и случайным расположением символа. Анализ различных подходов показывает, что перспективно искать решение данной задачи с применением комбинации различных подходов, в частности с использованием признакового, структурно-пятенного и скелетного подходов [6, 7].
Распознавание символов является частью распознавания изображений, в частности тех, которые представляют собой визуализацию состояния энергетического комплекса в процессе его моделирования. При этом точность идентификации изображения тесно связана с безопасностью эксплуатации комплекса.
Постановка задачи. Даны изображения рукописных символов, хранящиеся в растровых графических файлах формата bmp. Разрешение символа не превышает 100×100 пикселей- фон светлый- цвет кисти значительно темнее чем фон- степень зашумленности достаточно слабая- степень искажения средняя- толщина линии кисти различная- расположение и поворот символа произвольны.
Ставится задача классификации, распознавания и целочисленной идентификации символов, ее решение иллюстрируется на примере изображений рукописных строчных букв русского алфавита.
Описание метода. На вход метода поступает растровое изображение рукописного символа. Считываются декартовы координаты точек изображения, выполняется поиск центра изображения символа и преобразование декартовых координат в полярные в полной аналогии методу, изложенному в [4, 5]. Рассчитывается толщина контура символа в пикселях по следующему алгоритму.
Алгоритм 1.
1. В качестве начального приближения рассчитывается предварительная оценка толщины контура ~ /^ = п/360°, где п — общее количество точек изображения символа.
2. Начиная с левого верхнего угла изображения, считываются точки изображения с шагом в один пиксель по линиям, параллельным оси ОX, со смещением горизонталей вдоль всей оси ОY.
3. Формируются значения ру количеств подряд идущих точек (без пробела)
на]-м участке 7-й линии, при условии Ру /& gt-).
п (/) п
4. Вычисляется Б (ОХ) = 22Ру на всех п^/) линиях, где п — количество
I=1у=1
участков подряд идущих точек на 7-й линии.
5. Вычисляется п — общее количество участков подряд идущих точек на всех линиях, параллельных оси ОХ.
п (/) п
6. Аналогично шагам 2−5 рассчитываются значения ру, 3(оу) = 2 2 Ру и
1=1У =1
п (ог) с тем отличием, что считывание производится по линиям, параллельным
оси ОY вдоль оси ОХ.
7. Рассчитываются средняя толщина контура по точкам вдоль линий, параллельных оси ОХ — /(ох) = ^ / п (ох^, и аналогичная толщина контура вдоль
линий, параллельных оси ОY — /(оу) =) / п (оу).
8. Толщина контура символа определяется как / = шт (/(шг), /(ог)).
9. Если / & lt- 3, то / =~ 1(г).
Замечание 1. Толщина контура вычисляется с точностью в 1−2 пикселя как наименьшее из среднего арифметического всех горизонтальных значений и среднего арифметического всех вертикальных значений, не превышающих начального приближения. Если данное значение меньше трех пикселей, то за толщину линии контура принимается предварительная оценка, взятая в качестве начального приближения.
Далее, полярные координаты (с выбранным ранее и зафиксированным центром) точек изображения сортируются по неубыванию радиуса. Выбирается угол из последней пары отсортированных полярных координат точек изображения, он будет являться углом максимального радиуса. Производится поворот изображения символа на угол максимального радиуса. Полученные полярные координаты точек изображения масштабируются уменьшением радиусов в 15 раз (значение выбрано экспериментально). В результате снижается детализация изображения символа, в том числе всех шумов контура и средних искажений. Масштабированные полярные координаты точек изображения преобразуются в классические декартовы координаты (далее, — масштабированные декартовы координаты). На основе масштабированных декартовых координат точек изображения символа формируются классические декартовы координаты обособленно-уникальных точек по следующему алгоритму.
Алгоритм 2.
1. Для каждого номера г = 1,2,…п — 1 масштабированных декартовых координат выбирается 7-я пара точек изображения х1(т1!15), УКщп5) и для каждого номера у = г +1,2,…п выбранная пара последовательно сравнивается со всеми последующими парами х/(тт), У/(тт5), где п — общее количество точек изображения символа.
2. Если выполняется условие
'- '- '- (1)
Х'(т1/15) & lt- 1 и V У (т1/15) Уг (т1/15) & lt- 1,
= Хг (то) пг + Л Х] (то) и $к (ОУ) = Уг (то) п. г + Л УУ (то)
У =г+1 ]=г+1
хг (т) и Ху () — исходные (не масштабированные) абсциссы, соответственные масштабируемым текущей и сравниваемой абсциссам- У,(щ) и Уу (щ) — исходные
ординаты, соответственные масштабируемым текущей и сравниваемой ординатам- пг — количество точек, удовлетворяющих условию для г -й точки.
3. Производится подсчет количества точек пк, удовлетворяющих (1).
4. Действия 1−3 повторяются до тех пор, пока не будут сравнены г -я и п -я масштабированные координаты.
5. Если выполняется условие
пк & gt- 12, (2) то формируются новые значения соответственно абсцисс и ординат координат хк (вг) = $к (Х) / пк и ук (г) = 8к (у) / пк таких точек, и они сохраняются в новый
массив, при отсутствии в нем значений, удовлетворяющих условию
|Хк (вг) — Хр (пе»)| - 1 и |ук (вг) — у р (пею — 1, (3)
где хр (пем,) и Ур (пем,) — значения нового формируемого массива.
6. При выполнении (1) — (3) производится присваивание: х) = Хк (вг),
(т0) = Хк (вг), Уг (то) = Ук (вг) и У у (ту) = У к (вг).
7. Действия 1−6 выполняются до тех пор, пока г Ф п — 1-
8. В результате получается массив координат уникально-обособленных точек изображения Хр (пт)), Ур (пе№) (далее — каркасных).
Полученные декартовы координаты каркасных точек изображения преобразуются в полярные координаты. Далее, полярные координаты каркасных точек масштабируются приведением максимального радиуса к размеру 250 пикселей, а все остальные радиусы модифицируются по формуле гг = 250 х гг / гтах (такое
масштабирование с поворотом символа принимается за каноническое положение символа). Полярные координаты каркасных точек сортируются по неубыванию угла. Выполняется индексация полярных координат каркасных точек изображения по возрастанию угла. Полярные координаты каркасных точек сортируются по неубыванию радиуса. Выполняется поиск локально экстремальных (максимальных) элементов с заданным количеством конечной выборки размером в 6 элементов (выбрано в результате программного эксперимента).
Замечание 2. Используется устойчивая сортировка с взаимно-однозначным соответствием входных и выходных индексов [1−3].
Выборка индексируется заново и сортируется по неубыванию угла. Формируется первая строка двумерного массива — перестановка индексов радиусов. Выборка индексируется заново и сортируется по неубыванию радиуса. Формируется вторая строка двумерного массива — перестановка индексов углов.
Аналогичные две строки перестановок получаются по методу, рассмотренному в [5, 6], но с тем отличием, что он применяется к приведённому в каноническое положение символу и производится отбрасывание последней пары элементов выборки, отсортированной по неубыванию радиуса (максимального радиуса и его угла). Делается это для исключения из рассмотрения максимального радиуса в перестановках, так как во всех изображениях символов, приведенных к каноническому виду, он будет находиться на о°: при сортировке по неубыванию угла такая пара полярных координат будет всегда находиться на первом месте, при сортировке по неубыванию радиуса — на последнем.
Конечным набором признаков является целочисленная матрица, двумя первыми строками которой являются две перестановки изложенного метода, а двумя последними — две перестановки из метода [5, 6].
Программный эксперимент. В результате программного эксперимента были получены каркасные точки изображений символов (рис. 1) и их признаковые матрицы.
Рис. 1. Примеры изображений, приведенных к каноническому виду, с выделением
в них каркасных точек
На рис. 1 окружности имеют диаметр, равный толщине контура символа, а центром этих окружностей являются каркасные точки. Из полученных матриц признаков для каждого класса символов выбирается эталон. Таким образом формируется база эталонов изображений символов:
°
I й
у
'- 5 1 3 4 2 6 '- 5 2 3 4 6 2 5 3 6 4 3 4 2 6 5 1'-
2 5 3 4 1 6 2) 6 2 3 4 5 3) 5 3 6 2 4 4) 6 3 2 5 4
1 5 3 4 2 6 5 4 3 2 6 5 2 3 4 6 3 2 5 4 6
V 1 5 3 4 2 6) V 3 5 4 2 6) V 2 3 4 5 6) V 4 2 5 3 6 ,
1)
где 1) — эталонная матрица рукописной строчной буквы русского алфавита «а», 2) — «р», 3) — «з», 4) — «с» (рис. 2).
При работе программы формируется матрица признаков поданного на вход изображения символа и из нее последовательно вычитаются все эталонные матрицы (далее — разность матриц). Для каждой разности матриц производится подсчет нулей. Та эталонная матрица, при вычитании которой получилось наибольшее количество нулей в разности матриц и есть идентифицируемый символ (рис. 2).
Изображение Матрица Разность матриц Изображение Матрица Разность матриц
а 1 2 5 3 4 6 1 2 4 5 3 6 5 1 3 4 2 6 2 5 3 4 1 6 -412 120 -1 — 3 11 2 0 4 4 0 0 0 0 1 0 0 0 -1 0 4 2 5 3 6 1 6 2 4 1 3 5 3 4 5 2 1 6 5 4 1 2 3 6 -11 2 -14 -5 4 — 3 1 — 3 2 -1 2 -12 2 10 4 -1 — 2 — 2 1 0
а 1 3 4 5 2 6 1 5 2 3 4 6 5 2 3 4 1 6 5 2 3 4 1 6 -4211 00 — 10 1 — 13 0 4 — 3 0 0 -1 0 4 -3 0 0 -1 0 С 4 3 2 5 6 1 6 3 2 1 4 5 3 2 4 1 5 6 4 2 1 3 5 6 -12 -1 14 -5 4 — 2 -1 — 3 3 -1 2 — 3 1 — 3 3 0 3 -3 -2 -1 3 0
01 1 5 4 2 3 6 1 4 5 3 2 6 1 5 4 2 3 6 1 4 5 3 2 6 -4 4 1 -2 10 -1 — 12 — 110 0 0 1 -110 0 1 2 -1 0 0 4 5 2 1 3 6 4 3 5 1 2 6 4 5 2 1 3 6 4 3 5 1 2 6 -14 -1 -3 10 2 — 2 2 — 3 -10 3 0 -1 — 3 10 3 -2 2 -3 0 0
Рис. 2. Изображение различных символов и разности матриц относительно эталонной матрицы буквы «а»
Заключение. Изложенный подход позволяет находить каркасные точки изображения символа, поданного на вход в виде растрового изображения, вычислять толщину контура, классифицировать, распознавать и идентифицировать изображения рукописных символов со средней степенью искажения. Программный и численный эксперимент проведен для всех изображений символов русских рукописных строчных букв, в результате сформированы эталонные матрицы, позволившие реализовать классификацию, распознавание и целочисленную идентификацию всех букв. Предложенный метод отличается от известных [8−9] по построению и результатам детерминированного распознавания.
Представленный способ идентификации изображений в общем смысле является способом детерминированной точной идентификации изображения, что соответствует повышению точности распознавания состояния энергетического комплекса в процессе его моделирования.
БИБЛИОГРАФИЧЕСКИИ СПИСОК
1. Ромм Я. Е. Параллельная сортировка слиянием по матрицам сравнений // Кибернетика и системный анализ. — 1994. — № 5. — С. 3−23.
2. Ромм Я. Е. Параллельная сортировка слиянием по матрицам сравнений // Кибернетика и системный анализ. — 1995. — № 4. — С. 13−37.
3. Ромм Я. Е. Локализация и устойчивое вычисление нулей многочленов на основе сортировки // Кибернетика и системный анализ. — 2007. — № 1. — С. 165−183.
4. Ромм Я. Е., Дзюба А. С. Метод распознавания рукописных символов на основе сортировки полярных координат. — Таганрог: ТГПИ, 2012. — 42 с. Деп. в ВИНИТИ 14. 11. 2012, № 418 — В2012.
5. Ромм Я. Е., Дзюба А. С. Идентификация рукописных символов с применением подстановки индексов при сортировке полярных координат // Известия ЮФУ. Технические науки. 2013. — № 7 (144). — С. 154−160.
6. Демин А. А. Обзор интеллектуальных систем для оценки каллиграфии // Инженерный вестник (МГТУ им. Н.Э. Баумана). Электронный журнал.- 2012. — № 9.
7. Гайдуков Н. П., Савкова Е. О. Обзор методов распознавания рукописного текста // Международная научно-техническая конференция студентов, аспирантов и молодых учёных & quot-Информационно-управляющие системы и компьютерный мониторинг — 2012& quot-.
8. Садыхов Р. Х., Ваткин М. Е. Алгоритм обучения нейронной сети «неокогнитрон» для распознавания рукописных символов // Весщ НАН Беларусг Сер. фiз. -тэхн. навук. 2002. -№ 3. — C. 1.
9. Садыхов Р. Х., Дудкин А. А. Обработка изображений и идентификация объектов в системах технического зрения // Штучний штелект. 2005 — № 3. — С. 670−679.
Статью рекомендовал к опубликованию д.т.н., профессор В. П. Карелин.
Ромм Яков Евсеевич — Федеральное государственное бюджетное образовательное учреждение «Таганрогский государственный педагогический институт имени А.П. Чехова" — e-mail: romm@list. ru- 347 926, г. Таганрог, ул. Инициативная, 48- тел.: 89 094 081 126- кафедра информатики- д.т.н.- профессор.
Дзюба Андрей Сергеевич — e-mail: dzuba_ni@list. ru- тел.: 89 094 080 776- кафедра информатики- аспирант.
Romm Yakov Evseevich — Federal State Budget Educational Establishment of Higher Professional Education «Taganrog State Pedagogical Institute named after A.P. Chehov" — e-mail: romm@List. ru- 48, Initsiativnaya, Taganrog, 347 926, Russia- phone: +79 094 081 126- the department of information science- dr. of eng. sc.- professor.
Dzuba Andrew Sergeevich — e-mail: dzuba_ni@list. ru- phone: +79 094 080 776- the department of information science- postgraduate student.
УДК 681.3. 06: 681. 323 (519. 6)
Я. Е. Ромм, С.С. Белоконова
ДЕТЕРМИНИРОВАННЫЙ ПОИСК ДАННЫХ РАЗЛИЧНОГО ТИПА ПО ЭКСТРЕМАЛЬНЫМ ЗНАЧЕНИЯМ ОТСОРТИРОВАННЫХ
ЭЛЕМЕНТОВ
Излагается распараллеливаемый метод детерминированного поиска на основе идентификации локально экстремальных элементов числовой последовательности, которая взаимно однозначно сопоставляется исследуемому массиву данных фиксированного типа. Способ сопоставления использует разложение элементов последовательности на простые множители. Метод использует алгоритм максимально распараллеливаемой сортировки с взаимно-однозначным соответствием входных и выходных индексов, обобщается на поиск одновременно по произвольно заданному конечному количеству масок различного типа в множестве файлов. Особенностью метода является его функциональная возможность выполнять поиск как данных нечислового, так и числового типа. Многообразие масок используется для поиска в зависимости от их взаимного сочетания, от индексного расстояния между ними. Параллелизм основан на максимальной параллельности сортировки и параллелизме обработки отдельно взятых файлов и их фрагментов, достигается оценка временной сложности максимально параллельного поиска на данной основе 0(1). Количество процессоров зависит как от размеров обрабатываемых файлов или числа объектов, так и от количества масок или искомых свойств.
Информационный поиск- данные различных типов- параллельные алгоритмы сортировки и поиска- идентификация экстремумов на основе сортировки.

ПоказатьСвернуть
Заполнить форму текущей работой