Математическая обработка результатов исследования читающего устройства

Тип работы:
Реферат
Предмет:
ТЕХНИЧЕСКИЕ НАУКИ


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Интернет-журнал «Науковедение» ISSN 2223−5167 http: //naukovedenie. ru/ Том 7, № 1 (2015) http: //naukovedenie. ru/index. php? p=vol7−1 URL статьи: http: //naukovedenie. ru/PDF/77TVN115. pdf DOI: 10. 15 862/77TVN115 (http: //dx. doi. org/10. 15 862/77TVN115)
УДК 004. 021
Пинт Эдуард Михайлович
ФГБОУ Пензенский государственный университет архитектуры и строительства
Россия, г. Пенза1 Профессор Кандидат технических наук
Петровнина Ирина Николаевна
ФГБОУ Пензенский государственный университет архитектуры и строительства
Россия, г. Пенза Доцент
Кандидат технических наук E-mail: irisha-vas@yandex. ru
Романенко Игорь Иванович
ФГБОУ Пензенский государственный университет архитектуры и строительства
Россия, г. Пенза
Заведующий кафедрой «Механизация и автоматизация производства» ФГБОУ ВПО «Пензенский государственный университет архитектуры и строительства»
Доцент
Кандидат технических наук E-mail: rom1959@yandex. ru
Еличев Константин Александрович
ФГБОУ Пензенский государственный университет архитектуры и строительства
Россия, г. Пенза Доцент
Кандидат технических наук E-mail: elichev. 55@mail. ru
Математическая обработка результатов исследования
читающего устройства
1 440 028, Россия, г. Пенза, ул. Германа Титова 28 1
Аннотация. Авторами было разработано читающее устройство. Создана фотоэлектронная система восприятия печатной информации. Разработана программа для компьютера, реализующая рациональный метод распознания компьютером печатных знаков разных шрифтов и других символов.
В статье основное внимание уделяется заключительной части программы для компьютера и математической обработке результатов исследования читающего устройства.
Фотоэлектронная система воспринимает изображение печатного знака с носителя информации и преобразует его в прямоугольные импульсы, поступающие в определенном порядке в прямоугольную матрицу, состоящую из ячеек запоминающего устройства компьютера. Заполненная ячейка соответствует элементу изображения знака.
Согласно разработанной программе, компьютер, начиная с концевой точки, обходит вписанное в матрицу изображение печатного знака по его контуру, фиксируя номера основных направлений, образуемых элементами контура.
При этом компьютер производит масштабное преобразование изображения знака, ликвидацию нехарактерных отклонений основных частей знака, возможных дефектов изображения. Полученная для печатного знака последовательность номеров основных направлений сравнивается поочередно с последовательностями направлений, образуемыми после обхода идеальных контуров печатных знаков русского алфавита (стандартными видами). Методика этого сравнения изложена в статье.
В статье на основе математической статистики и теории корреляции оцениваются на распознаваемость печатные знаки «незнакомых» компьютеру шрифтов и описываются меры по повышению надежности распознавания печатных знаков неизвестных шрифтов.
Ключевые слова: программа- оператор- матрица- печатный знак- направления- масштаб- символ- стиль написания- стандартный вид- генераторы строчной- генератор кадровой развертки.
Ссылка для цитирования этой статьи:
Пинт Э. М., Петровнина И. Н., Романенко И. И., Еличев К. А. Математическая обработка результатов исследования читающего устройства // Интернет-журнал «НАУКОВЕДЕНИЕ» Том 7, № 1 (2015) http: //naukovedenie. ru/PDF/77TVN115. pdf (доступ свободный). Загл. с экрана. Яз. рус., англ. DOI: 10. 15 862/77TVN115
Задача распознавания компьютером графических изображений является одной из актуальных задач. Среди графических изображений особое место занимают печатные буквы и цифры. Решение задачи распознавания с высокой степенью надежности компьютером печатных букв и цифр разных шрифтов наталкивается на определенные трудности, связанные с большим разнообразием в начертании букв и цифр.
Авторами был разработан и апробирован оригинальный универсальный метод распознавания компьютером печатных знаков разных шрифтов. Метод основан на представлении печатного знака в виде специфической последовательности определенных направлений, получаемой по мере обхода контура знака относительно определенной концевой точки. Он позволяет распознавать печатные знаки с разными размерами и толщинами линий, при определенных изменениях ориентации знака по отношению к вертикали, при значительных вариациях формы знаков и наличии определенных дефектов печати.
В процессе эксперимента проводилось распознавание печатных знаков наиболее характерных шрифтов: компьютерного (А4), шрифта в книге (ГК-3), шрифта в газете (Г-63), резко отличающихся по форме контуров знаков.
Читающие устройства целесообразно использовать для обработки статической печатной информации, накапливающейся на предприятиях строительства и промышленности, на транспорте, для ускоренного поиска информации в библиотеке и т. д. [1,4, 5, 6,7].
Авторы создали читающее устройство, которое с достаточно высоким быстродействием и надежностью распознает печатные знаки разных шрифтов.
Предлагаемое читающее устройство состоит из фотоэлектронной системы считывания и компьютера.
Фотоэлектронная система считывания воспринимает печатный знак с носителя информации, преобразует изображение знака в электрические импульсы, поступающие в определенном порядке в прямоугольную матрицу, состоящую из ячеек запоминающего устройства компьютера. Заполненные ячейки матрицы соответствуют элементам изображения знака.
Фотоэлектронная система считывания содержит следующие элементы: передающую телевизионную трубку, генераторы строчной и кадровой разверток, усилитель, триггер Шмидта, пересчетное устройство, схему совпадений, генератор запуска (рис. 1).
Выход
Рис. 1. Структурная схема фотоэлектронной системы считывания знаков
На экране передающей телевизионной трубки с помощью генераторов строчной и кадровой разверток создается растр, который состоит из ряда горизонтальных строк, смещенных по вертикали друг относительно друга. На выходе телевизионной трубки возникают электрические сигналы, соответствующие элементам изображения знака, которые усиливаются усилителем и преобразуются триггером Шмита в прямоугольные импульсы, поступающие на определенные входы схемы совпадений. На другие входы схемы совпадений подаются прямоугольные импульсы, формируемые пересчетным устройством, состоящим из счетчика импульсов, инверторов, дешифратора и запускаемым генератором запуска. При совпадении во времени импульсов, образуемых на выходе триггера Шмидта и на выходах пересчетного устройства, на выходах схемы совпадений создаются прямоугольные импульсы, поступающие в ячейки запоминающего устройства компьютера.
Авторы разработали программу для компьютера, с помощью которой компьютер «обходит» изображение знака, вписанное в прямоугольную матрицу, по направлениям контура знака.
Было выбрано восемь направлений, расположенных по окружности под углом 45о друг относительно друга. Каждое направление имело свой номер.
После обхода по контуру изображение знака представлялось в виде последовательности номеров направлений. Эти направления назывались «главными». Главное направление имело количество заполненных ячеек матрицы больше, чем количество заполненных ячеек, составляющих максимальную толщину линий знака. После обхода по контуру стирались заполненные ячейки, составляющие толщину линий знака, т.н. изображение знака масштабно преобразовывалось.
Кроме того, ликвидировались нехарактерные отклонения основных частей знака: стоек, перекладин, наклонных линий.
Анализ каждого идеально напечатанного знакового контура с представление его в виде последовательности номеров главных направлений, которая была названа «стандартным видом знака», позволил составить стандартные виды печатных знаков русского алфавита.
В конце программы полученная для знака последовательность номеров главных направлений сравнивалась поочередно со всеми стандартными видами знаков, подсчитывалось количество не совпадавших номеров направлений для каждого стандартного вида, и по меньшему количеству несовпадений определялся знак [10].
Структурная схема разработанной программы представлена на рис. 2 [2,8,9,10].
Рис. 2. Структурная схема разработанной программы
Остановимся более подробно на заключительной части программы. Сравнение записи знака по направлениям со стандартным видом согласно выбранной в результате анализа методике идет следующим образом. Первый номер направления из стандартного вида сравнивается по порядку с первым номером направления знака. Если номера совпадают, то они стираются из стандартного вида и из записи знака по направлениям. Если совпадений нет, то номер направления из стандартного вида сравнивается со следующим по порядку номером направления знака и т. д. до совпадения номеров. После совпадения номеров следует очередной номер направления из стандартного вида, который сравнивается с оставшимися номерами знака, следующими за только что стертым номером. Если после п сравнения совпадения нигде не произошло, стирания нет, то при п + 1 сравнении очередной номер из стандартного вида сравнивается с номерами направлений, следующими за стертым номером после п — 1 сравнения- если и ранее не было совпадений, сравнение начинается с первого номера направления знака. Сравнение заканчивается, либо когда за стертым номером в записи знака по направлениям не следует очередного номера направления. Количество несовпадений подсчитывается путем сложения оставшихся номеров в стандартном виде и в записи знака по направлениям. Логическая схема этой части программы представляется следующим образом:
П20Р21?-/Л22 123^24 ?^2& lt-П26П2728 Ы^29П30*31П32 ?^з1/34П35 I
6 & quot-"- & quot-"- э ^ & quot-"- - ^ -б
^6*37^*3839^4041 ?^42 г? А Л4зЛ^44П45 А46*47 ЛВ114 9 А
11
12
12н
13
13
14
14
50 51 5253 54 55 56^ 57 58^ 59 60 61 62 16
65Р66д П4. 6768 ^
где:
Я — оператор, который заносит определенное число в индексный регистр,
{ - правый знак перехода (или J).
?у — оператор переадресации по индексу,
Пу — оператор переноса из одних ячеек оперативной памяти в другие, Фу — оператор формирования,
Р —
логический оператор,
Ау — арифметический оператор,
Ь — левый знак перехода,
к
} - оператор ^+1, +2, где:
^+1 — оператор, изменяющий число, занесенное в индексный регистр,
Р8 +2 — оператор, проверяющий достигло ли содержимое индексного регистра нуля. Пока это значение не достигнуто, Р8 +2 передает управление оператору, с которого начинается очередной цикл- если содержимое индексного регистра станет равным нулю, то Р8 +2 передает управление оператору, стоящему в логической схеме непосредственно после него,
Г — два левых знака перехода (?--О?
П4 — печать числа, определяющего распознаваемый знак.
Была выбрана оптимальная матрица запоминающего устройства компьютера, исходя из необходимости надежного распознавания печатных знаков разных шрифтов [3]. Надежность распознавания печатных знаков оценивалось по введенной авторами формуле.
Рассмотрим результаты анализа, проведенного для оценки на распознаваемость и для повышения надежности распознавания компьютером печатных знаков каких-либо незнакомых шрифтов, т. е. не предусмотренных стандартными видами.
Как известно из математической статистики одной из наиболее часто употребляемых мер разброса некоторой величины х является стандартное отклонение выборки ох, которое
к
использовалось для оценки разброса количества несовпадений (х), получаемых от сравнения записей по направлениям знаков определенного смыслового символа, напечатанных в разных источниках и разными шрифтами, со стандартным видом, соответствующим этому смысловому символу. Например, для правильно распознаваемых букв «В» и «Я» разных шрифтов, напечатанных компьютером, в книге и газете соответственно, было получено Ох =
До
0,55, Ох, = ^ -, где разброс количеств несовпадений получается незначительным.
Аналогично величины Ох получаются малыми и для других букв и цифр разных шрифтов и разной печати. По величине Ох можно судить о степени надежного распознавания знаков определенного смыслового символа. Если при анализе распознавания каких-либо неизвестных (не предусмотренных стандартными видами) печатных шрифтов и разной печати, величины Ох получаются не порядка рассчитанных ранее, а больше, т. е. надежность распознавания знаков падает, необходимо для уменьшения Ох исправит стандартные виды, соответствующие этим знаком, или добавить дополнительные стандартные виды.
Количество несовпадений для любого знака одного шрифта удалось связать с количеством несовпадений этого же знака другого шрифта, воспользовавшись корреляционной теорией. Как известно, коэффициент корреляции можно определить как частное от деления среднего значения произведения отклонения величины х и у от их средних значений на произведение средних квадратных отклонений х и у. По теории корреляции, если коэффициент корреляции г & gt- 0,6, то можно между величинами х и у установить корреляционную зависимость и воспользоваться уравнениями регрессии для определения одной величины, например х по значениям другой, например, у.
Для разных знаков для величин х и у1, х и у2, где х — количество несовпадений для определенного шрифта компьютера (А4), у1 и у2 — количество несовпадений соответственно для шрифтов в книге (ГК-3) и в газете (Г-63), были подсчитаны величины г, которые оказались больше 0,7. Поэтому были составлены уравнения регрессии и по ним построены прямые регрессии, связывающие величины у1 и у2 с величинами х.
Коэффициент корреляции определяется по формуле:
Г =
1 п
-Е хкУк пк=1

ху
п
1 Тх1
пк=1
-2 — X
1п2
-Е Ук пк=1
-2 У
Согласно теории корреляции, когда коэффициент корреляции г приближается к единице, то корреляционная зависимость приближается к функциональной линейной. Эта зависимость между величинами х и у представляется в виде уравнений регрессии:
У — У
'-1 п Л
— Е хкУк пк=1

ХУ
1п
& quot-"- Е Хк пк=1
-2 — X
(х — X),
X X —
'-1 п л
— Е Чу к
V пк=1 ,
п N 1 ^ 2
-Е У2
V пк=1


(У — У)
-2 У
На практике принято считать, что величины достаточно связаны и уравнения регрессии справедливы, если г & gt- 0,7. Для разных букв для величин х и у1, х и у2, где х — количество несовпадений для компьютерного шрифта (А4), у1 и у2 — количество несовпадений для шрифтов в книге (ГК-3) и в газете (Г-63) были рассчитаны величины г, которые оказались больше 0,7. По величине г были найдены уравнения регрессии.
Приведем для примера результаты использования корреляционной теории для букв «В» и «Я» русского алфавита.
Из расчета для буквы «В» для величин х и у1 коэффициент корреляции с учетом средней ошибки коэффициента равен:
г = 0,994 ± 0,005,
а для этой же буквы для величин х и у2:
г = 0,94 ± 0,02.
Из расчета для буквы «Я» для величин х и у1 коэффициент корреляции:
г = 0,804 ± 0,13,
а для этой же буквы для величин х и у2:
г = 0,887 ± 0,08.
Коэффициенты корреляции близки к 1. Результат определения коэффициента показывает, что уравнениями регрессии можно пользоваться для вычислений значений одной величины по значениям другой.
Из расчета для буквы «В» для величин х и у1 уравнение регрессии:
У1х = 0,895х + 0,9,
а для этой же буквы для величин х и у2 уравнение регрессии:
У2х = 0,846х + 1,48.
Из расчета для буквы «Я» для величин х и у1 уравнение регрессии:
У1х = 0,683х + 1,4,
а для этой же буквы для величин х и у2 уравнение регрессии:
У2 = 0,745х + 1,32.
Прямые регрессии приведены на рис. 3.
Воспользовавшись результатами проведенных исследований можно сравнительно просто оценить на распознаваемость незнакомый шрифт, а также повысить надежность распознавания знаков незнакомого шрифта. Для проверки распознаваемости знака неизвестного шрифта подсчитываются количества несовпадений от сравнения кодового
описания знака только с определенным количеством стандартных видов (а не со всеми) — причем в это число стандартных видов обязательно должен входить стандартный вид, соответствующий смысловому символу знака. Затем эти количества несовпадений подставляются в найденные ранее уравнения регрессии (количество уравнений регрессии следует увеличить, включив еще несколько наиболее употребляемых печатных шрифтов), и если разбросы относительно известной прямой регрессии отсутствуют, то по предварительной оценке знак распознан читающим устройством. Таким образом, проверяются остальные знаки. Если же разбросы относительно прямых регрессии имеют место, то стандартный вид, соответствующий разбросу необходимо исправить или добавить дополнительный стандартный вид.
Следовательно, после таких операций надежность распознавания знаков незнакомого шрифта будет, по крайней мере, не меньше надежности распознавания исследованных ранее шрифтов.
а 6
У
2
1,48
3
5
4
6
8
7
1
0,9
л- = 5,7
л: = 6,8 б
1234 5678*
1234 56×8 х
Рис. 3. Прямые регрессии: а — для буквы «В», б — для буквы «Я»
ЛИТЕРАТУРА
1. Пинт Э. М. /Пинт Э.М., Романенко И. И., Петровнина И. Н., Козицин В. С, Еличев К. А. Метод распознавания печатных знаков и распознавание его на образы, связанные с автоматизацией работы дорожных машин. // Научно-технический журнал «Мир транспорта и технических машин», № 36. — Орел, Изд. ОГУ, 2011. — с. 259.
2. Пинт Э. М. /Пинт Э.М., Петровнина И. Н., Романенко И. И., Еличев К. А. Полный алгоритм рационального метода распознавания компьютером печатных знаков разных шрифтов и других символов. // Научно-теоретический журнал Вестник. БГТУ им. В. Г. Шухова, № 1, 2013. — с. 210.
3. Пинт Э. М. /Пинт Э.М., Романенко И. И., Еличев К. А. Результаты исследования читающего устройства. // Научно-теоретический журнал «Вестник» № 1. -Белгород: Изд. БГТУ им. В. Г. Шухова, 2014. — с. 182.
4. Лянденбурский В.В./ Лянденбурский В. В., Тарасов А. И., Кривобок С. А. Вероятностно-логический метод поиска неисправностей. //Журнал «Мир транспорта и технологических машин» № 1. -Орел: изд. ОГУ, 2011. -с. -3−9.
5. S. N. Srihari and E. J. Keubert, & quot-Integration of handwritten address interpretation technology into the United States Postal Service Remote Computer Reader System& quot- Proc. Int. Conf. Document Analysis and Recognition (ICDAR) 1997, IEEE-CS Press, pp. 892−896.
1. Kurzweil AI Interview with Jurgen Schmidhuber on the eight competitions won by his Deep Learning team 2009−2012.
6. A. Graves and Schmidhuber, Jurgen- Offline Handwriting Recognition with Multidimensional Recurrent Neural Networks, in Bengio, Yoshua- Schuurmans, Dale- Lafferty, John- Williams, Chris K. I.- and Culotta, Aron (eds.), Advances in Neural Information Processing Systems 22 (NIPS'-22), December 7th-10th, 2009, Vancouver, BC, Neural Information Processing Systems (NIPS) Foundation, 2009, pp. 545−552.
7. Graves, M. Liwicki, S. Fernandez, R. Bertolami, H. Bunke, J. Schmidhuber. A Novel Connectionist System for Improved Unconstrained Handwriting Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 31, no. 5, 2009.
8. D. C. Ciresan, U. Meier, J. Schmidhuber. Multi-column Deep Neural Networks for Image Classification. IEEE Conf. on Computer Vision and Pattern Recognition CVPR 2012.
9. LeCun, Y., Bottou, L., Bengio, Y., & amp- Hanner, P. (1998). Gradient-based learning applied to document recognition. Proc. IEEE, 86, pp. 2278−2324.
Рецензент: Сидоров Алексей Иванович, и. о. зав. кафедрой «Автономные информационные и управляющие системы» ПГУ профессор ФГБОУ ВПО «Пензенский государственный университет».
Pint Eduard Mikhaylovich
«Penza State University of Architecture and Construction»
Russia, Penza
Petrovnina Irina Nikolaevna
«Penza State University of Architecture and Construction»
Russia, Penza E-mail: irisha-vas@yandex. ru
Romanenko Igor'- Ivanovich
«Penza State University of Architecture and Construction»
Russia, Penza E-mail: rom1959@yandex. ru
Elichev Konstantin Aleksandrovich
«Penza State University of Architecture and Construction»
Russia, Penza E-mail: elichev. 55@mail. ru
Mathematical working of results of Investigation
of reading structure
Abstract. The authors developed reading device. Created photomultiplier system perception of printed information. Developed a computer program that implements an efficient method of identifying the computer printed characters of different fonts and characters.
The article focuses on the final part of the program for your computer and mathematical processing of results of the research of the reader.
Photomultiplier system perceives the image of the printed mark with media and converts it into rectangular pulses in a certain order in a rectangular matrix consisting of cells of the storage device of the computer. A cell corresponds to a picture element of the sign.
According to the developed program, the computer, starting with the end, bypasses written in the matrix image of the printed mark on its contour, locking rooms of main directions formed by the circuit elements.
The computer produces a major transformation of the character image, the elimination of unusual deviations of the main parts of the sign, the possible image defects. Received for the printing of the sign sequence of rooms of main directions alternately compared with sequences of directions, formed after the crawl is the perfect contours of the printed characters of the Russian alphabet (standard types). The method of this comparison are set out in the article.
In article on the basis of mathematical statistics and the theory of correlation are estimated on the recognition of printed characters & quot-unknown"- computer fonts and describes measures to improve the reliability of the recognition of printed characters of unknown fonts.
Keywords: the program- operator- matrix- print- sign- direction- scale- character- style of writing- standard view- generators horizontal- the vertical scan generator.
REFERENCES
1. Pint E.M. /Pint E.M., Romanenko I.I., Petrovnina I.N., Kozitsin V. S, Elichev K.A. Metod raspoznavaniya pechatnykh znakov i raspoznavanie ego na obrazy, svyazannye s avtomatizatsiey raboty dorozhnykh mashin. // Nauchno-tekhnicheskiy zhurnal «Mir transporta i tekhnicheskikh mashin», № 36. — Orel, Izd. OGU, 2011. — s. 259.
2. Pint E.M. /Pint E.M., Petrovnina I.N., Romanenko I.I., Elichev K.A. Polnyy algoritm ratsional'-nogo metoda raspoznavaniya komp'-yuterom pechatnykh znakov raznykh shriftov i drugikh simvolov. // Nauchno-teoreticheskiy zhurnal Vestnik. BGTU im. V.G. Shukhova, № 1, 2013. — s. 210.
3. Pint E.M. /Pint E.M., Romanenko I.I., Elichev K.A. Rezul'-taty issledovaniya chitayushchego ustroystva. // Nauchno-teoreticheskiy zhurnal «Vestnik» № 1. -Belgorod: Izd. BGTU im. V.G. Shukhova, 2014. — s. 182.
4. Lyandenburskiy V.V./ Lyandenburskiy V.V., Tarasov A.I., Krivobok S.A. Veroyatnostno-logicheskiy metod poiska neispravnostey. //Zhurnal «Mir transporta i tekhnologicheskikh mashin» № 1. -Orel: izd. OGU, 2011. -s. -3−9.
5. S. N. Srihari and E. J. Keubert, & quot-Integration of handwritten address interpretation technology into the United States Postal Service Remote Computer Reader System& quot- Proc. Int. Conf. Document Analysis and Recognition (ICDAR) 1997, IEEE-CS Press, pp. 892−896.
1. Kurzweil AI Interview with Jurgen Schmidhuber on the eight competitions won by his Deep Learning team 2009−2012.
6. A. Graves and Schmidhuber, Jurgen- Offline Handwriting Recognition with Multidimensional Recurrent Neural Networks, in Bengio, Yoshua- Schuurmans, Dale- Lafferty, John- Williams, Chris K. I.- and Culotta, Aron (eds.), Advances in Neural Information Processing Systems 22 (NIPS'-22), December 7th-10th, 2009, Vancouver, BC, Neural Information Processing Systems (NIPS) Foundation, 2009, pp. 545−552.
7. Graves, M. Liwicki, S. Fernandez, R. Bertolami, H. Bunke, J. Schmidhuber. A Novel Connectionist System for Improved Unconstrained Handwriting Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 31, no. 5, 2009.
8. D. C. Ciresan, U. Meier, J. Schmidhuber. Multi-column Deep Neural Networks for Image Classification. IEEE Conf. on Computer Vision and Pattern Recognition CVPR 2012.
9. LeCun, Y., Bottou, L., Bengio, Y., & amp- Hanner, P. (1998). Gradient-based learning applied to document recognition. Proc. IEEE, 86, pp. 2278−2324.

ПоказатьСвернуть
Заполнить форму текущей работой