Разработка нейросетевой технологии и программного продукта авторизации пользователя

Тип работы:
Дипломная
Предмет:
Программирование


Узнать стоимость

Детальная информация о работе

Выдержка из работы

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«КУБАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

(ФГБОУ ВПО КубГУ)

Кафедра информационных технологий

ДИПЛОМНАЯ РАБОТА

РАЗРАБОТКА НЕЙРОСЕТЕВОЙ ТЕХНОЛОГИИ И ПРОГРАММНОГО ПРОДУКТА АВТОРИЗАЦИИ ПОЛЬЗОВАТЕЛЯ

Работу выполнил: М.Б. Ревякин

Специальность: 10 200 «Прикладная

математика и информатика"

Научный руководитель

к. ф. — м. н., доцент Ю.В. Кольцов

Нормоконтроллер А.В. Харченко

Краснодар 2013

Реферат

Дипломная работа 55 с., 2 ч., 8 рис., 11 табл., 18 источников

Объектом исследования являются возможности применения искусственных нейронных сетей для решения задачи биометрической идентификации личности на основе её динамических характеристик.

Цель работы состоит в разработке программного продукта, осуществляющего идентификацию и авторизацию личности на основе её клавиатурного почерка.

В процессе работы было разработано приложение, обладающее доступным графическим интерфейсом пользователя, отвечающее поставленным задачам.

Ключевые слова: ИСКУССТВЕННАЯ НЕЙРОННАЯ СЕТЬ, БИОМЕТРИЯ, БИБЛИОТЕКА QT, ИДЕНТИФИКАЦИЯ, АУТЕНТИФИКАЦИЯ, КЛАВИАТУРНЫЙ ПОЧЕРК.

Содержание

Введение

1. Общие принципы работы систем биометрической идентификации личности

1.1 Структуры систем биометрической идентификации личности по особенности воспроизведения действий

1.2 Особенности применения нейросетевых решающих правил в системах биометрической идентификации

1.3 Измерение близости образа к биометрическому эталону мерой Хемминга

1.4 Евклидова мера близости к центру биометрического эталона

1.5 Линейное разделение пространства контролируемых параметров (персептрон)

1.6 Проблемы обучения искусственных нейронных сетей

2. Описание и реализация программного продукта

2.1 Постановка задачи

2.2 Программные инструменты, примененные при разработке приложения

2.2.1 Кросс-платформенная библиотека Qt

2.2.2 Библиотека классов BPNeuralNetwork

2.2.3 Модель прямого ввода ОС Windows Raw Input

2.2.4 Система управления базами данных SQLite

2.3 Описание базы данных

2.4 Структура нейронной сети и формат данных

2.5 Описание ключевых моментов реализации приложения

2.5.1 Разработка графического интерфейса

2.5.2 Работа с базами данных средствами Qt

2.5.3 Многопоточная работа приложения

2.6 Основные принципы взаимодействия пользователя с системой

Заключение

Список использованных источников

Введение

Бурный рост информатизации общества, рост доступности персональных компьютеров, увеличение объемов денежных операций с использованием ПК, развитие информационных коммуникаций типа Internet существенно повысили требования к уровню достоверности и защищенности информации каждого участника информационного сообщества.

Информационное сообщество адекватно отвечает подобным запросам, разрабатывая все более сложные, надежные и эффективные средства защиты.

Актуальность разработки биометрических систем безопасности состоит в том, что они позволят существенно уменьшить влияние человеческого фактора на защитные механизмы. Подобные системы должны самостоятельно узнавать своего пользователя и подчиняться только ему.

Решение проблемы разработки подобных систем классическими средствами, например, статистической обработкой данных, может оказаться бесперспективным в связи с тем, что в вопросах биометрической идентификации часто приходится использовать множество плохих данных. В этом плане перспективным оказывается использование искусственных нейронных сетей.

В последние десятилетия в мире активно развивается новая прикладная область математики, специализирующаяся на искусственных нейронных сетях (ИНС). Актуальность исследований в этом направлении подтверждается массой различных применений ИНС. Искусственные нейронные сети способны решать широкий круг задач распознавания образов, идентификации, прогнозирования, оптимизации, управления сложными объектами.

Целью дипломной работы является разработка нейросетевой технологии и программного продукта, осуществляющего биометрическую идентификацию личности посредством ее клавиатурного почерка.

1. Общие принципы работы систем биометрической идентификации личности

1.1 Структуры систем биометрической идентификации личности по особенности воспроизведения действий

Биометрические системы, простроенные на анализе особенностей воспроизведения голоса, рукописного и клавиатурного почерка, имеют много общего. Это позволяет использовать одну обобщенную блок-схему для описания всех биометрических систем этого класса, которая приведена на рисунке 1.1 и отображает основные этапы обработки информации [1].

Первым этапом обработки является преобразование неэлектрических величин (координат конца пера, звукового давления, положения рук) в электрические сигналы. Далее эти сигналы оцифровываются и вводятся в процессор, осуществляющий программную обработку данных.

Рисунок 1.1 — Обобщенная блок схема биометрических систем идентификации личности на основе динамических характеристик

При программной обработке выполняется масштабирование амплитуд входных сигналов, приводящее их к некоторому эталонному значению.

Кроме этого, осуществляется приведение сигналов к единому масштабу времени, дробление сигналов на отдельные фрагменты с последующим сдвигом фрагментов сигнала до оптимального совмещения с эталонным расположением.

После приведения к эталонному значению масштабов и сдвига фрагментов сигналов осуществляется вычисление вектора функционалов (вектора контролируемых параметров). Как правило, вычисляются линейные функционалы, но нет запретов и на вычисление более сложных нелинейных функционалов [1].

Перечисленные выше пять первых блоков обработки информации работают по одним и тем же алгоритмам, независимо от режима работы самой биометрической системы. Именно по этой причине они образуют последовательное соединение блоков без ветвлений. Режим работы системы (обучение или аутентификация) определяет совокупность операций, далее осуществляемых с измеренным вектором параметров.

В случае если биометрическая система находится в режиме обучения, векторы параметров поступают в блок правил обучения, который формирует биометрический эталон личности. Так как динамические образы личности обладают существенной изменчивостью, для формирования биометрического эталон требуется несколько примеров реализаций одного и того же образа. В простейшем случае биометрический эталон может формироваться в виде двух векторов: вектора математических ожиданий контролируемых параметров и вектора дисперсий этих параметров.

В режиме аутентификации вектор контролируемых параметров, полученный из предъявленного образа, сравнивается решающим правилом с биометрическим эталоном. Если предъявленный вектор оказывается близок к биометрическому эталону, принимается положительное аутентификационное решение. При значительных отличиях предъявленного вектора и его биометрического эталона осуществляется отказ в аутентификации. Если протокол аутентификации не слишком жесткий, то пользователю предоставляются дополнительные попытки повторной аутентификации.

Следует подчеркнуть, что вид используемого системой решающего правила и вид биометрического эталона неразрывно связаны. Можно считать, что при разработке системы разработчик задается некоторым решающим правилом и уже оно однозначно определяет вид биометрического эталона или биометрических данных личности. Формально можно считать, что возможно существование достаточно большого числа видов различных решающим правил, соответственно, должно существовать множество различных видом биометрических эталонов. Однако это не так и на практике используется весьма ограниченное число достаточно эффективных решающих правил и малое число соответствующих им биометрических эталонов.

1.2 Особенности применения нейросетевых решающих правил в системах биометрической идентификации

Обычно деление алгоритма принятия решения на само решающее правило и биометрический эталон идентифицируемой личности не вызывает особых затруднений. В этом плане, пожалуй, исключением является искусственные нейронные сети. Для искусственных нейронных сетей такие параметры как число входов нейрона, число нейронов, вид функции возбуждения, число слоев сети, вид связей в сети, скорее всего следует рассматривать как параметры структуры решающего правила. Значения нейровесов и значения смещающих коэффициентов, полученные для конкретной личности, следует рассматривать как параметры некоторого биометрического эталона, предназначенного для нейросетевого решающего правила с конкретной структурой [1].

Еще одной особенностью нейросетевых решающих правил является существенное перераспределение вычислительных ресурсов, затрачиваемых на обучение и аутентификацию. Как правило, оказывается, что обучение нейронных сетей требует существенно больше вычислительных ресурсов в сравнении с аутентификацией (самим принятием решения) [3, 4]. Для большинства классических решающих правил формирование биометрического эталон вообще является тривиальной задачей, не требующей особых ресурсов, и сводится к вычислению математических ожиданий и дисперсий. Для нейросетевого принятия решения настройка весовых коэффициентов сети — это далеко не простая задача, которая подчас не может быть решена в рамках приемлемых затрат вычислительных ресурсов. Автомат, настраивающий искусственную нейронную сеть на реальных биометрических данных, часто попадает в тупики обучения, требующие огромных затрат вычислительных ресурсов для последующего выхода из них [2]. Для того чтобы исключить попадание настраивающего нейросеть автомата в тупики обучения, следует уметь эти тупики отслеживать и обходить их стороной, экономя тем самым затрачиваемые на обучение ресурсы.

1.3 Измерение близости образа к биометрическому эталону мерой Хемминга

Описанная обобщенная блок-схема системы биометрической аутентификации (идентификации) во многом носит абстрактный характер. Наполним эту блок-схему конкретным содержанием, задавшись одним из самых простых решающих правил и меру Хемминга [5]. Будем считать, что система идентификации осуществляет измерение вектора, состоящего из существенно коррелированных биометрических параметров. Кроме того, будем считать, что личность на этапе идентификации предъявила своих динамических образов, и соответственно, мы имеем реализаций векторов.

Проанализировав имеющиеся реализации векторов биометрических параметров, мы можем найти характерный для личности интервал изменения каждого конкретного параметра. Если теперь при попадании параметра в интервал присваивать, а при выпадении из интервала присваивать, то мы получим вектор Хемминга. Для «Своего» этот вектор должен состоять практически из одних нулей. Для «Чужого», предъявляющего иные биометрические параметры, вектор Хемминга будет иметь много несовпадений (много единиц).

Для рассматриваемого случая биометрическим эталоном, зафиксированным при обучении, являются значения минимумов и максимумов измеряемых параметров. Тогда абсолютное значение расстояния Хемминга до биометрического эталона следует определить как общее число выпадений измерений за интервалы допустимых значений биометрического эталона. Расстояние Хемминга всегда не отрицательно и может изменяться от 0 до (где — число контролируемых биометрических параметров).

Число примеров при обучении биометрической системы может существенно варьироваться. Как правило, биометрические системы, анализирующие динамические образы, опираясь на меру Хемминга, способны удовлетворительно работать при их обучении на 5…7 примерах, однако для их хорошей работы требуется порядка 20…30 примеров [1]. При этом, использование более 50…60 примеров для обучения системы перестает приносить ощутимые преимущества.

Следует отметить, что задание в биометрическом эталоне интервалов допустимых значений измеряемых параметров может осуществляться различными способами. На малых обучающих выборках целесообразно осуществлять прямое вычисление минимума и максимума измеренных значений контролируемых параметров. При объеме обучающей выборки в пять и более примеров становится целесообразным вычисление математического ожидания значений параметров и их дисперсий. А этом случае значение минимальной и максимальной границ принято вычислять следующим образом:

, (1. 1)

, (1. 2)

где число использованных при обучении примеров; заданное значение вероятности ошибок первого рода (в этих операциях принимают равным 0,1); - коэффициенты Стьюдента, которые приведены в таблице 1. 1) [7].

Таблица 1.1 — Коэффициенты Стьюдента

Число примеров

Вероятность ошибки первого рода — (вероятность отказа подлинному автору в аутентификации)

0,1

0,05

0,03

0,025

0,02

0,015

0,01

0,005

0,0025

2

3,07

6,31

10,56

12,5

15,9

21,21

31,82

63,7

127,3

3

1,88

2,92

3,89

4,3

4,85

5,64

6,97

9,92

14,1

4

1,63

2,35

2,95

3,18

3,48

3,82

4,54

5,84

7,54

5

1,53

2,13

2,60

2,78

2,99

3,25

3,75

4,6

5,6

6

1,47

2,01

2,44

2,57

2,75

3,01

3,37

4,03

4,77

7

1,43

1,94

2,31

2,45

2,61

2,83

3,14

3,71

3,32

8

1,41

1,89

2,24

2,36

2,51

2,72

3

3,5

4,03

9

1,39

1,86

2,19

2,37

2,45

2,63

2,9

3,36

3,83

10

1,38

1,83

2,15

2,26

2,4

2,57

2,82

3,25

3,69

12

1,36

1,8

2,09

2,16

2,33

2,49

2,72

3,11

3,49

14

1,35

1,77

2,06

2,14

2,28

2,43

2,65

3,01

3,37

21

1,33

1,73

1,99

2,09

2,19

2,33

2,53

2,85

3,15

41

1,3

1,68

1,93

2,02

2,12

2,25

2,42

2,7

2,97

?

1,28

1,65

1,89

1,96

2,06

2,18

2,33

2,58

2,81

При вычислении математического ожидания контролируемого параметра может использоваться обычная формула [6]

. (1. 3)

Основным недостатком (1. 3) является то, что при обучении приходится помнить значения всех измеренных ранее параметров. Эта проблема усугубляется тем, что в неопределенном будущем может понадобиться дообучение биометрической системе и, следовательно, при использовании (1. 3) приходится хранить все данных обучении неопределенно долго. Более удобным для реализации является рекуррентное вычисление математического ожидания:

. (1. 4)

При использовании (1. 4) приходится помнить только общее число уже использованных примеров и текущее значение математического ожидания. На каждом последующем шаге появляется новое значение математического ожидания и запоминается число учтенных примеров [17].

Аналогичная ситуация возникает и при вычислении дисперсии контролируемых параметров. Если хранятся все значения измеренных параметров, то может быть использована обычная форма вычисления:

. (1. 5)

При необходимости экономии памяти используется рекуррентное вычисление дисперсии:

. (1. 6)

После того как сформирован биометрический эталон, возможна реализация процедур аутентификации зарегистрированного пользователя. При осуществлении процедур аутентификации «Свой» пользователь достаточно редко ошибается и, соответственно, мера Хемминга оказывается малой. Иначе обстоит дело при попытках аутентифицироваться «Чужих». Для «Чужого» ошибки оказываются гораздо более частыми. Эта типовая ситуация иллюстрируется рисунке 1. 2, где приведен пример гистограмм «Свой» — «Чужой» биометрической системы контроля динамики регистрируемого сигнала.

Рисунок 1.2 — Пример гистограмм распределения значений меры Хемминга

Гистограмма получена для меры Хемминга, построенной на контроле 80 параметров [1]. Из рисунка 1.2 видно, что для «Своего» наиболее вероятным отклонением является значение и зафиксированное значение меры Хемминга не превосходит 5. Для «Чужого», пытающегося подстроить динамику сигнала, мера Хемминга принимает значения от 7 и выше. В качестве разделяющего порога областей «Свой» «Чужой» может быть принято непопадание в заданные интервалы 6 контролируемых параметров.

Этот пример соответствует хорошему разделению областей «Свой» и «Чужой» с достаточно примитивным решающим правилом. Для того чтобы задать порог, разделяющий эти области, необходимо вычислить значения математического ожидания меры Хемминга для области «Свой», дисперсию для этой же области. Тогда можно воспользоваться следующими соотношениями [1]:

«Свой» если, (1. 7)

«Чужой» если, (1. 8)

где — коэффициенты Стьюдента; - число примеров при обучении; - заданная вероятность ошибки первого рода для системы в целом (обычно принимается.

Следует подчеркнуть, что (1. 7), (1. 8) корректны только для закона распределения значений меры Хемминга, близкого к нормальному закону. Нормализация этого закона осуществляется при условии достаточно большого числа контролируемых параметров и выборе достаточно узких диапазонов допустимых значений параметров биометрического эталона. Искусственное сужение диапазонов осуществлено в формулах (1. 1), (1. 2) увеличением вероятности ошибки с обычной величины 0,01 до 0,1. Опыт показал, что оптимальным является растяжение области «Свой» с тем, чтобы она занимала от 20% до 40% области возможных значений меры Хемминга [1]. Это соотношение, с одной стороны, позволяет иметь закон распределения значений области «Свой», близкий к нормальному, а с другой стороны, корректно осуществлять сбор информации аудита безопасности путем наблюдения за поведением «Своих» и «Чужих».

1.4 Евклидова мера близости к центру биометрического эталона

Наиболее привычным для большинства инженеров является использование линейного Евклидова пространства и измерение параметров в виде их проекции на ортонормированную систему координат. Евклидова мера расстояния между некоторым вектором и центром биометрического эталона в ортогональной системе координат находится следующим образом [18]:

. (1. 9)

В векторной форме выражение (1. 9) будет выглядеть несколько иначе:

. (1. 10)

Как показывает практика, вычисление Евклидовой меры дает достаточно хорошие результаты только в действительно ортогональных системах координат для векторов со слабо коррелированными компонентами. К сожалению, задача ортогонализации системы измеряемых биометрических параметров далеко не тривиально и в реальных биометрических системах решается только в первом приближении. Если же система учитываемых биометрических признаков не ортогональна, то расстояние до центра биометрического эталона вычисляется через соответствующий вариант квадратичной формы

, (1. 11)

где — положительно определенная квадратная матрица, описывающая взаимосвязь проекции осей неортогональной системы координат.

Из линейной алгебры [8, 18] известно, что любая система координат может быть ортогонализирована некоторым линейным преобразованием

, (1. 12)

Где — матрица ортогонализующего преобразования; - новые координаты вектора в новой ортогональной системе координат.

В новой ортогональной системе координат Евклидова мера будет вычисляться следующим образом:

, (1. 13)

где — характеристические числа положительно определенной матрицы квадратичной формы (1. 11), записанной в исходной системе координат.

Следует отметить, что выражение (1. 13) соответствует крайне важному понятию взвешенной Евклидовой меры. Взвешивание появляется либо при ортогонализации исходно неортогональной системы координат (1. 10), либо является следствием минимизации ошибки вычислений в неортогональной системе.

Для неортогональных систем координат использование соотношений (1. 9) и (1. 10) может приводить к большим ошибкам, причем эти ошибки подчас оказываются одного знака [1]. Например, для всех точек I и III четверти координаты в неортогональной системе могут быть меньше по сравнению с ортогональной системой. Это приводит к занижению расстояний и может быть скорректировано с помощью введения некоторых поправочных коэффициентов. Для точек в II и IV четвертях та же косоугольная система дает завышение значения длин, и оно должно быть скорректировано значениями поправочных коэффициентов.

Точное значение Евклидовой меры дает только квадратичная форма (1. 11), учитывающая комбинационное влияние не нулевых взаимных проекций осей. Соотношения вида (1. 9), (1. 10) комбинационных составляющих не учитывают и, соответственно, с их использованием возможно только приближенная оценка:

, (1. 14)

где — положительные весовые коэффициенты, минимизирующие значение ошибки для наиболее вероятных значений вектора.

Задача подбора весовых коэффициентов не имеет строгого решения, обычно их подбирают, стремясь сохранить их произведение близким к единице:

. (1. 15)

В случае использования в биометрических системах Евклидовой взвешенной меры расстояния роль биометрического эталона играют вектор математического ожидания значений параметров и вектор весовых коэффициентов.

1.5 Линейное разделение пространства контролируемых параметров (персептрон)

Одним из наиболее популярных на сегодня решающих правил является использование линейных разделяющих функций.

Розенблат [9] дал доказательство теоремы о возможности обучения персептронов, осуществляющих деление многомерного пространства значений признаков некоторой гиперплоскостью.

Персептрон описывается следующими уравнениями [3]:

«Свой» при, (1. 16)

«Чужой» при, (1. 17)

где — весовые коэффициенты, подбираемые при настройке персептрона (при его обучении на примерах); С — смещающая гиперплоскость постоянная составляющая (подбирается при настройке).

Персептрон или искусственный нейрон может быть представлен как сумматор входных сигналов и некоторый нелинейный элемент (пороговый элемент — компаратор). Отклик сумматора (линейная часть персептрона) может быть записан в обычной форме [3]:

. (1. 18)

Аналогично отклик линейной части персептрона может быть записан в векторной форме:

, (1. 19)

где — вектор строка из коэффициентов весового суммирования; - вектор столбец из измеренных биометрических параметров.

Удобнее всего рассматривать суть персептронов, реализующих линейные разделяющие правила, на их простейшем варианте с двумя входами. В этом случае задача синтеза оптимального решающего правила сводится к проведению на плоскости прямой, наилучшим образом разделяющей множества биометрических параметров «Свой» и «Чужой». Пример решения этой задачи приведен на рисунке 1. 3

Рисунок иллюстрирует тот факт, что путем вращения и сдвига исходной системы координат иногда удается добиться полного разделения областей «Свой» и «Чужой», разместив их в разных четвертях новой системы координат. Следует подчеркнуть, что на рисунке (1. 3) изображена достаточно простая ситуация с одинаковыми корреляционными связями параметров областей «Свой» и «Чужой», последнее несколько упрощает задачу в силу параллельности главных осей эллипса «Свой» и эллипса «Чужой». Для ситуации равных корреляционных связей внутри вектора биометрических параметров поиск оптимального поворота системы координат совпадает с решением задачи декорреляции биометрических параметров [1].

(1. 20)

Рисунок 1.3 — Декоррелирующий поворот системы координат, позволяющий добиться линейной разделимости множеств

Для получения оптимального преобразования системы координат необходимо домножить вектор входных параметров на соответствующую декорреляционную матрицу, ослабляя, насколько это возможно, взаимное влияние биометрических параметров [1]:

, (1. 21)

где — вектор-строка единичных весовых коэффициентов.

Соотношение (1. 20) эквивалентно получению весовых коэффициентов персептрона (нейрона) суммированием элементов декоррелирующей матрицы:

, (1. 22)

где — элементы декоррелирующей матрицы; - номер строки элемента матрицы; - номер столбца соответствующего элементов матрицы.

Следует подчеркнуть, что основным достоинством процедуры вычисления весовых коэффициентов персептрона (нейрона) вида (1. 22) является ее детерминированность. Детерминированность вычислительных процедур является весьма важным свойством для биометрических систем, так как эти системы должны гарантированно обучаться на нескольких предъявленных примерах и поиск весовых коэффициентов должен быть осуществлен за достаточно малый интервал времени. Процедуры декорреляции, построенные на обращении матриц или их ортогональном разложении, имеют квадратичную сложность, в то время как другие известные алгоритмы, построенные на подборе параметров, имеют экспоненциальную сложность по отношению к числу входов нейрона.

В настоящее время известно более сотни алгоритмов стохастического итерационного подбора значений весовых коэффициентов [10], однако каждый из них следует с осторожностью применять в биометрии с определенной осторожностью. Применение итерационных методов случайного подбора весовых коэффициентов линейной части нейрона, во-первых, может длиться неограниченное время (зацикливание), во-вторых, могут быть получены ошибочные значения коэффициентов, соответствующие одному из локальных минимумов функции настройки. Все это делает случайные методы настройки (подбора) нейровесов нежелательными в биометрических системах, так как они достаточно часто приводят систему в один из возможных тупиков настройки.

Кроме того, различные методы случайного подбора (поиска) коэффициентов следует рассматривать лишь как способы некоторого сокращения времени полного перебора всех возможных комбинаций значений нейровесов. С этой точки зрения детерминированные процедуры вычисления нейровесов через синтез декоррелирующей матрицы и суммирование ее элементов всегда будут иметь максимально возможную скорость «поиска» решения.

Следует обратить особое внимание на то, что все проведенные выше рассуждения относятся к достаточно простой ситуации, когда области «Свой» и «Чужой» имеют одинаковые коэффициенты внутренней корреляции между параметрами (главные оси эллипсов обоих областей параллельны). Эта простейшая ситуация не приводит к неопределенности при синтезе матрицы декорреляции по исходным корреляционным матрицам и в силу их полной тождественности [1].

Неопределенность возникает только в том случае, когда. В этом случае преобразование системы координат для устранения корреляционных связей биометрических параметров подлинного пользователя не может привести к аналогичному результату для других пользователей. Выход из этой неоднозначной ситуации состоит в усреднении корреляционных матрицы областей «Свой» и «Чужой».

Можно показать, что для областей «Свой» и «Чужой», соответствующих многомерному нормальному закону распределения значений и имеющих разные коэффициенты корреляции между одноименными параметрами, оптимальным будет являться преобразование системы координат, диагонализирующее следующую корреляционную матрицу:

+. (1. 23)

При диагонализации матрицы (1. 23) получается новая система координат

. (1. 24)

Естественно, что стартовые условия для синтеза декоррелирующей матрицы в виде (1. 23) оказываются достаточно точны только для нормального многомерного закона распределения значений. Однако с ростом размерности матриц необходимость в гипотезе о нормальном распределении ослабевает, так как сказывается эффект нормализации суммы большого числа случайных отклонений. Сказывается то, что диагонализация корреляционной матрицы выполняется не сама по себе, а только с целью последующего суммирования линейной частью персептрона.

Кроме подбора весовых коэффициентов искусственного нейрона (персептрона) еще одной важной задачей является правильный выбор смещающей постоянной составляющей. Произвольное изменение значения постоянной составляющей приводит к появлению множества параллельных разделяющих прямых. Необходимо, исходя из некоторых соображений, выбрать одну из множества разделяющих прямых. В общем случае эта задача оказывается неоднозначной и достаточно сложной, но она имеет простое точное решение в рамках гипотезы нормального закона распределения плотностей и. Если гипотеза нормального закона хорошо выполняется, то постоянная может быть найдена путем проведения разделяющей линии через точку равновероятных ошибок первого и второго рода [1].

Точка равновероятных ошибок первого рода (отказ подлинному владельцу биометрии) и ошибок второго рода (пропуск злоумышленника) находится, исходя из условия

, (1. 25)

где — площадь хвоста распределения «Свой», отсеченного справа порогом; - площадь хвоста распределения «Чужой», отсеченного слева порогом.

В свою очередь, выполнения (1. 25) можно легко добиться, зная значения весовых коэффициентов. Для этого достаточно предъявить почти настроенному персептрону несколько примеров подлинных биометрических образов и математическое ожидание и стандарт отклонения области «Свой». Кроме того, необходимо предъявить почти настроенному персептрону несколько образов биометрии «Чужой» и вычислить для них математическое ожидание и стандарт отклонения. После этого точка равновероятных ошибок находится путем деления отрезка пропорционально стандартам и. Расстояние до точки от центра биометрического эталона может быть вычислено следующим образом:

. (1. 26)

Аналогично может быть вычислено расстояние от проекции разделяющей линейной функции (дискриминанты) до центра второй области «Чужой»:

. (1. 27)

Очевидно, что, пользуясь уравнениями (1. 26), (1. 27), нетрудно найти положение проекции линейной разделяющей функции (гиперплоскости), близкое к оптимальному. При необходимости положение проекции разделяющей линии дополнительно может быть уточнено путем требуемого изменения соотношения между вероятностями ошибок первого и второго рода. Проекция линии (гиперплоскости) может быть сдвинута в любую сторону из точки равновероятных ошибок.

1.6 Проблемы обучения искусственных нейронных сетей

Нейронные сети (линейные и нелинейные) являются естественным способом поиска общего решения через объединение множества частных решений, полученных по группам биометрических данных. Основной проблемой применения искусственных нейронных сетей является их обучение или проблема поиска значений нейровесов нейронов и коэффициентов смещения.

Под обучением нейронной сети биометрической системы будем понимать процесс предъявления ей примеров группы биометрических образов «Свой» и «Чужой», а также подбор весов нейронов с тем, чтобы сеть могла с заданной вероятностью ошибок разделять эти две группы биометрических образов. На сегодня известно порядка сотни алгоритмов обучения искусственных нейронных сетей [10, 11]. Все известные алгоритмы обучения сетей следует разделить на два больших класса:

· обучение с учителем;

· самообучение сетей без учителя.

Наиболее важным для биометрии является обучении с учителем, причем обучение с квалифицированным и добросовестным учителем, искренне желающим обучить систему. Изначально учитель должен предоставить системе достоверную и достаточно полную информацию о вариантах воспроизведения распознаваемого биометрического образа. Если учитель недобросовестен и преднамеренно дает искаженные образы, то биометрическая система в принципе не должна на них обучаться. В этом случае биометрическая система должна сама отказаться от обучения, задокументировав свой отказ от обучения и избежав тем самым преднамеренной или неумышленной компрометации.

Обучение без учителя на сегодня представляет для биометрии достаточно абстрактный интерес. На сегодня нет примеров эффективного практического применения обучения без учителя существующих биометрических систем [1].

Следует подчеркнуть, что функция отказа от обучения «Не могу обучиться» является стандартной для различных программных пакетов обучения искусственных нейронных сетей. Однако при этом, как правило, на функцию отказа от обучения разработчики пакета сваливают все свои огрехи. Как следствие, функция отказа постоянно срабатывает, перекладывая ответственность за принятое решение на учителя. В биометрических системах этого делать нельзя, так как системы должны быть максимально дружественны по отношению к пользователю. Они должны снимать с пользователя (учителя) интеллектуальную нагрузку. В этом плане пакеты настройки нейросети биометрических систем должны кардинально отличаться от аналогичных универсальных пакетов. Программы настройки нейросети биометрических систем должны быть гораздо более корректными, более глубоко и детально анализировать качество исходного материала и возможные тупики настройки. Кроме того, они должны гарантировать вполне определенное качество обучения и не вводить в заблуждение «потенциальных пользователей» завышенными или заниженными показателями.

Учитывая отмеченное выше, можно утверждать, что биометрические программы настройки нейросетей должны быть построены на тщательном анализе различных дефектов исходных компонент процесса обучения. Они должны быть способны численно измерять значения дефектов, если требуется обходить выявленные и измеренные дефекты однозначно и быстро, осуществляя процесс обучения.

2. Описание и реализация программного продукта

2.1 Постановка задачи

Необходимо разработать программный продукт, предназначенный для осуществления аутентификации пользователя на основе динамических характеристик его биометрии, в частности на основе его особенностей ввода данных с клавиатуры. Такое программное обеспечение в процессе своего функционирования должно решать следующие основные задачи:

— чтение данных с клавиатуры и выявление особенностей ввода текста пользователем;

— выполнение идентификации пользователя;

— выполнение аутентификации пользователя.

Кроме того, разрабатываемое приложение должно отвечать следующим требованиям:

— наличие понятного пользователю графического интерфейса;

— обеспечение возможности хранения данных, полученных от пользователя на протяжении всего времени работы приложения; исключение необходимости осуществления повторного ввода данных, необходимых для функционирования приложения;

— обеспечение функционирования приложения для любого количества пользователей;

— обеспечение возможности исключения пользователя из списка пользователей, успешно аутентифицируемых системой;

— наличие функционала для уточнения особенностей ввода текста пользователем с целью повышения точности его аутентификации;

— осуществление контроля любых попыток аутентификации пользователей.

2.2 Программные инструменты, примененные при разработке приложения

В рамках поставленной задачи было разработано приложение, отвечающее перечисленным требованиям. Для этого были применены следующее программное обеспечение и технологии:

— язык программирования C++;

— среда разработки Visual Studio 2010;

— Qt: кросс-платформенный инструментарий разработки ПО;

— библиотека классов BPNeuralNetwork;

— Raw Input: модель прямого ввода ОС Windows;

— встраиваемая база данных SQLite.

Разработка прототипа приложения была осуществлена ранее в виде нескольких отдельных утилит, консольных приложений, частично решающих перечисленные выше требования. В качестве языка программирования применялся язык программирования общего назначения C++, с использованием объектно-ориентированной парадигмы.

2.2.1 Кросс-платформенная библиотека Qt

Перед началом разработки полноценного приложения, отвечающего озвученным выше требованиям, было принято решение продолжать разработку на языке C++. В качестве инструментария для создания графического интерфейса была выбрана кросс-платформенная библиотека разработки программного обеспечения Qt, разработкой которого в данный момент продолжает заниматься финская компания Digia.

Библиотека Qt в первую очередь предназначена для разработки программного обеспечения на языке программирования C++, однако также существуют её «привязки» ко многим другим языкам программирования, таким как Python, Ruby, Java, PHP и другие.

Qt позволяет запускать написанное с его помощью программное обеспечение в большинстве современных операционных систем путём простой компиляции программы для каждой операционной системы без изменения исходного кода. Включает в себя все основные классы, которые могут потребоваться при разработке прикладного программного обеспечения, начиная от элементов графического интерфейса и заканчивая классами для работы с сетью, базами данных и XML. Qt является полностью объектно-ориентированным, легко расширяемым и поддерживающим технику компонентного программирования.

Отличительная особенность Qt от других библиотек — использование Meta Object Compiler (MOC) — предварительной системы обработки исходного кода (в общем-то, Qt — это библиотека не для чистого C++, а для его особого наречия, с которого и «переводит» MOC для последующей компиляции любым стандартным C++ компилятором). MOC позволяет во много раз увеличить мощь библиотек, вводя такие понятия, как слоты и сигналы. Кроме того, это позволяет сделать код более лаконичным. Утилита MOC ищет в заголовочных файлах на C++ описания классов, содержащие макрос Q_OBJECT, и создаёт дополнительный исходный файл на C++, содержащий метаобъектный код [12].

Qt позволяет создавать собственные плагины и размещать их непосредственно в панели визуального редактора. Также существует возможность расширения привычной функциональности виджетов, связанной с размещением их на экране, отображением, перерисовкой при изменении размеров окна.

Одним из весомых преимуществ проекта Qt является наличие качественной документации[12]. Статьи документации снабжены большим количеством примеров. Исходный код самой библиотеки хорошо форматирован, подробно комментирован и легко читается, что также упрощает изучение Qt.

2.2.2 Библиотека классов BPNeuralNetwork

Для моделирования искусственной нейронной сети применялись возможности самописной библиотеки BPNeuralNetwork. Она представляет собой библиотеку классов, реализующих искусственную нейронную сеть, моделирующую персептрон. Она содержит классы Neuron, Layer и NeuralNet, которые моделируют сущности нейрон, слой и нейронная сеть соответственно. Поскольку библиотека написана с применением объектно-ориентированной парадигмы, то она предоставляет возможности для расширения её функциональности путем наследования перечисленных классов и разработки собственных реализаций нейронных сетей. Так, в состав библиотеки входят классы NeuronBP, LayerBP и NeuralNetBP, которые реализуют частный случай персептрона — многослойный персептрон по Румельхарту.

Обучение такого персептрона проводится по методу обратного распространения ошибки, являющегося градиентным алгоритмом обучения с учителем.

На рисунке 2.1 представлена UML-диаграмма библиотеки BPNeuralNetwork.

2.2.3 Модель прямого ввода ОС Windows Raw Input

В операционной системе Microsoft Windows ловушкой, или хуком (hook) называется механизм перехвата событий с использованием особой функции (таких как передача сообщений Windows, ввод с мыши или клавиатуры) до того, как они дойдут до приложения. Эта функция может затем реагировать на события и, в некоторых случаях, изменять или отменять их [13].

Эта модель перехвата сообщений имеет ряд недостатков с точки зрения разработчиков приложений. Так, для получения ввода от нестандартного устройства приложение должно выполнить значительное число операций: открыть устройство, периодически его опрашивать, заботиться о возможности параллельного использования устройства другим приложением и т. д.

Рисунок 2.1 — UML-диаграмма библиотеки классов BPNeuralNetwork

Поэтому в последних версиях операционной системы Windows была предложена альтернативная модель ввода, названная моделью прямого ввода, упрощающая разработку приложений, использующих нестандартные устройства ввода [14].

Модель прямого ввода отличается от оригинальной модели ввода Windows. В обычной модели приложение получает устройство — независимый ввод в форме сообщений (таких как WM_CHAR), которые посылаются окнам приложения. В модели прямого ввода приложение должно зарегистрировать устройства, от которых оно хочет получать ввод. Далее приложение получает пользовательский ввод через сообщение WM_INPUT. Поддерживается два способа передачи данных — стандартный и буферизированный; для интерпретации введенных данных приложению нужно получить информацию о природе устройства ввода, что можно сделать с помощью функции GetRawInputDeviceInfo.

В виду ряда достоинств новой модели прямого ввода — простоты реализации и эффективности — именно она была использована для реализации клавиатурного перехватчика.

2.2.4 Система управления базами данных SQLite

SQLite — легковесная встраиваемая реляционная база данных. Она не использует парадигму клиент-сервер, то есть движок SQLite не является отдельно работающим процессом, с которым взаимодействует программа, а предоставляет библиотеку, с которой программа компонуется и движок становится составной частью программы. Таким образом, в качестве протокола обмена используются вызовы функций (API) библиотеки SQLite. Такой подход уменьшает накладные расходы, время отклика и упрощает программу. SQLite хранит всю базу данных (включая определения, таблицы, индексы и данные) в единственном стандартном файле на том компьютере, на котором исполняется программа. Простота реализации достигается за счёт того, что перед началом исполнения транзакции записи весь файл, хранящий базу данных, блокируется; ACID-функции достигаются в том числе за счёт создания файла журнала.

База данных SQLite была использована при разработке приложения для организации длительного хранения информации о характеристиках ввода текста пользователями, структуре нейронной сети, ее весах и другой информации. Описание структуры базы данных будет рассмотрено в следующих разделах.

Предпочтение SQLite перед другими системами управления базами данных обусловлено такими факторами, как простота использования, наличие драйверов для SQLite в Qt по умолчанию. Кроме того, движок SQLite и интерфейс к ней реализованы в одной библиотеке, что увеличивает скорость выполнения запросов. Такой сервер часто называют встроенным. Встроенный сервер имеется у других СУБД, например, у MySQL, однако его использование требует лицензионных отчислений.

2.3 Описание базы данных

В процессе разработки приложения, отвечающего требованиям, перечисленным ранее, были создана база данных, основным содержанием которой являются 9 таблиц, предназначенных для хранения разнообразной информации, необходимой для корректной работы приложения.

При первом запуске приложения большая часть таблиц не содержит данных, при этом содержимое некоторых таблиц не подлежит обновлению в процессе работы с приложением; такие таблицы должны быть «инициализированы» ранее. Таким образом, дистрибутив приложения распространяется с подготовленной базой данных.

Рассмотрим подробнее структуру разработанной базы данных.

Таблица 2.1 — Структура таблицы Users

Поле

Тип

Описание

Id

Integer

Идентификатор пользователя

Name

Varchar

Имя пользователя

В таблице 2.1 описана структура таблицы Users. Эта таблица хранит информацию о зарегистрированных пользователях системы. До тех пор пока в таблице Users информация о пользователе отсутствует, он не может приступить к процессам его идентификации или аутентификации.

Таблица 2.2 — Структура таблицы KeyCombinations

Поле

Тип

Описание

Id

Integer

Идентификатор буквосочетания

Сombination

Varchar

Двухбуквенная строка-значение

В таблице 2.2 описана структура таблицы KeyCombinations. Эта таблица хранит информацию о буквосочетаниях, набор которых пользователем контролируется приложение с целью уточнения его особенностей набора текста. В данной таблице хранится только пятьдесят значений, которые являются наиболее частыми буквосочетаниями русского языка. Информация из таблицы частотности двухбуквенных буквосочетаний [15] была отсортирована по абсолютной частоте, что позволило получить информацию о группе наиболее вероятных сочетаний: ст, то, но, на, по, ен, ни, ко, ра, ов, не, ро, пр, ал, го, ре, ос, ли, ка, во, ер, та, от, ва, ор, ол, ет, те, ом, ан, ел, од, ть, ла, он, ле, ло, ес, ат, ри, ль, де, ог, ве, ны, ти, за, ит, ск, да.

Решение об ограничении количества контролируемых параметров обосновывается необходимостью минимизировать количество неизвестных значений, которые в дальнейшем интерпретируются нейронной сетью как отсутствие сигнала, т. е. поступают на её входы в виде нулевых значений. При этом частота, с которой выбранные буквосочетания встречаются в текстах на русском языке, позволяет достаточно быстро считать необходимые для предсказуемой работы нейронной сети данные.

В таблице 2.3 описана структура таблицы KeyPressSessions. Эта таблица хранит информацию о сессиях набора текста пользователем. Добавление новых значений в таблицу происходит в процессе считывания характеристик клавиатурного почерка пользователя. Потребность в создании сущности сессии набора текста появилась в связи с необходимостью выделения информации об особенностях ввода текста в отдельные примеры для обучения нейронной сети.

Таблица 2.3 — Структура таблицы KeyPressSessions

Поле

Тип

Описание

Id

Integer

Идентификатор сессии

UserId

Integer

Идентификатор пользователя

DataAdded

Date

Дата создания

Таблица 2.4 — Структура таблицы KeyPressData

Поле

Тип

Описание

Id

Integer

Идентификатор характеристики

SessionId

Integer

Идентификатор сессии

CombinationId

Integer

Идентификатор буквосочетаний

TimeValue

Integer

Временной интервал между нажатиями клавиш буквосочетания

В таблице 2.4 описана структура таблицы KeyPressData. Данная таблица предназначена для хранения характеристик клавиатурного почерка пользователей. Для каждой характеристики указывается текущая сессия, идентификатор буквосочетания, а также временной интервал в миллисекундах между отпусканием одной клавиши и нажатием следующей. Очевидно, значения в поле TimeValue могут принимать отрицательные значения, что характерно для пользователей, обладающих техникой слепой печати.

В процессе заполнения данными таблицы KeyPressData осуществляется контроль за объемом полученных данных для текущей сессии. Если для большей части буквосочетаний данные уже предоставлены, происходит создание очередной сессии (сущность KeyPressSessions). Сохранение последующих временных интервалов осуществляется с указанием идентификатора вновь созданной сессии.

В таблице 2.5 описана структура таблицы NeuralNets, которая предназначена для хранения общей информации о нейронной сети, такой как её наименование и дата создания.

Таблица 2.5 — Структура таблицы NeuralNets

Поле

Тип

Описание

Id

Integer

Идентификатор нейронной сети

Name

Varchar

Наименование

DateCreated

Date

Дата создания

Таблица 2.6 — Структура таблицы NeuralNetSettings

Поле

Тип

Описание

Id

Integer

Идентификатор веса

NetId

Integer

Идентификатор нейронной сети

LayerNum

Integer

Номер слоя

NeuronFrom

Integer

Номер нейрона предыдущего слоя

NeuronTo

Integer

Номер нейрона текущего слоя

WeightValue

Float

Значение веса

В таблице 2.6 описана структура таблицы NeuralNetSettings, которая предназначена для хранения весов обученной сети. Её заполнение осуществляется после каждого удачного обучения нейронной сети в приложении.

В таблице 2.7 описана структура таблицы NeuralNetDetails. Она хранит описание структуры каждой нейронной сети таблицы NeuralNets.

Таблица 2.7 — Структура таблицы NeuralNetDetails

Поле

Тип

Описание

Id

Integer

Идентификатор значения

NetId

Integer

Идентификатор нейронной сети

LayerNum

Integer

Номер слоя

NeuronCount

Integer

Количество нейронов в слое LayerNum

Таблица 2.8 — Структура таблицы NeuralNetUsers

Поле

Тип

Описание

Id

Integer

Идентификатор соотношения

NetId

Integer

Идентификатор нейронной сети

UserId

Integer

Идентификатор пользователя

OutputNum

Integer

Номер выхода, соответствующего пользователю с идентификатором UserId

В таблице 2.8 описана структура таблицы NeuralNetUsers. Эта таблица предназначена для хранения соответствия между пользователями и выходами нейронной сети. Наличие такой информации необходимо в связи с тем, что в приложении существует возможность обучения нейронной сети (идентификации) на примерах произвольных пользователей системы, данные о клавиатурном почерке которых внесены в базу данных.

В таблице 2.9 описана структура таблицы UserAuthentications. Она предназначена для хранения данных об успешных аутентификациях пользователей в системе. Вместе с информацией о том, какой пользователь был аутентифицирован, когда это произошло, в таблицу записывается информация о том, на сколько процентов нейронная сеть была уверена в предоставленном результате аутентификации.

В таблице 2. 10 описана структура таблицы TextFragments. Данная таблица с простой структурой предназначена для хранения текстов, которые отображаются в приложении для удобства пользователя во время его работы с модулями предъявления особенностей набора текста и аутентификации. Данные этой таблицы не подлежат обновлению в приложении, поэтому таблица должна быть заполнена данными до начала работы с программой.

Таблица 2.9 — Структура таблицы UserAuthentications

Поле

Тип

Описание

Id

Integer

Идентификатор авторизации

UserId

Integer

Идентификатор пользователя

AccessDate

Date

Дата-время авторизации

Accurancy

Float

Точность, с которой пользователь был распознан нейронной сетью

Таблица 2. 10 — Структура таблицы TextFragments

Поле

Тип

Описание

Id

Integer

Идентификатор авторизации

Text

Text

Текст

2.4 Структура нейронной сети и формат данных

биометрический идентификация нейронный сеть

Для решения задачи распознавания клавиатурного почерка средствами библиотеки классов BPNeuralNetwork была применена искусственная нейронная сеть типа персептрон, обучение которой осуществлялось на основе алгоритма обратного распространения ошибки. Была выбрана следующая структура сети:

— пятьдесят нейронов во входном слое;

— десять нейронов во внутреннем слое;

— по одному нейрону для каждого пользователя в выходном слое.

Обучающие данные формируются следующим образом: за каждым входом закрепляется одно из буквосочетаний, которые находятся в таблице KeyCombinations базы данных, т. е. контролируемое приложением. В процессе прямого распространения сигнала в нейронной сети на ее входы подаются временные значения, полученные от пользователей для соответствующего буквосочетания, нормализованные относительно отрезка [-1; 1]. Каждый выходной нейрон в процессе обучения учится принимать значения 0 или 1 по следующему правилу:

, (2. 1)

где i — номер пользователя, которому принадлежит входной вектор значений.

2.5 Описание ключевых моментов реализации приложения

Разработка приложения велась с применением возможностей библиотеки Qt версии 4.8.0. Она разделена на большое количество модулей, из которых были использованы следующие:

· QtCore — классы ядра библиотеки, используемые другими модулями;

· QtGui — компоненты графического интерфейса;

· QtSql — набор классов для работы с базами данных с использованием языка структурированных запросов SQL.

Модуль QtCore содержит базовую функциональность, основные классы библиотеки, используемые во всех остальных модулях. Модуль QtGui применен для разработки графического интерфейса пользователя.

Функциональность модуля QtSql позволила избежать зависимости от особенностей реализации конкретного интерфейса доступа к базе данных. Разработанное приложение работает с базой данных SQLite, однако, все что требуется для перехода к использованию другой базы данных — это замена драйвера доступа к базе данных, при этом практически никаких изменений кода не потребуется.

Кроме того, применение классов модуля QtSql позволило упростить решение некоторых других задач.

ПоказатьСвернуть
Заполнить форму текущей работой