Построение многокритериальной нейросетевой модели оптимизации в задачах диагностики заболеваний со слабо выраженной симптоматикой

Тип работы:
Реферат
Предмет:
Медицина


Узнать стоимость новой

Детальная информация о работе

Выдержка из работы

УДК 519. 7:616−053. 2
А. А. Шайдуров
Построение многокритериальной нейросетевой модели оптимизации в задачах диагностики заболеваний со слабо выраженной симптоматикой
A. A. Shaidurov
Building a Multi-criteria Neural Network Model of Optimization in the Diagnostics of Diseases with Weakly Expressed Symptoms
Предлагается способ решения задачи диагностики перинатального поражения центральной нервной системы. Диагностическая модель основывается на комбинации применения слоистых нейронных сетей. Ключевые слова: искусственный интеллект, слоистые нейронные сети, диагностика заболеваний, обратное распространение ошибки.
DOI mЛ4258/izvasu (2013)L2−27
Проблема нахождения функциональной зависимости по эмпирическим данным традиционно является актуальной для различных отраслей науки. Обычно эти задачи решаются при помощи методов интерполяции или экстраполяции. Кроме того, нередко применяются различные статистические методы, в большинстве случаев сводящиеся к построению линейных регрессионных уравнений. Однако встречаются ситуации, когда найти зависимости при помощи такого подхода либо весьма затруднительно, либо невозможно. В таких случаях применяются «интеллектуальные методы», такие как экспертные системы, нейронные сети, генетические алгоритмы и т. д. [1].
Одна из наиболее важных проблем в современной ме-дицине-сложность выявления перинатального поражения центральной нервной системы. В связи с анатомической и функциональной незрелостью нервной системы новорожденных и большой лабильностью клинических проявлений бывает трудно провести топическую диагностику и оценить тяжесть поражений головного мозга. Таким образом, диагностика больных затруднена постоянным изменением данных, в силу которого приходится обрабатывать большие массивы информации. Поэтому одним из путей повышения эффективности диагностики является применение математических методов анализа информации и разработка проблемно-ориентированных систем обработки данных [2].
В представляемой работе предлагается способ решения задачи диагностики перинатального поражения центральной нервной системы, основанный на применении комбинации слоистых нейронных сетей.
Для построения модели диагностики использовались данные, взятые в Алтайской краевой клинической детской больнице и содержащие сведения о пациентах,
The paper proposes a way to solve the problem of diagnostics of the central nervous system prenatal lesions. The diagnostic model is based on a combination of the application of layered neural networks.
Key words: artificial intelligence, layered neural networks, disease diagnosis, back propagation.
проживающих на всей территории Алтайского края за три года. Каждая запись в базе данных содержала информацию, состоящую из трех логических блоков:
• Диагноз ребенка, закодированный следующим образом:
1) гипоксически — ишемическое поражение ЦНС — 384 ребенка-
2) гипоксически-геморрагическое поражение ЦНС — 82 ребенка-
3) натальная спинальная травма — 357 детей-
4) натальная краниоспинальная травма — 147 детей-
5) отсутствие перечисленных выше диагнозов — 1294 ребенка.
• Качественная информация об анамнезе беременности матери ребенка, содержащая сведения о перенесенных заболеваниях матери во время беременности и осложнениях, возникших у плода во время внутриутробного развития (32 параметра). Эта информация кодировалась следующим образом:
1 — заболевание или осложнение присутствует-
0 — заболевание или осложнение отсутствует.
• Количественная информация о состоянии здоровья ребенка при рождении и после родов, а также количество родов и беременностей у матери (7 параметров).
Особенность базы заключалась в том, что диапазон изменения количественных исходных данных сильно различался. Так, например, показатели количества беременностей изменялись в 18 раз, а значения роста при рождении — менее чем в два раза. Также максимальное значение оценки по шкале Апгар равнялось 10, а минимальный вес при рождении определялся числом 2200.
В силу того, что диагностика перинатальных поражений центральной нервной системы является сложной задачей, требующей строгого анализа большого объема постоянно меняющейся информации, то необходимо использование математических методов решения слабо формализованных задач. Такие методы имеют дело с обработкой данных, накопленных в результате некоторых измерений и экспериментов. К ним, в частности, относятся и нейросетевые алгоритмы.
Исходя из подробного изучения исходных данных было решено исследовать поставленную задачу диагностики при помощи нейросетевых методов на основе нейропарадигмы «Back Propagation (обратное распространение)». Алгоритм обратного распространения — это итеративный градиентный алгоритм, который используется с целью минимизации среднеквадратичного отклонения текущего выхода многослойного персептрона и желаемого выхода. Этот алгоритм используется для обучения многослойных нейронных сетей с последовательными связями.
Экспериментально было показано, что для решения такого типа задач вполне подходят слоистые нейронные сети, с одним скрытым слоем. Число нейронов во входном слое однозначно определялось размерностью вектора входных значений. Количество нейронов в выходном слое задавалось числом определяемых нейронной сетью диагнозов. Таким образом, число нейронов в выходном слое бралось равным либо пяти (нейронная сеть осуществляла полную диагностику пациента на основе пяти основных диагнозов), либо равным одному нейрону (нейронная сеть определяла наличие или отсутствие одного отдельного диагноза). Число нейронов в скрытом слое оценивалось по формуле:
N = -
N,
Nr + Ny
(1)
где Ых — размерность входного сигнала- Ыу — размерность выходного сигнала- - число синаптических весов, оцениваемое по формуле
N N N"
-& lt-К & lt-NyМ- + тх + Ny +1) + N, (2)
1 + l0g2(Np)
N.
где Np — число элементов обучающей выборке.
Путем прямого моделирования было получено, что число синаптических весов для нейронных сетей, имеющих один нейрон в выходном слое, лучше брать как можно ближе к левой границе. Однако для нейронных сетей, имеющих пять нейронов в выходном слое, необходимо иметь максимальное количество синаптических весов.
Проведенные исследования позволяют определить оптимальный комплекс архитектур нейронных сетей, позволяющий осуществлять диагностику пери-
натального поражения центральной нервной системы с минимальными ошибками обучения и обобщения. Соответственно необходимо исследовать и сопоставить процессы обучения и обобщения:
1) нейронных сетей с одним выходным нейроном, обученных на полной базе данных-
2) нейронных сетей с пятью выходными нейронами, обученных на полной базе данных-
3) нейронных сетей с одним выходным нейроном, обученных на базе данных, содержащей статистически значимые симптомы-
4) нейронных сетей с пятью выходными нейронами, обученных на базе данных, содержащей статистически значимые симптомы.
Как показали эксперименты, число выходных нейронов необходимо выбирать из соображений возможностей классификации пациентов. Нейронные сети с одним нейроном оценивают возможность наличия или отсутствия отдельного диагноза. А нейронные сети с пятью нейронами осуществляют диагностику пациентов на основе всех возможных пяти диагнозов.
В рамках исследования были созданы нейронные сети с максимальным количеством нейронов в выходном слое. Так как возможных вариантов классификации было пять, то и соответственно выходной слой состоял из пяти нейронов. Путем прямого численного эксперимента было выявлено, что результаты работы нейронных сетей с пятью нейронами в выходном слое более точно диагностируют здоровых пациентов, чем нейронные сети с одним выходным нейроном. В таблице приведены результаты сравнения теста нейронных сетей с одним и пятью нейронами в выходном слое.
Сравнение результатов теста нейронных сетей
с одним и пятью нейронами в выходном слое
Диагноз Число нейронов в выходном слое
1 5
Процент ошибки обобщения
1 3 15
2 1 7
3 3 12
4 2 11
5 8 6
Этот эффект объясняется тем, что алгоритм, ставящий в соответствие входные данные, и выходной результат являются весьма сложными. По этой причине нейронная сеть не в состоянии правильно обучиться определять сразу все пять возможных исходов. Классификация диагнозов больных (№ 1−4) осуществляется лучше при типе классификации: диагноз отсутствует или присутствует. Для такой классификации подходят нейронные сети с одним нейроном в выход-
ном слое. Однако классификация здоровых пациентов невозможна без учета остальных возможных диагнозов. Поэтому с выделением здоровых пациентов лучше справляются нейронные сети с пятью нейронами в выходном слое.
Таким образом, для построения нейросетевой системы принятия диагностических решений необходимо совместное использование нейронных сетей (рис. 1) с различной архитектурой и различным функциональным назначением.
Блок-схема алгоритма работы системы анализа данных и диагностики перинатального поражения
центральной нервной системы
Предлагаемая система может состоять из двух блоков, которые выполняют следующие функции:
1. Выявление пациентов, не имеющих диагноза «перинатальное поражение центральной нервной системы». Этот тест проводится с использованием нейронных сетей, имеющих пять нейронов в выходном слое. Необходимость использования именно таких нейронных сетей обусловливается тем обстоятельством, что качественное определение пациентов без диагноза возможно только при сравнении со всеми остальными пациентами.
2. Если пациент не классифицировался как здоровый, то его комплекс симптомов оценивается на принадлежность к каждому диагнозу по отдельности. На этом этапе наиболее оптимальным решением является использование системы нейронных сетей с одним нейроном в выходном слое. В результате система выдает пользователю вероятность наличия каждого диагноза.
Таким образом, пользователю системы предоставляется информация о возможных диагнозах пациента и уверенности в их наличии.
Библиографический список
1. Прикладной многомерный статистический ана- 2. Юнкеров В. И., Григорьев С. Г. Математико-стати-
лиз: сб. ст. / науч. ред. С. А. Айвазян, А. И. Орлов. — стическая обработка данных медицинских исследова-
М., 1978. ний. — СПб., 2002.

Показать Свернуть
Заполнить форму текущей работой