Классификация спутниковых изображений плоскими и многомодовыми методами анализа многомерных данных

Тип работы:
Реферат
Предмет:
Кибернетика


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Классификация спутниковых изображений плоскими и многомодовыми методами.
УДК 528. 854. 2:681. 1
С. И. Суханов, С.И. Жилин
Классификация спутниковых изображений плоскими и многомодовыми методами анализа многомерных данных
Одна из актуальных задач обработки спутниковых изображений, возникающая на практике, — это их классификация, которая может быть трех видов: классификация отдельных пикселей на изображении- классификация изображения как класса, т. е. отнесение или неотнесение его к заданному заранее классу изображений- классификация объектов на изображении. В дальнейшем под классификацией спутниковых изображений будем понимать попик-сельную классификацию.
Так как спутниковые данные имеют трехмодовую структуру, то к ним применимы как многомодовые, так и плоские методы анализа многомерных данных [1−3]. В данной статье рассматривается вопрос о количественном сравнении их результатов.
Первым этапом проведения сравнительного анализа плоских и многомодовых методов многомерного анализа классификации спутниковых изображений является построение регрессионных моделей-классификаторов.
При обучении классификаторов использовалось 10 спутниковых изображений в пяти «видимых» каналах. Было решено ограничиться пятью каналами по двум причинам: первая — влияние остальных каналов на обучение оказалось незначительным- вторая — при построении моделей с ростом числа главных компонент экспоненциально растет вычислительная трудоемкость многомодовых методов. Объем тестовой выборки в нашем исследовании составил три изображения.
В качестве объектов классификации выступали пиксели, отвечающие за снежный покров на спутниковых изображениях.
Снежный покров характеризуется значениями пикселей, попадающих в следующий диапазон значений: для первого канала (156−255), для второго -(169−255), для третьего — (119−255), для четвертого — (142−255), для пятого — (136−255) [4].
Для построения ПЛС-регрессии [4] каждое спутниковое изображение выборки с помощью попик-сельной развертки представлялось в виде матрицы X, размера п, х5 (п, — количество пикселей на изображении), в строках которой указывались значения откликов составляющих каналов. Итоговая матрица X получалась последовательной конкатенацией X: X = (Х1… ХМ), где М количество изображений в обучающей выборке. Вектор откликов У представляет собой бинарные значения, описывающие принадлежность объекта к снежному покрову (1 -принадлежит, 0 — не принадлежит).
Построение М-ПЛС регрессии [4] производилось аналогичным образом: каждое изображение выборки представлялось в виде матрицы X, размера I х 3×5, где I х 3 размер спутниковых изображений. Итоговая матрица входных данных X получается при помощи конкатенаций X, по первой моде (добавлением снизу).
При построении регрессионных моделей большое значение имеет размерность модели (число главных компонент). Изменение числа главных компонент может приводить к пере- или недоопре-деленности модели. Критерием выбора числа главных компонент может считаться объясненная вариация. Данные оценка применяется, чтобы посмотреть, как варьируются значения переменных, и подсчитать, какую часть всей имеющейся вариации можно объяснить наличием «общей» («совместной») вариации определенным числом главных компонент. Экспериментальным путем число главных компонент для ПЛС-регрессии было найдено равным шести, а для М-ПЛС-регрессии — десяти.
Построенные классификаторы проверялись на работоспособность, т. е. на пригодность к прогнозированию с помощью измерения среднеквадратичной ошибки предсказания КМЕЕР [4]. Она вычислялась в исходных измерениях. КМЕЕР для ПЛС-регрессии составила 0,2547, при значении числа главных компонент равном 3, для М-ПЛС-регрес-сии — 0,1989, при значении числа главных компонент равном 6, из чего можно сделать вывод, что построенные классификаторы хорошо описывают обучающую выборку.
Для проведения сравнительного анализа классификаторов использовалась кривая мощности критерия классификации. У каждого классификатора есть факторы, изменяя значения которых, мы можем улучшать результат классификации или же ухудшать. Обычно под улучшением и ухудшением качества классификации понимают изменение уровня ошибок первого и второго рода. Ошибки первого рода — это ситуация, при которой образцы, являющиеся членами класса, ошибочно были отклонены классификатором. Ошибки второго рода — это ситуация, при которой образцы, не являющиеся членами класса, были ошибочно определены классификатором как члены класса.
Кривая мощности критерия классификации строится следующим образом: изменяется значение одного из факторов, влияющих на результат классификации, вычисляется число ошибок первого и вто-
УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА
рого рода. Полученные значения ошибок: по горизонтали число ошибок классификации первого рода, по вертикали — ошибок классификации второго рода. При сравнении двух классификаторов важно определить, какой из них максимально подходит под описание идеального, т. е. график его кривой максимально прижимается к линиям осей координат. Каждый метод классификации может характеризоваться площадью области под своей кривой. Чем меньше данная площадь, тем лучше метод.
Главным фактором для ПЛС-регрессии и М-ПЛС-регрессии, который позволяет регулировать число ошибок первого и второго рода, является вектор откликов У *. Значения У * плотно сосредоточены возле значения, равного единице, так как при обучении классификаторов единица отвечала за принадлежность к снежному покрову.
Меняя значения? в пределах от 0 до 0,5 с ша*
гом 0,05, значения У будут попадать в интервал:
*
У е (1 — е, 1 + е). Для каждого интервала мы получим значения ошибок первого и второго рода.
Кривая мощности критерия для ПЛС-регрессии строится следующим образом: каждая точка на графике сопоставляется определенному интервалу зна-
*
чений У, при этом ее первая координата соответствует числу ошибок первого рода данного интервала, вторая координата — число ошибок второго
*
рода, для того же интервала значений У. Кривая мощности критерия для М-ПЛС-регрессии строилась аналогичным образом (рис.).
Характеристические кривые операторов классификации (верхний график -кривая мощности критерия классификации для ПЛС-регрессии нижний — для М-ПЛС-регрессии)
Как видно из рисунка, график М-ПЛС-регрессии находится ниже и, соответственно, является более предпочтительным для классификации спутниковых изображений.
Библиографический список
1. Pearson, K. On lines and planes of closest fit to systems of points in space / K. Pearson // Philosofical Magazine. — Vol. 2.
2. Bro, R. Multi-way analysis in the Food Industry: Models, Algorithms and Applications / R. Bro. — Copenhagen.
3. Bro, R. Multi-way analysis with applications in the chemical sciences / R. Bro, A. Smilde, P. Geladi. — Chichester.
Родионова, О.Е. [Электронный ресурс]: Построение регрессионных моделей и решение задачи предсказания / О. Е. Родионова. — Режим доступа: http: //www. dancom. ru/article/item/wm_id=4. — Загл. с экрана

ПоказатьСвернуть
Заполнить форму текущей работой