Векторное кодирование в зрительном поиске

Тип работы:
Дипломная
Предмет:
Программирование


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Введение

Задачи зрительного поиска и решение их человеком достаточно хорошо изучены в современной когнитивной психологии [2, 31, 50]. Имеется большой объем психофизических данных, описывающих, как изменяется эффективность зрительного поиска в зависимости от объективных факторов (структуры зрительной сцены) и субъективных (инструкции, стратегии испытуемого и т. д.). Таким образом, в психологии восприятия зрительный поиск является тщательно изученным и подробно описанным процессом.

Вместе с тем, механизмы, обеспечивающие зрительный поиск, на данный момент не вполне ясны. Большое количество исследований с использованием технологий нейровизуализации могут лишь указать мозговые структуры, вовлеченные в этот процесс, но не прояснить суть процессов переработки информации, происходящих в них. Следовательно, изучение механизмов зрительного поиска требует иного подхода, концентрирующегося на содержательной стороне работы мозга.

В психофизиологии восприятия пример такого подхода обеспечивают работы школы Е. Н. Соколова, в которых построена концептуальная модель различения зрительной системой стимулов разной степени сложности — от отдельных цветов и ориентаций линий до сложных фигур и человеческих лиц, выражающих те или иные эмоции. Такая модель состоит из нейроподобных элементов, что сближает данный подход с современными разработками в русле коннекционизма.

Тем не менее, процесс зрительного поиска заметно отличается от процесса «пассивного» восприятия, которому соответствует обозначенная выше модель. Многие исследователи считают, что зрительный поиск скорее относится к феноменам внимания, чем восприятия, и должен быть объяснен с обращением к качественно иным механизмам, нежели те, которые обеспечивают восприятие. Вместе с тем, наличие такого отдельного психологического процесса, как внимание, а значит, и его специфических нейронных механизмов, не считается общепринятым [8]. Одной из больших проблем здесь является крайнее разнообразие видов и форм того, что называют вниманием; второй проблемой является отсутствие специфического продукта у процесса внимания как такового. Можно предполагать, что субъективное переживание «внимания» относится на самом деле к тому процессу, в котором оно возникает, и нет нужды постулировать наличие для него отдельных механизмов. Поскольку это противоречие едва ли может быть разрешено экспериментально, мы будем придерживаться второй точки зрения как более экономной в отношении числа вводимых сущностей, которые требуют объяснения. Таким образом, будем считать, что процесс зрительного поиска является составной частью перцептивного процесса, а значит, осуществляется теми же механизмами.

Такое рассуждение приводит нас к тому, что модель Е. Н. Соколова, построенная на данных «пассивного» восприятия, должна также быть применимой к описанию процессов зрительного поиска. Если эта теория сможет предсказывать эффективность процессов зрительного поиска в различных условиях так же успешно, как она описывает различение зрительной системой стимулов в условиях пассивного смотрения, можно будет считать, что за этими процессами стоят одни и те же (или сходные по строению) механизмы. Если же предсказания теории разойдутся с эмпирикой, необходимо будет искать специфические механизмы, вовлеченные в зрительный поиск.

В основе модели Е. Н. Соколова лежит принцип векторного кодирования информации в нейронных сетях, тесно связанный с принципом кодирования номером канала. Кодирование номером канала означает, что разные пути несут специфическую для них информацию, и активация определенного пути означает передачу именно такой информации, к которой данный путь «приписан». Так, активация одних входов может сигнализировать об уменьшении интенсивности стимуляции, а активация других входов — о ее увеличении. Принцип векторного кодирования обобщает этот феномен, утверждая, что на каждом уровне переработки информации в нейронных сетях именно вектор возбуждения отдельных элементов (нейронов) кодирует информацию, передающуюся с предыдущего уровня, а его скалярное произведение с векторами связей (синаптических весов нейронов последующего уровня) обеспечивает активацию нейронов последующего уровня. Такое представление о процессах переработки информации в нейронных сетях, по существу, совпадает с коннекционистским. Однако в концепции Е. Н. Соколова на вектора возбуждения и связей накладывается еще одно существенное ограничение — нормировка по длине. Все вектора возбуждения (за исключением возникающих на рецепторах) и связей имеют в данной модели константную длину. Это обеспечивает сферичность пространств, в которых расположены векторы возбуждения и связей. Точки в этом пространстве соответствуют паттернам возбуждения, кодирующим стимулы, а также селективно настроенным на них нейронам-детекторам. Таким образом, пространство различения стимулов в этой модели представляет собой сферу в n-мерном пространстве, где n — число компонентов вектора, кодирующего данные стимулы, или, что-то же самое, число отдельных каналов, вовлеченных в процесс восприятия данного стимула.

Возможность построения пространства различения стимулов из эмпирических данных служит основой для проверки данной теории. Исследование строится по схеме «Человек — Нейрон — Модель». На первом этапе используются психофизические методы с тем, чтобы на основании поведенческих реакций выявить структуру различения стимулов, предъявляемых испытуемому. На втором этапе аналогичная задача решается с помощью электрофизиологических методов. Результатом первого и второго этапов является построение пространств различения стимулов. На третьем этапе строится формальная модель из нейроподобных элементов, которая обеспечивает такую структуру различения стимулов, которая описывается полученными на предыдущих этапах пространствами.

На возможности измерения различий между парой стимулов основаны многие методы современной психофизики [5]. Так, получение матрицы различий для некоторого множества стимулов и последующий ее анализ методом многомерного шкалирования (ММШ; multidimensional scaling) позволяет получить n-мерное субъективное пространство, в котором размещено исследуемое множество стимулов так, что расстояния в этой геометрической модели соответствуют различиям, полученным эмпирическим путем [27, 28]. Содержательная интерпретация осей этого пространства позволяет реконструировать возможные нейрофизиологические механизмы, обеспечивающие различение этих стимулов. Примером результатов, полученных таким путем, является четырехмерная сферическая модель цветового зрения, предложенная Ч. А. Измайловым и Е. Н. Соколовым.

Однако данные о субъективных различиях между стимулами могут быть получены различными путями. На данный момент наиболее разработанным и широко применимым является метод прямых оценок. Его суть заключается в том, что испытуемый сравнивает пары стимулов и оценивает их сходство на некоторой числовой шкале (например, от 1 до 9). При этом многократно предъявляются все возможные пары в исследуемом множестве стимулов.

Тем не менее, применительно к нашей задаче необходимо разработать метод измерения различий между стимулами, «встроенный» в задачу зрительного поиска. Тогда станет возможным сравнение данных, полученных при построении сферической модели восприятия, с характеристиками протекания процесса зрительного поиска. Такую возможность нам предоставляет «эффект выскакивания» в зрительном поиске («pop-out effect»). Duncan и Humphreys отмечали, что эффект выскакивания возникает только в случае достаточно больших различий между целевым стимулом и дистракторами [40]. В нашем случае целесообразно сделать обратный ход — по эффективности зрительного поиска судить о мере различия между целевым стимулом и дистракторами.

Используемый нами эффект может быть легко продемонстрирован на примере зрительного поиска одного отличающегося стимула («цели») на фоне нескольких одинаковых стимулов («дистракторов»). Целевой стимул субъективно «выскакивает» в феноменальном поле, обеспечивая быструю локализацию его испытуемым. Однако, если продолжить линию рассуждений Duncan и Humphreys, вероятность «эффекта выскакивания» и его скорость (время поиска, определяемое временем работы тех механизмов переработки информации, которые обеспечивают эффект выскакивания), будет зависеть от степени различия между целью и дистракторами.

/

/

Рисунок 1. Демонстрация используемого эффекта (пояснения в тексте)

На рисунке 1 представлена демонстрация эффекта, положенного в основу предлагаемой методики. Sdis — стимулы-дистракторы, St1 — первый целевой стимул, St2 — второй целевой стимул. Рисунки 1a и 1b отличаются только целевым стимулом, однако «эффект выскакивания» для этого целевого стимула на рисунке 1а возникает быстрее. Обозначим субъективное различие между стимулами Si и Sj как d (Si, Sj). Так как субъективное различие между целевым стимулом и дистракторами на рисунке 1a больше, чем субъективное различие между целевым стимулом и дистракторами на рисунке 1b, можно записать, что d (St1, Sdis)> d (St2, Sdis). Вместе с тем, сложность задачи зрительного поиска отличающегося стимула значительно ниже в случае 1a, чем в случае 1b. Это позволяет выдвинуть предположение, связывающее субъективную «легкость» зрительного поиска в описанных условиях со степенью различия между целевым стимулом и дистракторами. Вместе с тем, субъективная «легкость» выполнения задачи может отразиться в увеличении показателей эффективности зрительного поиска — в снижении вероятности ошибочного ответа и уменьшении времени выполнения по сравнению с более сложной задачей.

Таким образом, если теория векторного кодирования информации в нейронных сетях адекватно описывает процессы зрительного поиска, показатели эффективности зрительного поиска в условиях возникновения «эффекта выскакивания» будут монотонно связаны с величиной векторного различия между целевым стимулом и дистракторами. В частности, это означает, что данные, получаемые с помощью данной методики, будут согласоваться с данными, получаемыми с помощью прямого шкалирования.

Наша основная гипотеза такова: эффективность зрительного поиска в условиях возникновения «эффекта выскакивания» является функцией расстояния между векторами, представляющих целевой стимул и дистрактор в соответствующем субъективном пространстве.

Цель исследования: изучить механизмы процессов зрительного поиска с позиций теории векторного кодирования информации в нервной системе.

Основные задачи исследования:

1. Выявление взаимосвязи между показателями эффективности зрительного поиска и субъективным различием между целевым стимулом и дистрактором; построение субъективных пространств различения стимулов, основанных на показателях эффективности зрительного поиска как на мере различия между стимулами.

2. Регистрация вызванных потенциалов в исследуемой задаче зрительного поиска в целях выявления электрофизиологических коррелятов межстимульных различий и построения субъективных пространств по ним.

3. Сопоставление полученных в психофизических и электрофизиологических опытах по зрительному поиску пространств с полученными в исследованиях школы Е. Н. Соколова для пассивного восприятия. Решение вопроса о применимости модели векторного кодирования к задачам зрительного поиска.

Глава I. Теоретический обзор

§ 1. Зрительный поиск

Зрительный поиск — задача, имеющая высокую экологическую валидность [31, 55]. В самом деле, в повседневности мы нередко сталкиваемся с необходимостью найти некий целевой объект среди множества других, зачастую не слишком отличающихся от искомого. Какие механизмы обеспечивают возможность такого поиска и каково их строение?

Обобщая, можно утверждать, что экспериментальные схемы изучения зрительного поиска делятся на две основные категории:

1. Поиск целевого объекта, который отличается от дистракторов по одному признаку (например, поиск белой линии среди черных);

2. Поиск целевого объекта, отличающегося от остальных по двум и более признакам (например, поиск черной вертикальной линии среди черных горизонтальных и белых вертикальных).

Зрительный поиск нередко сочетается с опознанием целевого объекта; тогда отысканию подлежит объект, заданный ключевым признаком.

К числу первых феноменов, открытых в этой области, относится так называемый «эффект выскакивания», описанный примерно в одно время Б. Юлешом и Э. Трейсман [по 37]. Оно заключается в феноменальном «выскакивании» целевого объекта на фоне, составленном из объектов, отличающихся от целевого по одному лишь признаку. При этом круг признаков, обеспечивающий «выскакивание» строго ограничен.

Б. Юлеш, выявивший данный эффект в контексте восприятия текстуры, предложил соответствующую объяснительную схему. Согласно его гипотезе, текстура состоит из элементов, которые различимы по отличительным признакам — так называемым текстонам: форме, кривизне, линейным сегментам, включая ширину, высоту, соединения концов, углы наклона и их пересечения. Различие текстонов элементов передает и определяет различие текстур.

По Э. Трейсман, существуют две стадии перцепции. Начальная, т.н. стадия предвнимания, включает восприятие базовых, очень простых и заметных отличительных признаков объекта — перцептивных примитивов, элементов восприятия. За ней следует стадия сфокусированного внимания, связанная с центральным контролем.

Позднее Э. Трейсман была выдвинута теория интеграции признаков. Она была призвана объяснить в том числе и различие между скоростью зрительного поиска, зависящее от организации стимульного поля.

Общая закономерность такова: если целевой стимул отличается от дистракторов по одному лишь признаку, относящемуся к тому же к категории базовых (перцептивных примитивов), то скорость обнаружения целевого стимула не зависит от количества дистракторов. Возникает «эффект выскакивания», обусловленный параллельным сканированием зрительного поля. Однако же если целевой объект отличается от фоновых по двум признакам, время обнаружения последовательно возрастает на 10 мс с каждым новым объектом. Из этого делается вывод, что в случае отличия по двум и более признакам зрительный поиск осуществляется последовательно.

Трейсман и Саутер [по 31] был обнаружен феномен асимметрии зрительного поиска: перечеркнутый круг значительно быстрее и легче ищется среди неперечеркнутых, чем наоборот.

На основе этих данных была создана модель интеграции признаков, предложенная Э. Трейсман и Г. Джэлэйдом в 1980 г. и призванная объяснить процесс зрительного поиска, Предполагается, что после первичной обработки вся информация о признаках с сохранением знаний о расположении сводится на единую пространственную карту («главную карту мест»). При этом объекту, который отличается от всех остальных, соответствует единственный локус активации. На него немедленно обращается механизм внимания, выполняющий функцию связывания признаков.

До того, как вступает в действие сфокусированное внимание, зрительная система выстраивает ретинотопически организованные карты признаков, независимые друг от друга. Признаки, относящиеся к одному и тому же месту в зрительном поле, соединены с соответствующими пространственными позициями на главной карте местоположений. Только в результате направления внимания на одно из местоположений этой карты возможно восприятие соответствующего объекта.

С этой точки зрения феномен асимметрии зрительного поиска объясняется наличием или отсутствием единственной активированной области, ответственной за детекцию данного признака.

Данная модель предсказывает, что возможно создание условий, в которых нарушается корректная интеграция признаков. Очевидно, так как связывание признаков обеспечивается специальным механизмом внимания, следует ожидать появления эффектов «ошибки связывания» в условиях, когда обращение внимания на целевой объект затруднено или невозможно. Это было показано экспериментально.

В работах Трейсман и Шмидт провоцировались «иллюзорные соединения» признаков. Вместо зрительного поиска они использовали задачу опознания разноцветных букв, требующую сфокусированного внимания; однако требования задачи возможность направления внимания на буквы исключали (необходимо было также следить за цифрами на периферии зрительного поля). В результате в 40% ответов испытуемые ошибочно связывали цвет буквы с ее формой.

Сама Э. Трейсман видит за интеграцией признаков работу пространственного внимания, функционально схожего с клеем, а структурно с прожектором, который, «высвечивая» определенные места на карте зрительного поля, позволяет соединить все зрительные признаки, находящиеся там и на этом основании принадлежащие одному объекту.

Тем не менее, вскоре был получен ряд данных, не согласующихся с классической версией теории интеграции признаков.

К. Накаяма и Дж. Сильверман отмечают, что в отдельных случаях скорость поиска целевого объекта, заданного сочетанием признаков (то есть двумя или более) не зависит от общего числа стимулов в наборе. Примеры: цвет и глубинный план, направление движения и цвет, направление движения и форма. Во всех этих случаях наблюдается «эффект выскакивания».

Более того, «эффект выскакивания» возникает для таких сочетаний признаков, различие по которым между целевым стимулом и дистракторами достаточно велико. Этот факт нашел свое отражение в дополнении к теории интеграции признаков Трейсман, согласно которому места на главной карте, содержащие иррелевантные признаки, активно оттормаживаются.

Альтернативное объяснение изложенной группе явлений дает теория сходства, предложенная Дж. Дунканом и Г. Хамфрисом [40]. Это теория предполагает позднюю селекцию в механизме внимания, что делает возможным процессы дополнительной активации отображений стимулов.

По мнению этих авторов, нет нужды проводить жесткую границу между поиском объектов по одному признаку и по их сочетанию. Следует рассматривать единый континуум эффективности поиска — от явно отличимых до сливающихся с дистракторами. Скорость поиска при этом определяется степенью сходства.

Процесс поиска имеет три стадии:

1. Параллельное построение «перцептивного описания» зрительного поля («предвнимание» по Найссеру);

2. Сопоставление полученной информации с внутренними шаблонами (заданными характеристиками целевого стимула) и приписывание определенного «веса» (активации) отображению каждого из стимулов. Чем больше признаков, по которым стимул сходен с шаблоном, тем больший «вес» он получает и тем больше вероятность его дальнейшей обработки.

3. Поступление информации в зрительную кратковременную память. Емкость ее строго ограничена, поэтому информация допускается туда избирательно на основе «веса» каждой из единиц, но, будучи допущенной, может быть осознана.

Особую роль в развитии теории интеграции признаков сыграла модель «управляемого поиска» Дж. Вольфе [56]. Однако она имеет дело преимущественно с контролируемыми процессами, и подробное рассмотрение ее означает уход от основной проблематики данной работы, а именно автоматических процессов детекции признаков в процессе восприятия, по определению являющихся в основном автоматическими.

Данные Б. Хоммеля выявляют взаимнооднозначную связь между интеграцией признаков и процессами реагирования, которая проявляется в специфическом выборе произвольных реакций при условии предшествующего обучения реагированию на определенные классы стимулов [43]. Это свидетельствует об изоморфизме систем восприятия и действия. Роль научения при задачах на связывание признаков сводится к выбору признаков при связывании и не оказывает прямого влияния на скорость и прочность интеграции.

Вместе с тем, показано, что конфигуративные эффекты в зрительном поиске могут даже приводить к ложному «эффекту выскакивания», возникающего в случае «выпадения» стимула из некой воспринимаемой (в том числе иллюзорной) конфигурации [39]. Однако мы обратимся к изучению восприятия и зрительного поиска в простейших, вырожденных случаях, требующих минимум центрального контроля. В соответствии с этим ограничением мы не обращаемся в том числе и к модели «управляемого поиска» Вольфе, так как в нашем случае испытуемый лишен возможности выработать какую-либо стратегию, улучшающую поиск целевого (отличающегося) стимула.

§ 2. Восприятие формы и паттерна

Проблему восприятия конфигурации мы рассмотрим отдельно, поскольку в качестве экспериментальной модели мы будем использовать восприятие полосок различной ориентации, из которых может быть составлен контур объекта.

Используя данные психофизиологии, современная наука о зрении выделяет два основных механизма зрительного восприятия. В некоторых случаях они рассматриваются как конкурирующие гипотезы описания изображений, в других — как взаимодополняющие нейрофизиологические механизмы. Первый — восприятие контуров и формы объектов, связанное с детекторными механизмами; второй — пространственно-частотный анализ поля зрения по вариациям освещенности (с ним связаны ганглиозные клетки сетчатки с концентрически организованными рецептивными полями, которые в зависимости от своей величины оказываются избирательно настроенными на ту или иную пространственную частоту; в психологии восприятия и особенно в психофизике часто используют Фурье-анализ зрительного восприятия, заключающийся в разложении сцены в периодический ряд с целью выведения сенсорного оператора). Существование избирательно настроенных детекторов пространственных частот подтверждается наличием эффекта селективной адаптации в опытах с предъявлением синус-решеток. Таким образом, можно говорить о детектировании пространственных частот, например, при восприятии градиента текстуры поверхности [26].

Перейдем к рассмотрению современных теоретических воззрений на восприятие конфигурации. В связи с этим прежде всего встает проблема детектирования контуров. Только используя знания о контуре объекта, зрительная система может делать предположения о его форме, размере и местоположении, а также о пространственных связях с другими объектами.

Очевидно, что контур объекта выделяется на основе перепадов освещенности в области края. Однако как следует использовать полученные данные? Ведь контур проецируется на плоскость, и свойства, характерные для трехмерного объекта, утрачиваются. Перед зрительной системой встает задача интерпретации контурного рисунка с целью извлечения информации об удаленности, форме и т. д. и т. п. Как она это делает, не имея априорных предположений о воспринимаемом объекте? Ответ на этот вопрос, ограничивающий знания системы лишь сведениями о контуре, дает Дж. Дж. Гибсон [4]. Зрительная система, по Гибсону, занимается поиском инвариантов или инвариантных соотношений в стимуляции, однозначно определяющих структуру дистального стимула. С этой точки зрения становится понятной необходимость постоянных изменений зрительного опыта: действительно, для поиска инвариантов необходимы вариации. Эксперименты с однородным полем (Ganzfeld) и полной иммобилизацией глаз, включающей микродвижения и тремор, убедительно доказывают эту точку зрения [по 37].

Выделенные инварианты являются отличительными признаками, которые будут использоваться в дальнейшем анализе. По А. Трейсман, существуют две стадии перцепции. Начальная, т.н. стадия предвнимания, включает восприятие базовых, очень простых и заметных отличительных признаков объекта — перцептивных примитивов, элементов восприятия. За ней следует стадия сфокусированного внимания, связанная с центральным контролем.

Согласно гипотезе Б. Юлеша, текстура состоит из элементов, которые различимы по отличительным признакам — так называемым текстонам: форме, кривизне, линейным сегментам, включая ширину, высоту, соединения концов, углы наклона и их пересечения. Различие текстонов элементов передает и определяет различие текстур.

Бидерман предполагает, что зрительная система производит распознавание по компонентам. Любой воспринимаемый объемный предмет может быть разложен на ряд элементарных составляющих — модулей. Описываются 24 базовых трехмерных геометрических компонента, называемые геонами (т.е. геометрическими ионами). Расположение и взаимосвязь геонов, по Бидерману, однозначно задает форму объекта; для нас здесь особенно интересен тот факт, что геоны легко распознаются с разных точек зрения. Чем больше геонов содержит объект, тем легче он воспринимается; восприятие различия между геонами определяет восприятие различия между классами объектов.

Различные варианты анализа по признакам представлены в информационном и коннекционистском подходах. Они представляют собой моделирование схем переработки информации, поступающей на сетчатку. Ретинальное изображение подвергается серии трансформаций по определенным правилам, вследствие чего образуется перцептивный образ.

Коннекционистский подход, авторство которого обычно приписывают Розенблатту [по 19], использует для объяснения восприятия реально существующие нейронные связи, в результате работы которых формируется устойчивый паттерн возбуждений, однозначно задающий образ восприятия. Элементарной единицы переработки информации является нейрон, а взаимосвязи и конкуренция между множеством элементов обеспечивают упорядоченность операций и вариативность выхода. М. М. Бонгард, критикуя персептроны Розенблатта, указывает на то, что разделение на классы (а восприятие может быть представлено как процесс классификации сенсорных возбуждений) невозможно в пространстве рецепторов [3]. Отсюда следует, что эта задача должна решаться с помощью выделения фундаментальных инвариантных характеристик.

Информационный подход тесно связан с такими направлениями в кибернетике, как искусственный интеллект и компьютерное зрение. Суть информационных теорий — управляемое систематическое дробление и многоступенчатая обработка информации с системой горизонтальных обратных связей [19, 30].

§ 3. Детекторные системы

Разъясним ряд специальных понятий, которые будут обширно использоваться в данной главе, воспользовавшись классификацией И. А. Шевелева [36].

Нейрон-детектор. Нервная клетка, которая способна выделять путем избирательной реакции сравнительно узкую полосу значений определенного признака внешнего сигнала; реакции на недетектируемые значения этого признака должны быть относительно и/или абсолютно ослаблены.

Детекторная система. Совокупность нейронов-детекторов, избирательно настроенных на разные значения определенного признака и перекрывающие достаточно широкую часть диапазона его значений, имеющую экологическое значение для данного вида животных.

Рецептивное поле нейрона (РП). Совокупность рецепторов и элементов всех промежуточных уровней системы, посылающих к нему свои сигналы непосредственно или через элементы промежуточных уровней.

Проекционное поле нейрона. Аналог Р П для выхода нейрона со всеми сопутствующими терминологическими ограничениями.

Детектор ориентации. Клетка, способная избирательно реагировать на определенный угол поворота вспыхивающих в ее РП центрированных в нем световых или темновых полос оптимального размера, вращаемых вокруг центра симметрии.

Оптимальный стимул. Раздражитель, вызывающий в данных экспериментальных условиях максимальную реакцию нейрона.

Кодирование признаков сигнала. Способность нейрона или группы клеток существенно изменять свою импульсацию в соответствии с параметрами стимула.

Обнаружение сигналов. Совокупность операций, приводящих к принятию мозгом решения о появлении, исчезновении, а также смене стимула.

Рисунок 2. Полосы Маха: приграничные участки кажутся темнее или светлее, чем они

Выше показана принципиальная важность детекции контура для дальнейшего распознавания формы и конфигурации объекта. Физиологические механизмы, обеспечивающие этот процесс, начинаются еще на ретинальном уровне. Стоит особо указать на роль латерального торможения. Экспериментально впервые показанное Ф. Ратлиффом на материале сложного глаза Limulus (мечехвоста), состоящего из 1000 омматидиев [по 37]. На активность любой данной рецепторной единицы влияет освещение других, соседних омматидиев. Это влияние является чисто тормозным. Когда на данную рецепторную единицу действует несколько единиц, расположенных поблизости, их общее тормозное влияние количественно определяется простой суммой всех тормозных влияний каждой единицы. Интенсивность торможения прямо пропорциональна уровню возбуждения соседних рецепторов, их количеству и близости по отношению к тормозимому рецептору. Задолго до исследований Ратлиффа известный ученый Эрнст Мах исследовал явления восприятия контраста. В связи с этим появились так называемые полосы Маха (см. рисунок 2). Они также объясняются латеральным торможением в сетчатке.

Многие художники в своих работах также широко использовали резкие перепады освещенности. Вероятно, они интуитивно понимали, что зрительная система особо выделяет контуры за счет прилегающих участков.

Зрительная кора имеет гораздо более сложное строение по сравнению с предыдущими отделами зрительного анализатора. Рассмотрим классификацию РП коры по Хьюбелу и Визелу [33]. Они предлагают разделить РП на простые, сложные и сверхсложные.

Простые РП составлено 1−3 возбудительными зонами (on — для светового стимула, off — для затемнения), вытянутыми в определенном направлении. Увеличение площади стимула приводит к увеличению ответа, пока стимул не выходит за пределы возбудительной зоны; затем начинается торможение вплоть до полного подавления. Простое поле отвечает только на полосу определенной ширины и ориентации и является линейным.

В сложном поле узкая сравнительно с шириной поля полоса вызывает ответ в разных его участках, а ее расширение ведет к подавлению ответа. В большинстве случаев on- и off-зоны перекрыты, хотя могут быть и разделены.

В сверхсложном поле увеличение длины полосы ведет к подавлению ответа.

Эта классификация наталкивается на определенные трудности. Так, увеличение длины полосы может приводить к уменьшению ответа и в простых полях. Тем не менее, критерии, предложенные Хьюбелом и Визелом, имеют глубокий функциональный смысл. В связи с этим Глезер [по 26] приводит следующее экспериментальное исследование. Измеряли ответы нейронов на синус-решетки различной пространственной частоты; частота, вызывавшая наибольший ответ, считалась оптимальной. Одновременно определяли величину РП. Для каждого РП вычисляли индекс сложности как произведение размера поля на оптимальную частоту. Если Р П — фильтр пространственных частот, то индекс сложности (число периодов оптимальной частоты, укладывающееся в РП) пропорционален числу субъединиц этого РП. Оказалось, что для простых полей он равен 1±0,5; для сложных колеблется от 2 до 6. Таким образом, «сложность» поля действительно отражает сложность его организации.

Зрительная кора обладает характерной колончатой организацией. Нейроны коры со сходными свойствами (например, детекторы определенной ориентации полосы) группируются в вертикальные столбцы (колонки), идущие радиально от поверхности коры к белому веществу. В «колонках ориентации» нейроны проявляют почти одинаковую избирательность. Соседние колонки выделяют разные, но близкие ориентации: происходит смещение ориентации оси РП примерно на 10° вплоть до 180°. Ширина ориентационных колонок 20−50 мкм [33].

Колонка является основной структурно-функциональной единицей (элементарной нейросетью) новой коры. Она образует модуль обработки информации, выделяющей определенный признак. Множество колонок позволяет выделить несколько переменных в локальном участке топографического коркового представительства.

Различают три типа колонок: 1) микроколонки — в них представлены градации выделяемого признака; 2) макроколонки, состоящие из микроколонок и представляющие набор всех градаций данного признака (например, всех наклонов линий); 3) гиперколонки, состоящие из макроколонок и представляющие набор всех признаков в данном участке рецептивной поверхности поля зрения. Гиперколонки также называются модулями, потому что являются достаточно автономными структурами, специализированными на обработке части зрительной информации. Тангенциальные волокна серого вещества длиной 1−2 мм создают латеральное торможение между макроколонками, выделяющими одни и те же свойства в разных гиперколонках. Возможна также не только вертикальная (колончатая), но и горизонтальная (послойная) организация размещения нейронов.

Рассмотрим вкратце имеющиеся теоретические подходы к кодированию информации в нервной системе вообще, а затем перейдем к обсуждению специфики детекторных систем. Эти принципы кодирования противоречат друг друга, а являются взаимодополняющими в организованном функционировании нервной системы [6].

Меченая линия. Моносинаптическая передача возбуждения от рецептора к центральному нейрону, возбуждение которого соответствует выделению определенного качества стимула (кодирование качества: метатетический континуум).

Частотный код. Возрастающая зависимость между интенсивностью раздражителя и частотой вызываемых им ПД (кодирование интенсивности: протетический континуум). Возможно также кодирование информации о качестве стимула (например, частота ПД от соматических рецепторов кодирует частоту вибрации, а число вовлеченных в возбуждение волокон — ее интенсивность).

Паттерн ответа нейрона (структурная организация ПД во времени). Требуется включение дополнительных операций по учету начала, конца реакции нейрона и ее продолжительности. Ввиду наличия шумовой спонтанной активности нейронов этот способ кодирования не представляется достаточно надежной. Кроме того, обслуживание механизмов, учитывающих временны/е факторы, требует значительных затрат на физиологическом уровне.

Ансамбль нейронов как основной носитель информации в нервной системе рассматривает Хебб. Различные паттерны распределения возбуждений в ансамбле кодируют разные сигналы; Ни один нейрон сам по себе не может служить ни хранителем, ни передатчиком информации.

Из детекторной теории следует особый способ кодирования информации — кодирование номером канала, т. е. нейрона-детектора, который избирательно реагирует на определенный физический признак или их комплекс.

детекция зрительный поиск векторный

§ 4. Принцип векторного кодирования в нервной системе

Принцип кодирования номером канала органично встраивается в векторную модель, предложенную Е. Н. Соколовым [16, 21, 24, 22, 23, 25, 44, 45, 46]. Основу векторной модели составляет упорядоченная гетерогенность представления информации на каждом уровне ее обработки и передачи. В этой модели решается старый вопрос о механизме передачи сенсорного континуума конечным множеством нейронных единиц. К примеру, так как детекторы ориентации дают дифференцированные ответы в зависимости от степени соответствия стимула их рецептивному полю, становится возможным определение ориентации с точностью гораздо большей, чем 10° (а именно таково примерное расстояние между предпочтительными ориентациями соседних клеток в макроколонке). Ответы различных нейронов данного уровня обработки сопоставляются, и с учетом всех показаний выносится решение о величине наклона линии. При этом в априорные знания системы входят:

a) знание о соответствии каждого канала определенной ориентации (кодирование номером канала);

b) знание о правилах извлечения из ответов нейронов уточненной информации об ориентации.

На физиологическом уровне все это обеспечивается системой синаптических связей с нейронами последующего уровня, на которые конвергируют детекторы ориентации. При необходимости дальнейшего уточнения процесс может выполняться как итеративный. Имеется некоторая избыточность информации предыдущего уровня по сравнению с последующим. Избыточность, создаваемая передачей по параллельным каналам, компенсирует искажения, возникающие при кодировании в отдельном рецепторе. Это не относится исключительно к сенсорным системам: полное написание слов в письменном языке также избыточно.

Возможна количественная оценка избыточности данных с позиций теории информации [34]. Будем называть емкостью канала его пропускную способность, максимальный поток информации (бит/с). Для зрительной системы общая емкость равна примерно 107 бит/с, в то время как ее эквивалент, измеренный в психофизических опытах на материале чтения, оценивается лишь в 40 бит/с. Физиологически этому соответствует последовательная конвергенция афферентных путей по принципу воронки Шеррингтона.

Таким образом, мы приходим к заключению, что допущение обработки информации по признакам [18] требует векторного представления данных для упорядочивания их передачи и извлечения смысла из паттерна нейронных возбуждений. Альтернативная позиция, холизм, которая делает принцип целостности объяснительным, не может быть убедительно сопоставлена с имеющимися данными из области психофизиологии восприятия.

Сделаем некоторые терминологические уточнения, принятые в теории векторного кодирования информации в нервной системе [22]. Основным структурно-функциональным элементом сенсорной системы, модулем обработки информации и принятия решения является концептуальная рефлекторная дуга. Нейроном-детектором в ней называется клетка, реагирующая избирательно на какой-то конечный признак с такой же точностью, как и человек в психофизических опытах (ориентация линии, оттенок цвета и т. д.). Промежуточные уровни между афферентами (рецепторами) и детекторами составлены предетекторами. За детекторами следуют системы принятия и исполнения решений — командные нейроны, премоторы и мотонейроны. Деятельность вышеописанных структур находится под контролем гетерогенной модулирующей системы, активация которой в свою очередь зависит от процессов, протекающих в различных частях организма человека.

В рамках психофизиологического подхода школы Е. Н. Соколова используется определенная логика экспериментального исследования. Данная логика применяется в методологии «человек-нейрон-модель», когда исследование ведется сначала на психофизическом уровне, затем на нейрофизиологическом, после чего формализуется математической моделью, которая проходит проверку и корректируется в соответствии со вновь поступающими эмпирическими данными. Основными методическими принципами работы в этом направлении являются следующие:

1. Исходным пунктом анализа становится различительная чувствительность нервной системы, причем в отношении больших, надпороговых, различий.

2. Числа, соответствующие различиям между стимулами, сводятся в матрицу, которая затем подвергается процедуре анализа методом многомерного шкалирования.

3. Результирующие данные задают геометрическую структуру, репрезентирующую отношения между стимулами в виде математической модели.

Различение стимулов зрительной системой описывается сферической моделью. Процессы передачи информации в звеньях концептуальной рефлекторной дуги в сферической модели различения сигналов нервной системой осуществляются по принципу векторного кодирования.

Для объяснения процессов функционирования нервной системы привлекают представление о концептуальной рефлекторной дуге [24]. Рефлекторная дуга состоит из афферентной (рецепторы, первичные детекторы, вторичные детекторы), эффекторной (командные нейроны, мотонейроны, мышцы) и модулирующей частей. В контексте данной работы мы ограничимся рассмотрением только афферентной части.

Итак, поскольку в данном подходе исследуется различительные характеристики зрительной системы, используются оценки больших надпороговых различий между стимулами, то исходные экспериментальные данные представляются в виде матрицы оценок попарных различий стимулов. По матрице субъективных межстимульных различий с помощью метода многомерного шкалирования (см. ниже) строится геометрическая модель межстимульных различий — n-мерное евклидово пространство различения сигналов. Каждый стимул представляется как точка в этом пространстве. Связь межточечных расстояний с воспринимаемыми цветовыми различиями должна удовлетворять требованию монотонности. При этом расстояния (dij) между точками-стимулами i и j в n-мерном евклидовом пространстве в соответствии со значениями по каждой k-й координате (xk) рассчитываются в соответствии с уравнением Минковского для Евклидовой метрики:

где k= 1, 2, 3, …, n.

Далее, координаты каждой точки-стимула i удовлетворяют уравнению:

где R = const для всех точек-стимулов i.

Последнее уравнение (условие равенства расстояний от точки-стимула до начала координат) определяет тот факт, что все точки-стимулы располагаются на поверхности n-мерной сферы. Поэтому каждый стимул можно представить как n-мерный вектор, который исходит из начала координат, а заканчивается в соответствующей точке [32].

Все вектора имеют одинаковую длину. Последнее обеспечивается таким соотношением компонентов вектора, что сумма квадратов компонентов каждого вектора должна быть постоянной величиной для всех векторов. Компоненты векторов — проекции точки на оси пространства — отражают возбуждения нейронных каналов при кодировании данного стимула. Воспринимаемое различие между стимулами (исходные субъективные оценки) представлено в модели как евклидово расстояние между точками -- концами векторов, репрезентирующими эти стимулы на сфере.

Тем базисным механизмом, который специфицирует различия между стимулами по одной субъективной переменной, является двухканальный модуль (11, 14, 16, 13, 15, 17, 44). В математической форме этому будет соответствовать частный случай при n=2. В этом случае при графическом представлении точки-стимулы располагаются на окружности. Как уже отмечалось, каждую из точек можно соединить с началом координат и получить таким образом совокупность векторов, каждый из которых будет репрезентировать тот или иной стимул. Субъективной переменной будет соответствовать сферическая координата конца вектора, а две компоненты вектора по осям декартовой системы координат будут отражать уровни возбуждения нейрофизиологических каналов.

Степени возбуждения каналов — компоненты векторов — находятся в реципрокных отношениях, так что при увеличении возбуждения первого канала второй уменьшает свою активность, и наоборот. При этом общая активность модуля, представленная величиной радиуса окружности, остается всегда постоянной. Другими словами, все вектора имеют одинаковую длину. Последнее обеспечивается тем обстоятельством, что сумма квадратов уровней возбуждений каналов константна для всех точек-стимулов. Это как раз и задает расположение всех точек на окружности.

Сферическая модель различения доказала свою эффективность для описания механизмов детекции различных простых сенсорных признаков — ориентации линий, углов, цветов и пр. [13, 15, 46]. Во всех этих экспериментах проводилось измерение разброса радиусов, или, иначе, длин векторов-стимулов. При этом величина отклонения оказывалась в пределах 8−10 процентов от среднего радиуса гиперсферы. Путем ортогонального вращения точек-стимулов всегда можно получить конфигурацию, позволяющую содержательно интерпретировать оси евклидова пространства как сенсорные каналы зрительной системы.

Главным преимуществом модели является то, что она позволяет связывать предполагаемые нейронные механизмы кодирования сигнала с субъективными данными межстимульных различий. Это представляется крайне важным, т.к. позволяет сопоставлять результаты, полученные в психофизических опытах на человеке с данными по вызванным потенциалам и по регистрации электрической активности отдельных нейронов на животных.

Итак, в итоговой модели:

1. Расстояние между точками соответствует субъективным различиям между стимулами, амплитудам электроретинограммы, амплитудам вызванного потенциала, измеряющего различия между этими стимулами.

2. Угловая мера расположения точки на сфере отражает меру данного стимула по той или иной субъективной переменной («насыщенность цвета» и т. п.).

3. Проекции точки на оси пространства соответствуют возбуждению сенсорных каналов при кодировании данного сигнала.

Таким образом, данная модель интегрирует в себе как феноменологию различения стимулов, так и нейрофизиологические механизмы кодирования сенсорной информации. Так, например, для пространства цветоразличения значения декартовых координат точек-стимулов, полученных в результате обработки данных психофизических экспериментов, хорошо согласуются с активностью отдельных компонентов зрительной системы — цветоопонентных и яркостных клеток ЛКТ [16].

Нейронная сеть цветоразличения состоит из двух двухканальных модулей — хроматического и ахроматического. Первый анализирует спектральный состав излучения, преобразуя его в цветовой тон, а второй — анализирует интенсивность светового излучения и преобразует его в светлоту. Но поскольку у высших позвоночных (в отличие от низших [10]) имеет место взаимосвязь между каналами, то декодирование излучения в четырехканальной сети приводит к появлению еще одной, дополнительной переменной — цветовой насыщенности, не имеющей своего прямого физического коррелята.

Проблема различения ориентации линий зрительной системой представляется особенно важной в связи с поисками механизмов распознавания сложных трехмерных зрительных сцен. В исследованиях данного вопроса [15] принято выделять некоторое ограниченное число базисных единиц, из которых зрительная система (или ее аналог в виде компьютерной программы) определяет трехмерную форму предметов зрительной сцены [30]. Примерами таких узлов являются углы, фигуры типа «вилка», «стрелка» и т. д. При подобном рассмотрении линии могут выступать в двух различных аспектах. Во-первых, если к контурному рисунку подходить как к комбинации прямых линий различного размера и ориентации, то в этом случае линии разной ориентации можно рассматривать как исходный массив однотипных элементов, из разных комбинаций которого можно составить более сложные признаки (углы, стрелки и т. д.). Во-вторых, линия и сама может являться элементом алфавита, или узлом, точно таким же, как и угол, стрелка и т. п.

В соответствии с вышеизложенными данными можно предложить гипотезу о трехуровневом строении нейронной сети, ответственной за построение конфигураций.

На первом этапе формируются базисные единицы — линии разной ориентации. Задачей этого уровня является выделение информации о перепадах яркости, установление границ и пр. На втором уровне линии различной ориентации комбинируются в узлы. Имеется ограниченный набор узлов — базовых элементов второго уровня, и линия как отрезок становится на этом уровне самостоятельным узлом. На третьем этапе из разных узлов как из букв составляются конфигурации.

Данная гипотеза хорошо согласуется с нейрофизиологическими исследованиями Хьюбела и Визела и проясняет назначение того большого числа детекторов ориентации линий, которое имеется в зрительной коре. Можно сказать, что эти клетки являются «квазирецепторами», выполняющими те же самые входные функции при анализе формы, что и рецепторы сетчатки при анализе спектрального состава излучения. Подкорковые структуры и сетчатка выполняют предварительный анализ пространственного распределения интенсивности светового излучения. А нейроны коры с простыми рецептивными полями и являются детекторами ориентации. Дальнейший анализ происходит на корковых нейронах со сложными и сверхсложными рецептивными полями. Здесь имеет место спецификация узлов, в том числе и самой линии как отрезка, а затем и построение формы объекта.

Детектирование ориентации линий эффективно описывается с помощью сферической модели различения и векторного принципа кодирования информации [15]. Данный процесс моделируется с помощью окружности в двумерном пространстве. Детекция ориентации осуществляется, таким образом, с помощью двухканального модуля. Первый канал данной нейронной сети максимально возбуждается при вертикальной ориентации стимулов, а при горизонтальной — в наибольшей степени подавляет свою активность. Второй канал максимально активизируется при ориентации стимула в 45° по отношению к горизонтали, а при ориентации стимула в 135° максимально тормозится.

Пространство различения ориентации линий будет использоваться нами для обоснования методики построения субъективных пространств, основанной на анализе параметров эффективности выполнения задачи зрительного поиска для ориентационных полосок.

Глава II. Эмпирическое исследование

§ 1. Общее описание

Эмпирическая часть нашей работы представлена серией экспериментов, последовательно решающих поставленные в соответствии с методологией «Человек — Нейрон — Модель» задачи.

В первом эксперименте осуществляется апробация предлагаемой методики измерения различий между стимулами с помощью задач зрительного поиска. Устанавливается наличие предполагаемого эффекта — зависимости показателей эффективности зрительного поиска от различий между целевым стимулом и дистракторами.

Во втором эксперименте изучается различение зрительной системой линий различной пространственной ориентации в задачах зрительного поиска. Второй эксперимент содержит три серии. В первой серии собирается полная матрица различий по 12 стимулам различного наклона — от 0° до 180° с шагом в 15°. Вторая серия аналогична первой, однако в ней вводится затруднение условий восприятия за счет снижения контраста сцены и времени экспозиции. Третья серия — контрольная, в ней проводится прямое шкалирование различий между стимулами, использованными во второй серии, для сопоставления с классическими данными. Полученные матрицы различий обрабатываются методом многомерного шкалирования, проводится анализ полученных субъективных пространств.

В третьем эксперименте делается попытка электрофизиологического изучения «эффекта выскакивания» в зрительном поиске.

Для двух пар «цель-дистрактор» в задаче, аналогичной предыдущий, записывается вызванный потенциал.

В четвертом эксперименте совмещаются психофизические и электрофизиологические методы. Собирается полная матрица различий для 15 цветов с одновременной регистрацией параметров эффективности зрительного поиска и вызванных потенциалов во время выполнения данной задачи.

В общей сложности в исследовании приняли участие 95 испытуемых с нормальным или скорректированным зрением. Во всех экспериментах использовался CRT-монитор, удаленный от испытуемого на расстояние 1,4 м. Контроль времени предъявления стимулов осуществлялся с помощью фотодиода, прикрепленного на мониторе. Ответы испытуемого принимались с помощью устройства типа «мышь», подключенному к тому же аналого-цифровому преобразователю, что и фотодиод (а также энцефалографические каналы, в тех случаях, когда они использовались).

§ 2. Эксперимент № 1: установление эффекта

В начале необходимо было ответить на вопрос, действительно ли скорость и эффективность поиска в задачах с «эффектом выскакивания» связаны с величиной различия между стимулами, и является ли эта связь монотонной.

ПоказатьСвернуть
Заполнить форму текущей работой