Языки тематического поиска в электронном каталоге и индивидуальное поисковое взаимодействие

Тип работы:
Реферат
Предмет:
Информатика


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Информатика
УДК 025.4 ББК 73
ЯЗЫКИ ТЕМАТИЧЕСКОГО ПОИСКА В ЭЛЕКТРОННОМ КАТАЛОГЕ И ИНДИВИДУАЛЬНОЕ ПОИСКОВОЕ ВЗАИМОДЕЙСТВИЕ
© Г. А. Скарук, 2005
Государственная публичная научно-техническая библиотека Сибирского отделения Российской академии наук 630 200, г. Новосибирск, ул. Восход, 15
Требование «дружественности к пользователю» должно предъявляться и к лингвистическому обеспечению электронных библиотечных каталогов. Поиск в электронном каталоге с использованием различных типов ИПЯ рассматривается как когнитивно-коммуникативный процесс. Свойства ИПЯ оцениваются с точки зрения различных концепций комфортности информационной среды. Многие из этих свойств изменяются в электронной среде. Обсуждается новый подход к обеспечению простоты поиска, связанный с замещением функций пользователя автоматическими процедурами. Поиск описывается как опосредованное либо непосредственное взаимодействие множества участников. Решению возникающих в связи с этим проблем способствует применение комплекса ИПЯ.
Ключевые слова: электронный библиотечный каталог, информационный поиск, информационнопоисковые языки, коммуникативное взаимодействие, комфортность поиска.
По мере вовлечения библиотеки в глобальную электронную среду, роста числа ее удаленных пользователей заметно изменяется и характер помощи пользователям интерактивных библиотечных каталогов. Такого рода помощь все больше ориентируется на их самообслуживание, опосредуется через систему «подсказок», инструкций и автоматических процедур. Это требует детального учета особенностей поискового поведения пользователей. И здесь наглядно проявились противоречия между необходимостью формализации, унификации поисковых средств и необходимостью учета индивидуальных коммуникативных механизмов поискового взаимодействия.
Эти противоречия в полной мере проецируются на языки тематического поиска в электронном каталоге (ЭК), ведь именно они выполняют самую важную роль в диалоге пользователя с поисковой системой, описывая семантику информационной потребности, и именно при их использовании проявляются индивидуальные особенности мышления и личностного знания. «Дружественность к пользователю» — одно из основных требований к современным электронным каталогам. На наш взгляд, оно должно относиться и к их лингвистическому обеспечению. Поэтому сегодня к информационно -поисковым языкам (ИПЯ) ЭК применяются многие теоретические положения из этой области.
1. Поиск как процесс коммуникации.
При оценке совместимости пользователя с ЭК информационный поиск чаще всего рассматрива-
ется как процесс «коммуникативного взаимодействия» /1, 2/. Содержание поиска определяется как «диалог», «общение», в результате которого происходит обмен данными, информацией. Проблемы поиска анализируются на разных уровнях взаимодействия: от уровня «пользователь — система», наиболее распространенного в библиотековедении, до уровня «пользователь — создатель информационного ресурса» с позиций эргономики, психологии, психолингвистики, когнитологии.
2. Поиск как когнитивный процесс.
Основанием для применения когнитивного подхода служит трактовка поисковых языков ЭК как инструментов организации знаний, функционирующих в информационной среде /3, 4/. Электронный каталог — один из ее элементов. Соответственно, требования к информационной среде во многом можно предъявить и к поисковым языкам ЭК.
Термин «организация знаний» был введен в библиотековедение Г. И. Блиссом /5/. Несмотря на дискуссии о правомерности его употребления в таком контексте и аспектах его толкования (с позиций теории экспертных систем, семиотики, ког-нитологии) /6−8/, это понятие широко используется при анализе поисковых языков.
Представители этого подхода используют базовые положения когнитивной лингвистики. Один из основных тезисов звучит так: возможность хранения в человеческой памяти и использования большого объема многообразных знаний обеспечивается определенной упорядоченностью храни-
мых единиц /9, 10/. По утверждению Б. НаппаЬш8, процессы извлечения знания подобны для лингвистических структур ИПС и семантических структур концептуальных представлений /11/. Это направление представлено работами А.Ц. Масеви-ча /12/, Л. В. Сахарного /13, 14/. За рубежом популярны исследования способов отражения в структуре и лексике поисковых языков менталитета отдельных социальных и профессиональных общностей /15, 16/.
3. Комфортность поиска.
Как показал анализ литературы, в это понятие вкладывается очень разное содержание. В контексте когнитивного подхода формируются две точки зрения, одна из которых ориентирована на «сопровождение» интеллектуальной деятельности, другая -на ее активизацию. Чтобы это проиллюстрировать, сопоставим две, на первый взгляд, полярные позиции.
Развивая мысль И. Дальберг /3/, Ю. А. Шрейдер применял понятие комфортности именно к организации знаний. По его мнению, комфортную информационную среду должны характеризовать возможность корректировки информационной потребности и легкость использования, способность «не предъявлять существенных и неожиданных трудностей», не требовать от пользователя «смены привычных установок» /4/.
Статья Т. Б. Соколовской была написана много раньше и представляет точку зрения, немного забытую сегодня. В ней комфортность описывается как «такой способ организации информационной среды, который создает условия для наиболее эффективной переработки информации», «наличие информационных предпосылок, стимулирующих творческое мышление» /17/. Отсюда следует, по нашему мнению, что информационная среда должна быть организована таким образом, чтобы не только и не столько фиксировать привычные, но и способствовать выявлению новых связей между объектами, принципов их размежевания и подобия, тенденций развития. Информация должна быть представлена в разных контекстах, включена в различные структуры. С этой точки зрения требование легкости использования, конечно, не самое значимое.
Справедливость такого взгляда подтвердили результаты анкетирования пользователей систематического каталога, проведенного в ГПНТБ СО РАН /18/. Это свойство информационной среды оказалось наиболее востребовано научными работниками, которые использовали самые разнообразные поисковые стратегии, обращались и к поиску по узким темам с помощью рубрик алфавитно-предметного указателя к каталогу, и к просмотру семантического окружения темы путем движения по уровням иерархической классифика-
ции. В то же время студенты, ориентирующиеся на простоту поиска, затем чаще других категорий отказывались от литературы из-за ее несоответствия теме (44% отказов).
Попробуем применить эти положения к языкам тематического поиска. В первом случае во главе угла окажется принцип «естественности» ИПЯ /19, 20/, близости к естественному языку, соответствия принципам организации знания в процессах речемыслительной деятельности. Во втором — рассматривается принцип «интегральности» /17, 21/, подразумевающий многоуровневое, многоаспектное представление информации. Аргументы такого плана часто звучат в дискуссиях о преимуществах разных типов поисковых языков.
Решающими при оценке «естественности» ИПЯ, как правило, оказываются соображения о совпадении плана выражения (а отчасти и плана содержания) и естественного, и поискового языков /22, 23/. С этих позиций чаще всего предпочтение отдается вербальным ИПЯ. Но, учитывая, что в современных ЭК язык индексирования запроса может отличаться от языка индексирования документа, этот аргумент уже нельзя относить только к вербальным языкам.
Кроме того, и здесь есть определенные проблемы, которые не всегда осознают пользователи. Одна из них — распространенное представление о совпадении плана выражения и плана содержания естественного языка и контролируемых вербальных ИПЯ, с которым не соглашаются авторитетные специалисты /14, 24/. Об этом писал Л. В. Сахарный, указывая на затруднения, возникающие из-за «обманчивой „естественности“, приводящей к возможным несовпадениям с привычным планом выражения (формой) специфического для ИПС плана содержания» /14, с. 19/.
Другая проблема — несовпадение индивидуального словаря пользователя и лексики контролируемого ИПЯ. По данным нашего анкетирования /20/, сразу нашли соответствующие теме рубрики алфавитно-предметного указателя только 40% студентов, 46% ученых, 56% специалистов.
Оба подхода (с точки зрения «естественности» и интегральности) применяются при анализе принципов структурной организации нормативных словарей контролируемых ИПЯ, структуры сложных индексов, способов задания синтагматических отношений между лексическими единицами.
При оценке гибкости структуры поисковых образов документа и запроса речь ранее велась прежде всего о преимуществах посткоординатных ИПЯ. Проблемой же предкоординатных ИПЯ всегда считались трудности психологического характера при формулировке поискового предписания, связанные с потребностью варьирования формы высказывания в речевой коммуникации /13/.
Но сегодня благодаря появлению возможности поиска в ЭК в режиме посткоординации (поиска по каждому отдельному элементу сложного индекса) эта проблема снимается.
Нормативные словари (авторитетные файлы) ИПЯ оцениваются по двум позициям: с точки зрения их обозримости и с точки зрения жесткости структуры. Большинство авторов указывают на преимущества по обозримости иерархических классификаций /25, 26/. Требование обозримости предъявляется и к выданным в ответ на запрос массивам библиографических записей. Один из возможных вариантов — структурирование выдачи большого объема. Такое сегодня возможно в карточных систематических каталогах. Его могли бы обеспечить семантически мощные иерархические классификации. Но, по утверждению Э. Р. Сукиасяна, этот механизм пока нигде не реализован /27/. Взгляды же на жесткость структуры словарей также меняются, так как авторитетные файлы обеспечивают поэлементный доступ к сложным предметным рубрикам и классификационным индексам.
4. Простота поиска.
Самый очевидный способ обеспечить легкость использования ИПЯ — сокращение количества составных элементов (лексических единиц, грамматических средств) и связей между ними в самом языке. Именно в таком понимании принцип доступности был сначала реализован в зарубежных ЭК, и именно этот аспект проблемы был предметом дискуссий в середине 1980-х гг. Например, J.A. Adams /28/, V. Raval /29/ высказывали мнение, что ориентация на дружественность к пользователю ведет к простым и неглубоким стратегиям поиска и в конечном итоге ограничивает доступ к информации.
Такое понимание простоты поиска справедливо лишь в определенных пределах. Это наглядно подтверждает история развития поисковых машин Интернета, где постепенно усложняются механизмы поиска и вводятся элементы структурирования информации. Значительное большинство участников анкетирования /30/ сообщили, что ориентируются на поисковые машины, обеспечивающие большую полноту и релевантность поиска, и лишь 22,6% - на простоту использования этих машин.
Новый подход к обеспечению простоты использования поисковых языков основывается на рассмотрении ЭК как экспертной посреднической системы. Появляются возможности представления структуры и лексики ИПЯ с разной полнотой для разных категорий пользователей- автоматического управления построением и корректировкой поискового предписания (в том числе автоматического перевода запроса с естественного языка на ИПЯ) — автоматического выбора ИПЯ. Но нельзя забывать, что такое замещение функций пользователя может
иметь и положительные, и отрицательные последствия. По мнению Э. Р. Сукиасяна, важно, чтобы при этом не было утрачено когнитивное значение каталога и за читателем сохранилась возможность выбора путей поиска /31/.
В связи с этим изменяются и традиционные оценки сложности использования поисковых языков. Так, менее значимыми становятся аргументы по поводу сложности ориентации в структуре иерархических классификаций. Необходимо учитывать, что каждый пользователь карточного систематического каталога в любом случае должен был выполнять один и тот же набор шагов. В ЭК же для неопытных пользователей часть этих процедур может выполняться «по умолчанию». В то же время возможности раскрытия структуры и содержания ИПЯ в авторитетных файлах гораздо шире, чем в печатных таблицах классификации. К ним могут обратиться пользователи с высокой квалификацией.
5. Вариативность поиска.
Другое следствие рассмотрения проблем информационного поиска на уровне индивидуальных межсубъектных взаимодействий — усиление внимания к проблеме вариативности его процессов и результатов. В противовес подходу к оценке ЭК на уровне «пользователь — система» сегодня исследователи ориентируются на оценку деятельности значительно большего числа участников. А значит, оценивается взаимодействие в процессе поиска «когнитивных структур», «дискурсов», «тезаурусов» всех задействованных в поиске сообществ.
Роль отдельных действующих лиц в цепочке взаимодействий, обеспечивающих эффективный поиск, легко проследить, суммировав данные публикаций, описывающих отдельные его стороны. Когнитивные структуры конструкторов и производителей автоматизированной библиотечно-информационной системы представлены в специфической структуре конкретных баз данных, функциях пользовательских интерфейсов, критериях релевантности, алгоритмах поиска, реализуемых системой /32/. Автор излагает собственную концепцию, вводит новые термины и понятия, произвольно структурирует текст. Субъективизм индексаторов проявляется не только при выделении основного содержания (предмета, ведущего признака) авторского текста, но и в произвольном отборе терминов из нормативных словарей (либо текста), определении их роли в поисковом образе документа /12, 14/. Доказательство тому — результаты многочисленных экспериментов по устойчивости индексирования /33, 34/. Е. Н. Пименов, характеризуя влияние прагматических факторов на процесс и результат индексирования, выделяет 12 таких условий, в том числе общее назначение базы данных, объем обрабатываемой информации,
состав документов в системе, штаты и квалификацию персонала /35/. Кроме того, как справедливо отмечает Э. Р. Сукиасян, индексаторы имеют дело не с идеальной моделью ИПЯ (ИПЯ как системой), а с его овеществленным носителем, например с классификационными таблицами конкретного ИПЯ определенного года издания /36/. Выбирая поисковые термины, информационный посредник рассматривает тему (предмет) поискового запроса в перспективе многих занятых в дискурсах сообществ и при этом оценивает и синтезирует элементы отличия и сходства /37/. Эти же операции должен выполнять и пользователь каталога. Данный процесс усложняется, когда искомые знания относятся к «разным, но исследующим одну сущность мира системам знания» /38/.
Отсюда вывод о потенциальной ценности всех участвующих в поиске когнитивных структур. П. Ингверсен говорит в этом контексте о необходимости многоуровневого представления как семантических объектов (документов, текстов), так и характеристик потребностей пользователя /32/. А значит, мы вновь возвращаемся к принципу ин-тегральности информационной среды и необходимости применения при поиске нескольких ИПЯ. С другой стороны, на примере поиска по полным текстам обосновывается неприемлемость механического наращивания числа «точек доступа» и, как следствие, вывод, что в любой поисковой среде не удастся избежать применения специальных языков индексирования /39/.
Кроме того, для решения этого комплекса взаимосвязанных проблем в ЭК предлагается расширение семантического поля запроса. Механизмы такого расширения в наибольшей степени предусмотрены в цифровых иерархических классификациях.
Очевидно, что возможности различных типов ИПЯ по обеспечению рассмотренных в статье принципов дополняют друг друга и будут необходимы в разных поисковых ситуациях. В то же время эти возможности настолько меняются в электронной среде, что свойства многих ИПЯ сближаются, многие традиционные аргументы «за» или «против» применения тех или иных лингвистических средств в ЭК теряют силу. Но в любом случае итогом дискуссий об их преимуществах, как нам кажется, должен стать вывод о необходимости комплексного применения языков тематического поиска.
Список литературы
1. Лавренова, О. А. Лингвистическое обеспечение электронных каталогов: разработка средств тематического поиска / О. А. Лавренова // Мир библиотек сегодня. — 1997. — Вып. 15. — С. 60−70.
2. Тоом, А. А. Причины дискомфорта в диалоге с информационно-поисковой системой и пути его пре-
одоления / А. А. Тоом // НТИ. Сер. 2. Информ. процессы и системы. — 1987. — № 4. — С. 1−6.
3. Дальберг, И. Организация знаний: ее сфера и возможности / И. Дальберг // Организация знаний: проблемы и тенденции. — М., 1993. — С. 7.
4. Шрейдер, Ю. А. Категория комфортности как основной критерий организации знаний / Ю. А. Шрейдер // Междунар. форум по информ. и документации. -1993. — Т. 18, № 3−4. — С. 17−18.
5. Bliss, H.E. The organization of knowledge in libraries / H.E. Bliss. — N.Y., 1993. — P. 36−37.
6. Мизинцева, М. Ф. Представление знаний в системах искусственного интеллекта / М. Ф. Мизинцева // НТИ. Сер. 1. Орг. и методика информ. работы. -
1998. — № 12. — С. 1−6.
7. Сукиасян, Э. Р. Организация знаний как элемент информационной культуры / Сукиасян Э. Р. // Формирование информационной культуры читателей: роль новых технологий. — Новоуральск, 2000. — С. 14−21.
8. Черный, А.И. О проблемах организации и представления знаний / А. И. Черный // Междунар. форум по информ. и документации. — 1998. — Т. 23, № 2. -С. 3−8.
9. Петров, В. В. На пути к когнитивной модели языка /
B.В. Петров, В. И. Герасимов // Новое в зарубеж. лингвистике. Вып. 23. Когнитивные аспекты языка. — 1988. — С. 5−11.
10. Пиаже, Ж. Психогенез знаний и его эпистемологическое значение / Ж. Пиаже // Семиотика. — М., 1983. — С. 90−101.
11. Hannabuss, S. Dialogue and the search for information / S. Hannabuss // Aslib. Proc. — 1989. — Vol. 41, № 3. -P. 85−98.
12. Масевич, А. Ц. Два подхода к теории ИПС в свете современных лингвистических концепций / А.Ц. Ма-севич // Предмет. поиск в традиц. и нетрадиц. ин-форм. -поисковых системах. — 1989. — Вып. 9. -
C. 25−50.
13. Сахарный, Л. В. Ассоциативные структуры в естественном языке и предметизационном ИПЯ (к постановке проблемы) / Л. В. Сахарный // Там же. — 1988. -Вып. 8. — С. 5−35.
14. Сахарный, Л. В. Предметная рубрика как вид текста / Л. В. Сахарный // Там же. — 1987. — Вып. 7. — С. 16−37.
15. Albrechtsen, H. The dynamics of classification systems as boundary object for cooperation in the electronic library / H. Albrechtsen, E.K. Jacob // Libr. Trends. -
1998. — Vol. 47, N 2. — P. 293−312.
16. Olson, A.H. Mapping beyond Dewey'-s Boundaries: Construction classificatory space for marginalized knowledge domains / A.H. Olson // Ibid. — P. 233−254.
17. Соколовская, Т.Б. О комфортности информационной среды / Т. Б. Соколовская // НТИ. Сер. 2. Информ. процессы и системы. — 1980. — № 11. — С. 5−10.
18. Скарук, Г. А. Помощь пользователю электронного каталога: ожидания читателей и возможности поисковой системы / Г. А. Скарук // Место и роль библиотеки в инфраструктуре образовательного пространства: Сибирь и Дальний Восток. — Новосибирск, 2003. — С. 84−96.
19. Саффиуллина, З.А. АСОД как научная проблема и предмет преподавания / З. А. Саффиуллина // Библиография. — 1998. — № 3. — С. 3−9.
20. Щербинина, Г. С. Философия координатного индексирования / Г. С. Щербинина // Науч. и техн. б-ки. -2000. — № 9. — С. 72−76.
21. Новиков, Ю. А. Психологические критерии отбора информации / Ю. А. Новиков // НТИ. Сер. 1. Орг. и методика информ. работы. — 1970. — № 7. — С. 3−8.
22. Гальцева, Т. Е. Электронный каталог в библиотеке вуза / Т. Е. Гальцева // Науч. и техн. б-ки. — 1996. -№ 8. — С. 6−11.
23. Зайцева, Е. М. Лингвистическое обеспечение автоматизированных информационно-библиотечных систем: современные требования и направления развития / Е. М. Зайцева // Науч. и техн. б-ки. — 2000. -№ 3. — С. 54−57.
24. Ручимская, Е. М. Явление вариативности естественного языка и способы ее устранения в вербальных ИПЯ / Е. М. Ручимская // НтИ. Сер. 1. Орг. и методика информ. работы. — 2000. — № 2. — С. 24−26.
25. Гендина, Н.И. ББК как средство организации знаний и предмет изучения в высшей библиотечной школе: концептуальные подходы / Н. И. Гендина // ББК: Новые горизонты орг. знаний: материалы Междунар. науч. конф. (14−16 октяб. 1998 г., Москва). — М. ,
1999. — С. 86−100.
26. Maniez, J.A. classifications still relevant in databases? / J.A. Maniez // Doc. Languages and Databases. -Frankfurt/M, 1991. — P. 120−129.
27. Сукиасян, Э.Р. «Предметный вход» в систематический каталог. Как повысить эффективность поисковых процедур [Электронный ресурс] / Э. Р. Сукиасян // Библиотеки и ассоциации в меняющемся мире: материалы Междунар. конф. «Крым-2003». Судак, Авт. Респ. Крым, Украина, 7−15 июня 2003 г. — М., 2003. — Т. 2. — Режим доступа: http: //www. gpntb. ru/ win/inter-events/crimea2003/index2. htm
28. Adams, J.A. The computer catalog: a democratic or auithoritarian technology? / J.A. Adams // Libr. J. -1988. — Vol. 113, N 2. — P. 31−36.
29. Raval, V. Do user-friendly systems enhance control objectives? / V. Raval // J. Account. And EDP. — 1989. -Vol. 5, N 1. — P. 24−27.
30. Vaughan, J. Considerations in the choice of in Internet tools / J. Vaughan // Libr. Hi Tech. — 1999. — Vol. 17, N 1. — P. 89−106.
31. Сукиасян, Э.Р. Homo Quaerens (Человек ищущий). К проблеме развития познавательных способностей читателя в процессе информационного поиска [Электронный ресурс] / Э. Р. Сукиасян // Науч. и техн. б-ки. — 2002. — № 4. — Режим доступа: http: // www. gpntb. ru/win/ntb/ntb2002/4/f413. htm
32. Ингверсен, П. Когнитивная перспектива в информационном поиске / П. Ингверсен // Междунар. форум по информ. и документации. — 1994. — Т. 19, № 2. -С. 25−32.
33. Масевич, А. Ц. Проявления субъективного фактора в традиционных каталогах: теоретический и методический подходы к исследованию / А. Ц. Масевич, И. Н. Комарова, В. Б. Лазуркина // Предмет. поиск в традиц. и нетрадиц. информ. -поисковых системах. -1990. — Вып. 10. — С. 109−125.
34. Connell, T.H. Use of the LCSH system: Realities / T.H. Connell // Cat. and Classif. Quart. — 1996. — Vol. 23, N 1. — P. 73−98.
35. Пименов, Е.Н. О факторах, влияющих на индексирование: индексирование и предметная область / Е. Н. Пименов // НТИ. Сер. 1. Орг. и методика информ. работы. — 2000. — № 2. — С. 15−23.
36. Сукиасян, Э. Р. Системный анализ проблем управления качеством информационно-поисковой системы /
Э. Р. Сукиасян // Науч. и техн. б-ки. — 1995. — № 3. -
C. 5−15.
37. Iivonen M. From translation to navigation of different discourses: A model of search term selection during the pre-online stage of the search process / M. Iivonen,
D.H. Sonnenwald // J. Amer. Soc. Inf. Sci. — 1998. -Vol. 49, N 4. — P. 312−326.
38. Бернштейн, Э. С. Пробельный анализ как метод информатики / Э. С. Бернштейн // НТИ. Сер. 2. Информ. системы и процессы. — 1983. — № 6. — С. 1 — 15.
39. Fugmann, R. The empirical approach in the evaluation of information systems / R. Fugmann // Know. Organ. -
1999. — Vol. 26, N 1. — P. 3−9.
Материал поступил в редакцию 26. 04. 2005 г.
Сведения об авторе: Скарук Галина Анатольевна — кандидат педагогических наук,
старший научный сотрудник центра научной обработки документов, тел. (383) 266−92−09

ПоказатьСвернуть
Заполнить форму текущей работой