Об одном методе синтеза семантической структуры веб-сайта

Тип работы:
Реферат
Предмет:
ТЕХНИЧЕСКИЕ НАУКИ


Узнать стоимость

Детальная информация о работе

Выдержка из работы

УДК 004. 45
А. А. Сытник, В. С. Салин, С. В. Папшев ОБ ОДНОМ МЕТОДЕ СИНТЕЗА СЕМАНТИЧЕСКОЙ СТРУКТУРЫ ВЕБ-САЙТА
В настоящее время для многих современных веб-ресурсов характерен непрерывный рост объемов информации, размещенной на веб-страницах. В таких случаях возникает проблема актуальности логической структуры сайта, а именно несоответствие содержания веб-страниц разделу, в котором они расположены. Одним из возможных решений данной проблемы является создание семантической структуры веб-сайта, динамически обновляемой при добавлении новой информации, тем самым сохраняющей актуальность. Рассматривается построение объектно-ориентированной модели веб-сайта и описывается метод синтеза семантической структуры сайта на основе данной модели.
Логическая структура веб-сайта- объектно-ориентированная модель- семантический веб- веб-аналитика- World Wide Web
A.A. Sytnik, V.S. Salin, S.V. Papshev A METHOD FOR THE WEBSITE’S SEMANTIC STRUCTURE SYNTHESIS
Today large amount of information placed on web pages is typical of most modern web resources. Therefore, there are problems connected with the logical structure of
web sites, and with different web pages becoming irrelevant to the sections they are located. One of the possible methods to solve this problem is to develop the semantic structure of a web site dynamically updated in accordance with the contents of the web site pages which will remain relevant while adding new information. This paper examines the process of constructing the object-oriented model of a web site, and describes the method for constructing the semantic structure of a web site based on the object-oriented model.
Web site’s logical structure, object-oriented model, semantic web, web analytics,
World Wide Web
Одним из основных принципов, лежащих в основе современной концепции Web 2. 0, является привлечение пользователей к наполнению и многократной выверке содержимого. Для большинства веб-сайтов, основывающихся на данной концепции, характерны высокие темпы роста объема информации, размещаемой на данных сайтах. Это, в свою очередь, выражается в увеличении числа информативных веб-страниц.
Логическая структура таких веб-сайтов представлена несколькими основными тематическими разделами, которые наиболее общим образом характеризуют семантику содержащихся веб-страниц. Причем, возможностями добавления новых разделов обладает либо ограниченное число пользователей (их количество значительно меньше числа пользователей, формирующих все содержимое вебсайта), либо только администрация веб-ресурса. Кроме того, семантическое содержание названия раздела не всегда точно и полно отображает содержание каждой из страниц данного раздела.
Вспомогательным элементом навигации по подобным веб-сайтам является навигация по тегам (метками) — ключевым словам каждой страницы. Теги также формируются пользователями и наиболее точно характеризуют содержание отдельной веб-страницы, причем каждой странице может соответствовать сразу несколько тегов. Общее число тегов сопоставимо с общим количеством вебстраниц сайта, поэтому при большом количестве страниц, навигация по тегам затруднительна — часто бывает сложно или вообще невозможно найти нужный тег в списке всех тегов, а тем более, указать группу подходящих тегов. Решением данной проблемы может быть создание иерархии тегов с учетом семантики, причем верхние уровни иерархии должны иметь наиболее общее смысловое значение- в свою очередь, нижние уровни должны уточнять значения вышестоящих уровней.
Различные методы построения и анализа семантических сетей на основе веб-сайтов рассматриваются в работах [1, 2, 3]. Новизна данной работы заключается в разработке и реализации семантической структуры веб-сайта, основанной на его объектно-ориентированной модели.
В первой части работы предлагается построение объектно-ориентированной модели веб-сайта. Во второй части описаны принципы построения семантической структуры сайта и соответствующей навигации по нему на основе объектно-ориентированной модели.
Рассмотрим гипертекстовую структуру S, для которой определено множество страниц
P = {pi}, i = 1-n (1),
и множество тегов, характеризующих содержание страницы:
T = {tj} j = 1… m (2)
Каждому тегу tj е T поставлено в соответствие подмножество страниц:
tj ^ Pj = {paj,…, pbj }Pj С P^Pj = Р (3)
Будем обозначать объектом (в объектно-ориентированном смысле) каждую страницу pt е Р, а
классом — тег tj, которому соответствует подмножество страниц Pj = {paj,…, pbj}. Тогда объект pi
относится к классу tj, если pt е P.
В случае, показанном на рис. 1, базовыми являются классы, которым соответствуют множества
Ри ИР21.
Ш •
Рис. 1. Соответствующие множествам Рц и P21 базовые классы
Введем отношение наследования между классами. Для этого, разобьем все множество страниц Р на подмножества Рк таким образом, чтобы
1) Рк = иР}, ] = ]к… ]к+1 (4) —
2) Для каждого к: и Рк = 0.
Из каждого Рк выберем подмножества Pj максимальной размерности. Тогда каждый класс, которому соответствует выбранное подмножество Pj, будем считать базовым для всех остальных классов подмножеств из Рк.
Каждое множество Рк будет соответствовать множеству классов Тк е Т:
Тк = {к1'^к2'-& quot-'^кп } (5),
Причем Гкг^Ркг.
Будем считать, что классы гк2, гк3, …, гкп наследуют класс гк1, если
1) они не имеют общего наследуемого класса-
2) Рк1 П Ри Ф 0, 1 = 1- п (6).
Проиллюстрируем образующуюся в таком случае иерархию наследования. Из рис. 2 видно, что, кроме одиночного наследования, может иметь место множественное наследование.
Рис. 2. Иллюстрация образовавшейся иерархии наследования
Полученную иерархию можно также представить в виде ориентированного графа, который в общем случае из-за множественного наследования не будет являться ациклическим.
В данном графе G = У, Е} множество вершин V будет представлять собой множество классов Тк, а
множество дуг Е будет отражать отношение наследования между классами. То есть, дуга из г1 в г2 существует тогда и только тогда, когда класс г2 наследует класс г1.
С другой стороны, каждому классу ^ поставлено в соответствие множество страниц Pj, и из введенного ранее понятия наследования следует, что если г2 наследует г1, то Р2 П Р1 Ф 0, т. е. Р2 П Р1 = Р21 Ф 0 (7). Подсчитав размерность М21 образуемого на пересечении Р2 и Р1 множества Р21, мы можем установить вес дуги из г1 в г2 равным Ы21 Установив веса для каждой из дуг ориентированного графа G, мы получим взвешенный ориентированный граф.
На основе рассмотренной объектно-ориентированной модели веб-сайта построим его семантическую структуру, которая будет динамически обновляться при добавлении новых веб-страниц.
За основу примем многоуровневую логическую структуру, на каждом уровне которой разделами будут являться классы г. Первый уровень будет содержать все базовые классы к. Для каждого базового класса к второй уровень будет представлен классами, наследующими отдельный класс гй. Каждый последующий класс будет также состоять из классов, наследующих выбранный класс. Вся цепочка классов, от базового до последнего выбранного класса будет являться критерием отбора страниц для отображения. То есть пользователю будут отображаться все страницы, относящиеся к выбранным им классам в виде списка заголовков страниц (с аннотациями).
При добавлении новой страницы на веб-сайт автор указывает теги (классы) для добавляемой страницы либо выбирая из существующих, либо вводя новые теги. Это означает, что образуется новое непустое пересечение множеств, соответствующих добавляемым классам. В связи с этим иерархия классов изменяется, что незамедлительно сказывается на изменении логической структуры сайта.
В таком случае навигация по гипертекстовой структуре осуществляется путем перехода по иерархии классов, и в каждый момент времени пользователю будут отображаться все страницы, относящиеся к вы-
бранным классам. Двигаясь последовательно по ориентированному графу, соответствующему структуре классов (и логической структуре сайта), пользователь уточняет свой запрос, оставляя в списке отображаемых страниц только наиболее подходящие, причем иерархическая структура классов динамически изменяется при добавлении или удалении страниц контента.
На данный момент ведется разработка прототипа веб-сайта, структура которого основана на рассмотренной в данной работе объектно-ориентированной модели. Стоит также отметить, что на основе рассмотренной модели веб-сайта могут быть разработаны и другие техники и механизмы оптимизации логической структуры.
ЛИТЕРАТУРА
1. Chavarriaga E. A model-driven approach to building modern Semantic Web-Based User Interfaces / E. Chavarriaga, J. Macias // Advances in Engineering Software. 2009. № 40. C. 1329−1334.
2. Beydoun G. Formal concept analysis for an e-learning semantic web / G. Beydoun // Expert Systems with Applications. 2009. № 36. C. 10 952−10 961.
3. Rotard M. Semantic lenses: Seamless augmentation of web pages with context information from implicit queries / M. Rotard, M. Giereth, T. Ertl // Computers & amp- Graphics. 2007. № 31. C. 361−369.
Сытник Александр Александрович —
доктор технических наук, профессор, заведующий кафедрой «Информационные системы и технологии» Саратовского государственного технического университета имени Гагарина Ю. А.
Aleksandr A. Sytnik —
Dr. Sc., Professor
Head: Department of Information Technologies and Systems
Gagarin Saratov State Technical University
Салин Владимир Сергеевич —
студент 5 курса факультета информатики и информационных технологий Саратовского государственного социально-экономического университета
Папшев Сергей Владимирович —
кандидат физико-математических наук, доцент кафедры «Информационные системы и технологии» Саратовского государственного технического университета имени Гагарина Ю. А.
Vladimir S. Salin —
Undergraduate Department of Informatics and Information Technologies Saratov State Socio-Economic University
Sergey V. Papshev —
PhD, Associate Professor
Department of Information Technologies and Systems Gagarin Saratov State Technical University
Статья поступила в редакцию 15. 11. 11, принята к опубликованию 01. 12. 11

ПоказатьСвернуть
Заполнить форму текущей работой