Классификация пользователей форумов тематических ресурсов для разработки алгоритмов интеллектуальной фильтрации контента

Тип работы:
Статья
Предмет:
Программирование


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Классификация пользователей форумов тематических ресурсов для разработки алгоритмов интеллектуальной фильтрации контента

Егоров Е.Ю. ,

Сибирский федеральный университет, г. Железногорск, Россия

Современный интернет концентрирует множество всевозможных ресурсов и привлекает огромную аудиторию. Однако качество публикуемой информации имеют крайне низкое качество. Особенно остро данная проблема стоит при динамическом формировании и обсуждении конвента (например, ветки форумов). Зачастую, в соответствующих разделах тематических информационных ресурсов аудиторию можно разделить на тех, кто конструктивно ведёт диалог (находится в тематике ресурса), и тех, кто вносит дискомфорт в обсуждение профильного сообщества. В связи с тем, что администратор не может справиться с большим количеством поступающей информации, рационально ввести в возможности ядра ресурса интеллектуальную функцию классификации пользователей, которая бы разделяла их по интересам и по характеру влияния на качество тематического ресурса.

Применение классических методов пользовательского рейтинга не представляется эффективным. В работах Сухинина Д. И. [1] была сделана попытка комплексно проанализировать поведение пользователя при работе с тематическими ресурсами. Исходя из этого, можно говорить о необходимости ввода гибкой классификации пользователей. Это обусловлено в первую очередь тем, что в обсуждение темы может включиться не только разделяющий мнение авторов материала, но и имеющий противоположную точку зрения (как профессиональную, так и популистско-обывательскую). Очевидно, что в различных ситуациях ядру тематического ресурса необходимо будет вести себя по разносу. Введём классы пользователей:

Гость — не авторизованный пользователь, классифицировать которого система не имеет возможности и его права максимально ограничены.

Новичёк — недавно зарегистрированный пользователь ресурса, имеющего малую стаитсикуработы с материалом сайта и обладающего ограниченными возможностями.

Случайный пользователь -зарегистрированный в системе пользователь, проявивший активность на начальном этапе знакомства с ресурсом и потом потерявший к нему интерес.

Исследователь — это такой пользователь, который сохраняет свою активность в обращении к материалам ресурса и формировании контента в определённых информационных секторах тематического ресурса.

Спамер — активный пользователь, интенсивно рассылающий сообщения не по тематике ветки форума.

Эксперт-критик — пользователь, активно критикующий собеседников ветки форума, опираясь на здравый смысл и адекватные аргументы (без перехода на личности и без попыток унижения собеседника).

Провокатор — активный пользователь, провоцирующий своими сообщениями отдельную группу участников ветки форума обсуждения на резко негативную оценку.

Завсегдатай — активный пользователь, разделяющий идеологию тематического ресурса и обладающий дополнительными правами.

Агрессивный обыватель (вредитель) — активный пользователь, противостоящий идеологии тематического ресурса при опоре на популистско-обывательскую позицию.

Эксперт-единомышленник — активный пользователь, обладающий знаниями и опытом по тематике ресурса и разделяющий его идеологию.

Переходы между ролями осуществляются в процессе уточнения профиля пользователя системой, сопровождая их эволюцией прав от начальной конфигурации (нейтральной для новичка) в положительную или отрицательную стороны. В таблице представлена начальная параметрическая модель, характеризующая отдельные классы пользователей.

Таблица. Параметризация классов пользователей

Группа

Мнение пользователей

-100%|+100%

Кол-во публикаций

Кол-во проведённого времени

Гость

-

-

-

Новичок

0

0−10

Больше 2 дней

Случайный пользователь

Положительно

0

Больше 5 дней

Исследователь

Положительно

0−1

Больше 7 дней

Спамер

Меньше (-5%) — (-10%)

0

Больше 7 дней

Эксперт-критик

Больше 5−10%

0−5

Больше 1 месяца

Завсегдатай

Больше 25%

Больше 5

Больше 2 месяцев

Эксперт-единомышленник

Больше 75%

Больше 10

Более полугода

Провокатор

Меньше (-10%) — (-25%)

Не учитывается

Не учитывается

Вредитель

Меньше -50%

0

Меньше 10 часов

Тогда можно говорить о системе, которой необходимо принимать решения не только на базе однозначных показателей из таблицы, но и после анализа их поведения. В этой ситуации необходимо реализовать интеллектуальный алгоритм фильтрации контента, учитывая следующие допущения:

— часть координирующих поведение сообщества сигналов поступает от модераторов или экспертов-единомышленников;

— мнения провокаторов, вредителей, спамеров и новичков игнорируются при определении рейтинга обсуждаемого материала или других пользователей; интеллектуальная фильтрация контент пользователь

— идеология тематического ресурса ориентирована на качество контента и объективность его оценки.

Тогда параметрами для принятия интеллектуальным фильтром (экспертной системой) решения будут следующие:

— консолидированное мнение «полезных» пользователей о конкретном члене тематического сообщества относительно отдельной в ветке форума;

— обобщённая статистика посещаемости ресурса (временной, частотный, деятельностный аспекты);

— объём публикованного материала (документы, статьи, презентации) и его качество (оценка премодерации);

— оценка семантического «вектора» высказываний, относительно идеологии тематического ресурса (включая семантический анализ высказываний на форуме).

Предложенная группировка и параметризация пользователей позволит повысить качество фильтрации нежелательного контента. Она способствует выработке соответствующих мер ядром тематического ресурса по явному (предупредления, ограничение прав, блокировака) или косвенному [2] противодействию злонамеренным попыткам формирования неадекватного контента как в рамках форума, так и всего ресурса.

Литература

1. Сухинин Д. И., Углев В. А. Проблематика самоорганизации профильных интернет сообществ // Измерение, контроль, информатизация: Материалы IX Международной конференции. — Барнаул: АлтГТУ, 2008. — С. 233−236.

2. Стюгин М. А., Беда И. А. Алгоритм построения защищённых от информационных исследования систем // Системный анализ и информационные технологии: Материалы V Международной конференции. В 2 т. Т.2 С. 419−423.

ПоказатьСвернуть
Заполнить форму текущей работой