|
ПОДХОД К СЕМАНТИЧЕСКОМУ АНАЛИЗУ
ПОИСКОВЫХ ЗАПРОСОВ ДЛЯ ОПТИМИЗАЦИИ
СТРУКТУРЫ ИНТЕРНЕТ-ПРИЛОЖЕНИЙ
Пихтовников С.В., к.х.м., доцент,
Файзрахманова К.Э., к.т.н., доцент,
Бочкова К.В., магистрант
УУНиТ, г.
Уфа, Россия
Аннотация.
В статье
рассматривается подход к семантическому анализу поисковых запросов,
направленный на повышение точности определения пользовательского намерения.
Предлагаемый подход основан на использовании семантического анализа и словарной
модели предметной области. Особое внимание уделяется проблеме неоднозначности
поисковых запросов. Результаты применения подхода позволяют повысить точность
группировки запросов и улучшить структуру интернет-приложений.
Ключевые
слова: семантический
анализ, поисковые запросы, словарная модель, пользовательское намерение,
поисковая оптимизация.
В условиях стремительного
роста объемов информации, увеличения количества поисковых запросов и усложнения
структуры пользовательского поведения в интернете, требуются более точные
методы семантического анализа и кластеризации поисковых запросов с целью разработки
и оптимизации структуры интернет-приложений и повышения эффективности
поискового продвижения. Целью работы
является повышение точности определения пользовательских намерений и качества
формирования тематических групп запросов (кластеров) на основании методов
семантического анализа и использования словарной модели предметной
области. Основная задача заключается в выделении групп запросов с единым
смысловым содержанием, а также в разделении запросов, отражающих различные
цели поиска пользователей. Это позволяет формировать кластеры поисковых
запросов, объединенные общим смысловым содержанием и пользовательским
намерением.
1. Проблема неоднозначности поисковых
запросов
На основе результатов
семантического анализа формируются кластеры поисковых запросов – группы
запросов, объединенных общим смысловым содержанием и пользовательским
намерением. Семантическая кластеризация
необходима для распределения пользовательских запросов по разделам и страницам
интернет-приложения. При создании и
оптимизации структуры интернет-приложений необходимо учитывать, что в процессе
формирования запросов, пользователь может использовать различные лексико-грамматические
конструкции, разный порядок слов, но такие запросы будут иметь единое смысловое
содержание и должны быть привязаны к определенному разделу или странице
приложения. Но если объединить различные
по тематике, цели и намерениям запросы, в которых используются только схожие
ключевые слова, фразы, словосочетания или выражения в рамках одной страницы, то
это приведет к снижению релевантности контента.
Некорректное объединение
запросов различной смысловой направленности или разбиение близких по смыслу
запросов существенно снизит место интернет-приложения в поисковой выдаче,
значительно ухудшит опыт пользовательского взаимодействия. Использование
словарной модели предметной области повысит точность определения
пользовательских целей (информационных, транзакционных, коммерческих,
навигационных, общих), позволит сформировать кластеры поисковых запросов, логичную,
понятную и удобную для пользователей структуру приложения. Работа с данными
пользовательских запросов включает несколько этапов.
Формирование семантического ядра. На данном этапе пользователи
загружают данные в поисковую систему. Данные могут быть представлены
небольшими фразами, словосочетаниями (небольшие запросы), а также предложениями
и значительными массивами данных (длинные запросы). При этом каждая группа
будет соответствовать определенной пользовательской цели, намерению и разделу
интернет-приложения. Пример поисковых
запросов: как выбрать ноутбук!!!, выбрать ноутбук каталог, купить ноутбук для
учебы, купить ноутбук в интернете, где купить ноутбук, стоимость ноутбука?, цена
ноутбука?, ОТЗЫВЫ ноутбук.
Предварительная обработка запросов и приведение к их единому формату для повышения качества последующего анализа. Для
этого необходимо удалить неподходящие ключевые слова, полностью дублирующие
варианты, узкоспециализированные выражения, лишнюю пунктуацию, специальные
символы, устранить варианты написания, орфографические ошибки и опечатки, нормализовать
слова до базовых форм. Пример нормализации: купить ноутбук, цена ноутбук, выбрать
ноутбук, отзыв ноутбук.
Структурирование запросов. Каждый запрос разбивается на смысловые элементы, для
которых определяется их функциональная роль (действия, объекты, характеристики
и другие значимые компоненты). Пример разбиения запроса «купить ноутбук»:
действие: купить, объект: ноутбук; запроса «цена ноутбука»: характеристика:
цена, объект: ноутбук.
Формирование структурированного представления. На основе полученных данных
формируется формализованное представление запроса, которое используется для
дальнейшего семантического анализа. Пример представления: купить + ноутбук, цена + ноутбук, отзыв
+ ноутбук.
Семантический анализ с использованием словарной модели. Использование словарной модели позволяет снизить влияние
неоднозначность и вариативность формулировок. Пример интерпретации через
словарь: «купить ноутбук» – коммерческая направленность, «цена ноутбука» – коммерческая
направленность, «как выбрать ноутбук» – информационная направленность.
Формирование кластеров. Принцип формирования кластеров следующий. Все запросы
в кластере должны соотносится друг с другом, один кластер (одна группа запросов)
– один раздел или страница интернет-приложения. Семантический кластер
представляет группу запросов, у которых была выявлена схожая смысловая
направленность. Формирование кластеров происходит по нескольким признакам: по
намерению пользователя (например, «заказать» «купить»), а также по смысловой
схожести (например, «машина», «автомобиль»). А запросы с различной смысловой
направленностью необходимо разделить на кластеры, даже если они имеют общие
ключевые слова.
Пример формирования
кластеров: для кластера «покупка»: купить для кластера «покупка»: ноутбук,
стоимость ноутбука, купить дорогой ноутбук, целевой направленностью будет
интернет-магазин, а для кластера «информация»: как выбрать ноутбук, какой
ноутбук лучше, обзор ноутбуков, целевой направленностью будет блог или соответствующая интернет-статья.
Проверка результатов и подтверждение достоверности учета всех особенностей
бизнес-логики экспертом предметной области. Эксперт анализирует сформированные
семантические кластеры, при необходимости выполняет их объединение или
разделение, корректирует привязку кластеров к разделам или страницам
интернет-приложения, а затем подтверждает структуру интернет-приложения. Пример
объединения результатов в единый кластер: «цена ноутбука» и «купить ноутбук», пример
разбиения результатов в отдельный кластер «ремонт ноутбука».
3. Семантический анализ с
использованием словарной модели.
Словарная модель представляет собой предметно-ориентированный набор
семантических единиц, включающий термины, сущности и устойчивые языковые
конструкции, характерные для рассматриваемой тематики [1]. Формируется же словарная
модель на основании анализа конкретной предметной области. Для более точного
определения смысловой направленности, при формировании словарной модели
необходимо учитывать устойчивые словосочетания («сущие копейки») и многословные
языковые конструкции («доступный по цене», «по цене чашки кофе»). Для повышения точности определения тематической
направленности, в процессе обработки новых пользовательских запросов также
осуществляется пополнение базы знаний.
Заключение
При разработке и оптимизации структуры многостраничного
интернет-приложения, использование словарной модели позволит более точно
определить смысловую направленность (информационная, транзакционная,
навигационная, общая и т.п.) пользовательских запросов, оптимизировать каждый
раздел или страницу интернет-приложения под конкретный запрос пользователя,
повысить доверие, удержать внимание пользователей и подвести пользователя к конкретному
действию.
Литература
1. Ашманов И. С.
Оптимизация и продвижение в поисковых системах / И. С. Ашманов, А. Л. Калинин,
О. В. Юдина. — 4-е изд. — Санкт-Петербург : Питер, 2019. — 512 с. — ISBN
978-5-4461-1161-9.
|