Главное меню

Подход к семантическому анализу поисковых запросов для оптимизации структуры интернет-приложений PDF Печать E-mail
Автор: Пихтовников С.В., Файзрахманова К.Э., Бочкова К.В.   
21.05.2026 12:08

ПОДХОД К СЕМАНТИЧЕСКОМУ АНАЛИЗУ

ПОИСКОВЫХ ЗАПРОСОВ ДЛЯ ОПТИМИЗАЦИИ

СТРУКТУРЫ ИНТЕРНЕТ-ПРИЛОЖЕНИЙ


Пихтовников С.В., к.х.м., доцент,

Файзрахманова К.Э., к.т.н., доцент,

Бочкова К.В., магистрант

УУНиТ, г. Уфа, Россия


Аннотация. В статье рассматривается подход к семантическому анализу поисковых запросов, направленный на повышение точности определения пользовательского намерения. Предлагаемый подход основан на использовании семантического анализа и словарной модели предметной области. Особое внимание уделяется проблеме неоднозначности поисковых запросов. Результаты применения подхода позволяют повысить точность группировки запросов и улучшить структуру интернет-приложений.

Ключевые слова: семантический анализ, поисковые запросы, словарная модель, пользовательское намерение, поисковая оптимизация.


В условиях стремительного роста объемов информации, увеличения количества поисковых запросов и усложнения структуры пользовательского поведения в интернете, требуются более точные методы семантического анализа и кластеризации поисковых запросов с целью разработки и оптимизации структуры интернет-приложений и повышения эффективности поискового продвижения.  Целью работы является повышение точности определения пользовательских намерений и качества формирования тематических групп запросов (кластеров) на основании методов семантического анализа и использования словарной модели предметной области. Основная задача заключается в выделении групп запросов с единым смысловым содержанием, а также в разделении запросов, отражающих различные цели поиска пользователей. Это позволяет формировать кластеры поисковых запросов, объединенные общим смысловым содержанием и пользовательским намерением.


1. Проблема неоднозначности поисковых запросов

На основе результатов семантического анализа формируются кластеры поисковых запросов – группы запросов, объединенных общим смысловым содержанием и пользовательским намерением.  Семантическая кластеризация необходима для распределения пользовательских запросов по разделам и страницам интернет-приложения.  При создании и оптимизации структуры интернет-приложений необходимо учитывать, что в процессе формирования запросов, пользователь может использовать различные лексико-грамматические конструкции, разный порядок слов, но такие запросы будут иметь единое смысловое содержание и должны быть привязаны к определенному разделу или странице приложения.  Но если объединить различные по тематике, цели и намерениям запросы, в которых используются только схожие ключевые слова, фразы, словосочетания или выражения в рамках одной страницы, то это приведет к снижению релевантности контента.


Некорректное объединение запросов различной смысловой направленности или разбиение близких по смыслу запросов существенно снизит место интернет-приложения в поисковой выдаче, значительно ухудшит опыт пользовательского взаимодействия. Использование словарной модели предметной области повысит точность определения пользовательских целей (информационных, транзакционных, коммерческих, навигационных, общих), позволит сформировать кластеры поисковых запросов, логичную, понятную и удобную для пользователей структуру приложения. Работа с данными пользовательских запросов включает несколько этапов.


Формирование семантического ядра. На данном этапе пользователи загружают данные в поисковую систему. Данные могут быть представлены небольшими фразами, словосочетаниями (небольшие запросы), а также предложениями и значительными массивами данных (длинные запросы). При этом каждая группа будет соответствовать определенной пользовательской цели, намерению и разделу интернет-приложения.  Пример поисковых запросов: как выбрать ноутбук!!!, выбрать ноутбук каталог, купить ноутбук для учебы, купить ноутбук в интернете, где купить ноутбук, стоимость ноутбука?, цена ноутбука?, ОТЗЫВЫ ноутбук.


Предварительная обработка запросов и приведение к их единому формату для повышения качества последующего анализа. Для этого необходимо удалить неподходящие ключевые слова, полностью дублирующие варианты, узкоспециализированные выражения, лишнюю пунктуацию, специальные символы, устранить варианты написания, орфографические ошибки и опечатки, нормализовать слова до базовых форм. Пример нормализации: купить ноутбук, цена ноутбук, выбрать ноутбук, отзыв ноутбук.


Структурирование запросов. Каждый запрос разбивается на смысловые элементы, для которых определяется их функциональная роль (действия, объекты, характеристики и другие значимые компоненты). Пример разбиения запроса «купить ноутбук»: действие: купить, объект: ноутбук; запроса «цена ноутбука»: характеристика: цена, объект: ноутбук.


Формирование структурированного представления. На основе полученных данных формируется формализованное представление запроса, которое используется для дальнейшего семантического анализа. Пример представления: купить + ноутбук, цена + ноутбук, отзыв + ноутбук.


Семантический анализ с использованием словарной модели.  Использование словарной модели позволяет снизить влияние неоднозначность и вариативность формулировок. Пример интерпретации через словарь: «купить ноутбук» – коммерческая направленность, «цена ноутбука» – коммерческая направленность, «как выбрать ноутбук» – информационная направленность.


Формирование кластеров. Принцип формирования кластеров следующий. Все запросы в кластере должны соотносится друг с другом, один кластер (одна группа запросов) – один раздел или страница интернет-приложения. Семантический кластер представляет группу запросов, у которых была выявлена схожая смысловая направленность. Формирование кластеров происходит по нескольким признакам: по намерению пользователя (например, «заказать» «купить»), а также по смысловой схожести (например, «машина», «автомобиль»). А запросы с различной смысловой направленностью необходимо разделить на кластеры, даже если они имеют общие ключевые слова.


Пример формирования кластеров: для кластера «покупка»: купить для кластера «покупка»: ноутбук, стоимость ноутбука, купить дорогой ноутбук, целевой направленностью будет интернет-магазин, а для кластера «информация»: как выбрать ноутбук, какой ноутбук лучше, обзор ноутбуков, целевой направленностью будет блог или соответствующая интернет-статья.


Проверка результатов и подтверждение достоверности учета всех особенностей бизнес-логики экспертом предметной области. Эксперт анализирует сформированные семантические кластеры, при необходимости выполняет их объединение или разделение, корректирует привязку кластеров к разделам или страницам интернет-приложения, а затем подтверждает структуру интернет-приложения. Пример объединения результатов в единый кластер: «цена ноутбука» и «купить ноутбук», пример разбиения результатов в отдельный кластер «ремонт ноутбука».

 

3. Семантический анализ с использованием словарной модели.

Словарная модель представляет собой предметно-ориентированный набор семантических единиц, включающий термины, сущности и устойчивые языковые конструкции, характерные для рассматриваемой тематики [1]. Формируется же словарная модель на основании анализа конкретной предметной области. Для более точного определения смысловой направленности, при формировании словарной модели необходимо учитывать устойчивые словосочетания («сущие копейки») и многословные языковые конструкции («доступный по цене», «по цене чашки кофе»).  Для повышения точности определения тематической направленности, в процессе обработки новых пользовательских запросов также осуществляется пополнение базы знаний.

Заключение

При разработке и оптимизации структуры многостраничного интернет-приложения, использование словарной модели позволит более точно определить смысловую направленность (информационная, транзакционная, навигационная, общая и т.п.) пользовательских запросов, оптимизировать каждый раздел или страницу интернет-приложения под конкретный запрос пользователя, повысить доверие, удержать внимание пользователей и подвести пользователя к конкретному действию.

Литература

1. Ашманов И. С. Оптимизация и продвижение в поисковых системах / И. С. Ашманов, А. Л. Калинин, О. В. Юдина. — 4-е изд. — Санкт-Петербург : Питер, 2019. — 512 с. — ISBN 978-5-4461-1161-9.


 
Яндекс.Метрика