Трехрежимная модель стратегического метанаблюдения в мультиагентной адаптивной образовательной системе для распределения учебных материалов

Главное меню

Автор: Мельников Д.А., Петрова А.А.

21.05.2026 22:39

ТРЕХРЕЖИМНАЯ МОДЕЛЬ СТРАТЕГИЧЕСКОГО МЕТАНАБЛЮДЕНИЯ В МУЛЬТИАГЕНТНОЙ АДАПТИВНОЙ ОБРАЗОВАТЕЛЬНОЙ СИСТЕМЕ ДЛЯ РАСПРЕДЕЛЕНИЯ УЧЕБНЫХ МАТЕРИАЛОВ

Мельников Д.А., старший преподаватель,

Петрова А.А., ассистент,

ФГБОУ ВО «МИРЭА – Российский технологический университет», г. Москва, Россия

Аннотация. В данной статье рассматривается архитектура мультиагентной адаптивной образовательной системыдля задач распределения учебных материалов, в которой уровень метанаблюдения выполняет функции стратегического планирования.Предлагается трехрежимная модель функционирования метанаблюдателя, включающая режим мониторинга, режим координации и режим реструктуризации. Для каждого режима описываются соответствующие механизмы работы.

Ключевые слова:мультиагентная система, уровень метанаблюдения, адаптивное обучение, стратегическое планирование.

На сегодняшний деньрастет интерес к использованию мультиагентных систем в образовательной сфере [1, 2].В отличие от монолитных систем, мультиагентная архитектура позволяет распределить функции между специализированными агентами, каждый из которых решает свою локальную задачу – сбор данных, интерпретацию показателей, принятие решений.

В ранее предложенной системе [3] определена четырехуровневая архитектураcразделением оперативных и стратегических функций управления в задачах распределения учебных материалов. Кратко обобщая, основное положение системы состоит в разделении временных горизонтов работы уровней, где агенты Восприятия, Интерпретации и Адаптации функционируют в краткосрочном периоде (на одно задание или учебную сессию), тогда как метанаблюдение оценивает правильность подбора материалов в долгосрочном периоде (на модуль или целый курс)[3].

Архитектурные уровни системы представлены в таблице 1.

Таблица 1 – Архитектурные уровни системы[3]

Уровень	Функция	Контур управления
Восприятие	Сбор первичных данных	Тактический
Интерпретация	Нормализация данных в метрики	Тактический
Адаптация	Оперативное изменение контента	Тактический
Метанаблюдение	Анализ метрик и выработка стратегий	Стратегический

Meta-observation Layer управляет исключительно агрегированными показателями–индексом согласованности (показателем баланса между когнитивной нагрузкой и сложностью контента) и эффективностью адаптации (показателем изменения успеваемости после адаптационных воздействий) [3]. Стоит отметить, что метанаблюдениене может функционировать единообразно во всех ситуациях. В связи с этим представляется возможным выделить три различные ситуации, каждая из которых требует особого типа реагирования со стороны метанаблюдателя.

Первая ситуация соответствует нормальному функционированию системы. В этой ситуации агенты когнитивной нагрузки и распределения контента работают согласованно, и конфликты между их рекомендациями возникают редко и носят случайный, а не систематический характер.

Во второй ситуацииагенты начинают регулярно давать противоречивые рекомендации относительно необходимых адаптационных воздействий, поэтому частота конфликтов между агентами может превышать нижнее пороговое значение, свидетельствуя о систематическом, а не случайном характере расхождений. Эффективность адаптации может снижаться, несмотря на отсутствие явных внешних изменений.

Наконец, третья ситуация возникает тогда, когда предшествующие параметрические корректировкине дают ожидаемого эффекта. Эффективность адаптации продолжает оставаться низкой. Конфликты между агентами приобретают системный характер, поэтому корректировки оказываются недостаточными для нормализации работы системы.

Для решения перечисленных выше ситуаций предложен подход добавления трех режимов функционирования метанаблюдателя, включая мониторинг, координацию и реструктуризацию. Для детального понимания стоит рассмотреть каждый из них.

Режим мониторинга соответствует штатному состоянию работы системы, когда поведение агентов согласовано и эффективность адаптации находится в приемлемых пределах.В такомрежиме метанаблюдатель выполняет функции сбора, временного хранения и первичной обработки агрегированных метрик. При этом тактический уровень работает полностью автономно, принимая решения на основе предварительно заданных.

Целевой задачей режима координации является восстановление согласованной работы тактического уровня путем разрешения конфликтов между агентами. Такой процесс работы включает следующие этапы:

1. Метанаблюдатель определяет, какой именно параметр является источником конфликта между агентами. Например, систематическое занижение веса агента когнитивной нагрузки может приводить к тому, что его рекомендации недостаточно учитываются при принятии решений.

2. Вычисляются новые значения порогов и весов, которые должны компенсировать выявленное разногласие. Расчет может основываться на сравнении текущих показателей с эталонными или на анализе предыдущей статистики.

3. Сформированные новые значения параметров передаются на уровень Адаптации для замены текущих.После передачи корректировок метанаблюдатель продолжает отслеживать индекс согласованности и эффективность адаптации, оценивая результативность произведенных изменений.

Стоит отметить, что режим координации не замещает тактический уровень, который продолжает самостоятельно принимать оперативные решения, но делает это в условиях измененных весов и порогов.

Последний режим реструктуризации в системе предполагает пересмотр самой структуры принятия решений.Его активация означает, что система столкнулась с проблемами, неразрешимыми в рамках текущей архитектуры принятия решений. Выделяются следующий механизм работы этого режима:

1. Метанаблюдатель анализирует накопленную статистику за длительный период (модуль или курс) для выявления устойчивых паттернов несогласованности агентов. На этом этапе определяется, какой именно компонент системы является источником проблем. Это могут быть неверно заданные правила адаптации, некорректная нормализация данных на уровне Интерпретации или сбор нерелевантных признаков на уровне Восприятия.

2. На основе проведенного анализа метанаблюдатель генерирует одну или несколько альтернативных конфигураций системы. Это может включать изменение правил принятия решений, переопределение метрик, изменение способа агрегации рекомендаций агентов.

3. Из сгенерированных альтернатив выбирается стратегия, котораяс наибольшей вероятностью приведет к нормализации показателей. Такая выбранная конфигурация активируется на уровне адаптации.В случае отсутствия улучшения возможен повторный цикл реструктуризации.

Важно подчеркнуть, что во всех трех режимах метанаблюдение сохраняет цель стратегического планирования.В режиме мониторинга стратегическая функция проявляется в долгосрочном накоплении данных, формирующих информационную базу для будущих решений.В режиме координации стратегическая функция реализуется через текущее управление тактическими параметрами, а в режиме реструктуризации метанаблюдательполностью нацелен на стратегию принятия критических решений.

Литература

1. Расулова Н.Ю. Мультиагентный подход в создании адаптивных интеллектуальных обучающих систем //Экономика и социум. - 2021. - №. 2-2 (81). - С. 524-531.

2. Viswanathan N., Meacham S., Adedoyin F.F. Enhancement of online education system by using a multi-agent approach //Computers and Education: Artificial Intelligence. – 2022. – Т. 3. – С. 100057.

3. Петрова, А. А. Исследование взаимодействия агентов в адаптивной образовательной системе в задачах распределения учебных материалов с применением метауровневого агента-наблюдателя / А. А. Петрова, Д. А. Мельников // Материалы докладов всероссийской научно-практической конференции им. Я.В. Мильмана : Материалы конференции, Москва, 18 декабря 2025 года. Часть 2. – Москва: Российский государственный университет им. А.Н. Косыгина (Технологии. Дизайн. Искусство), 2026. – С. 447-451. – EDN HWKMOI.