Применение диффузионных моделей с vision transformer для генерации высококачественных изображений

Главное меню

Автор: Гольцева И.А.Арабов М.К.

08.12.2024 15:50

ПРИМЕНЕНИЕ ДИФФУЗИОННЫХ МОДЕЛЕЙ С VISION TRANSFORMER ДЛЯ ГЕНЕРАЦИИ ВЫСОКОКАЧЕСТВЕННЫХ ИЗОБРАЖЕНИЙ

Гольцева И.А., магистрант, 2 курс, гр. 09-305,

институт вычислительной математики и информационных технологий,

Казанский (Приволжский) федеральный университет, Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript

Арабов М.К., к.ф.-м.н., старший преподаватель кафедры анализа данных и технологий программирования,

Аннотация. В последние годы одним из перспективных направлений является интеграция диффузионных моделей с архитектурами Vision Transformer (ViT), что позволяет эффективно учитывать глобальные зависимости в изображениях и значительно улучшать качество генерируемых данных. В данной статье рассматривается применение диффузионных моделей в сочетании с ViT для решения задач генерации высококачественных изображений. Мы анализируем ключевые особенности этих моделей, их преимущества и недостатки, а также успешные примеры применения в различных областях. Также представлен обзор существующих исследований, демонстрирующих возможности и перспективы синергии этих подходов.

Ключевые слова: диффузионные модели, Vision Transformer, генерация изображений, глубокое обучение, компьютерное зрение.

...

полный текст во вложении

Вложения:
Гольцева_Арабов__статья_Применение диффузионных моделей с vision transformer.pdf	[ ]	244 Kb

Обновлено 08.12.2024 15:58