Главное меню

Применение диффузионных моделей с vision transformer для генерации высококачественных изображений PDF Печать E-mail
Автор: Гольцева И.А.Арабов М.К.   
08.12.2024 15:50


ПРИМЕНЕНИЕ ДИФФУЗИОННЫХ МОДЕЛЕЙ С VISION TRANSFORMER ДЛЯ ГЕНЕРАЦИИ ВЫСОКОКАЧЕСТВЕННЫХ ИЗОБРАЖЕНИЙ


Гольцева И.А., магистрант, 2 курс, гр. 09-305,

институт вычислительной математики и информационных технологий,

Казанский (Приволжский) федеральный университет, Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript

Арабов М.К., к.ф.-м.н., старший преподаватель кафедры анализа данных и технологий программирования,

Казанский (Приволжский) федеральный университет, Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript


Аннотация. В последние годы одним из перспективных направлений является интеграция диффузионных моделей с архитектурами Vision Transformer (ViT), что позволяет эффективно учитывать глобальные зависимости в изображениях и значительно улучшать качество генерируемых данных. В данной статье рассматривается применение диффузионных моделей в сочетании с ViT для решения задач генерации высококачественных изображений. Мы анализируем ключевые особенности этих моделей, их преимущества и недостатки, а также успешные примеры применения в различных областях. Также представлен обзор существующих исследований, демонстрирующих возможности и перспективы синергии этих подходов.

Ключевые слова: диффузионные модели, Vision Transformer, генерация изображений, глубокое обучение, компьютерное зрение.


...

полный текст во вложении

Обновлено 08.12.2024 15:58
 
Яндекс.Метрика