Применение диффузионных моделей с vision transformer для генерации высококачественных изображений |
Автор: Гольцева И.А.Арабов М.К. |
08.12.2024 15:50 |
ПРИМЕНЕНИЕ
ДИФФУЗИОННЫХ МОДЕЛЕЙ С VISION TRANSFORMER ДЛЯ ГЕНЕРАЦИИ ВЫСОКОКАЧЕСТВЕННЫХ
ИЗОБРАЖЕНИЙ Гольцева И.А., магистрант, 2 курс, гр. 09-305, институт вычислительной математики и информационных технологий, Казанский (Приволжский) федеральный университет,
Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Арабов М.К., к.ф.-м.н., старший преподаватель кафедры анализа данных и технологий программирования, Казанский (Приволжский) федеральный университет,
Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript
Аннотация.
В последние годы одним из перспективных направлений является интеграция
диффузионных моделей с архитектурами Vision Transformer (ViT), что позволяет
эффективно учитывать глобальные зависимости в изображениях и значительно
улучшать качество генерируемых данных. В данной статье рассматривается
применение диффузионных моделей в сочетании с ViT для решения задач генерации
высококачественных изображений. Мы анализируем ключевые особенности этих
моделей, их преимущества и недостатки, а также успешные примеры применения в
различных областях. Также представлен обзор существующих исследований,
демонстрирующих возможности и перспективы синергии этих подходов. Ключевые
слова: диффузионные модели, Vision Transformer, генерация
изображений, глубокое обучение, компьютерное зрение. ... полный текст во вложении |
Обновлено 08.12.2024 15:58 |