Компания Snap Inc. совершила прорыв в мобильной генерации изображений, представив инновационную модель SnapGen++. Это компактный диффузионный трансформер, способный создавать изображения высокого разрешения прямо на смартфоне всего за 1.8 секунды.
Главное достижение SnapGen++ в том, что эта модель впервые успешно адаптировала архитектуру, которая раньше использовалась только в крупных серверных моделях, для работы на мобильных устройствах. При этом, несмотря на свой скромный размер всего в 0.4 миллиарда параметров, SnapGen++ превосходит по качеству изображений гораздо более крупных конкурентов, таких как Flux.1-dev и Stable Diffusion 3.5, которые содержат до 30 раз больше параметров.
Разработчики решили ключевую проблему диффузионных трансформеров – их огромные вычислительные требования. Они создали новый метод внимания, который значительно снижает нагрузку на процессор. Вместо обработки всего изображения сразу модель комбинирует общий обзор с детальной проработкой отдельных участков. Это позволило сократить время обработки с 2000 до менее чем 300 миллисекунд на каждый шаг.

Интересной особенностью стала система Elastic Training, позволяющая за одно обучение создать три варианта модели: Tiny с 0.3 млрд параметров для бюджетных Android-устройств, Small с 0.4 млрд для топовых смартфонов и Full с 1.6 млрд параметров для серверов.
В пользовательских тестах SnapGen++ получила более высокие оценки за реалистичность, качество изображений и соответствие текстовым запросам по сравнению с конкурентами. Это достижение особенно впечатляет, учитывая, что модель работает локально на устройстве.

Для Snap Inc. это не первый опыт в разработке мобильных AI-решений. Компания активно инвестирует в AI-функции для своего мессенджера Snapchat, включая собственного чатбота My AI и недавнее партнерство с Perplexity AI на сумму $400 миллионов.
Смотрите также
-
ИИ-фото на резюме: в Южной Корее начался хаос на рынке труда
-
Luma выпустила UNI-1 - модель, которая понимает и рисует одновременно
-
Ностальгия по пикселям: как превратить битвы из Game Boy в детализированные картины с помощью ИИ
-
Google выкатил Nano Banana 2 - теперь ИИ рисует еще реалистичнее
-
Новый детектор ИИ-изображений ищет фейки в базе разоблачённых картинок
-
Сравнение двух AI-генераторов картинок - победитель удивит
-
Голливуд нанимает "охотников за головами" для борьбы с ИИ-пиратами
-
Даже лучшие ИИ-модели не могут точно распознавать объекты на изображениях
-
Британский музей удалил AI-изображения после критики