SnapGen++: революция в генерации AI-изображений на iPhone

  ·   чтения   ·     ·  
Snap Inc. представила компактную модель SnapGen++, которая создает качественные AI-изображения прямо на смартфоне за считанные секунды, превосходя по качеству более крупные серверные модели.
SnapGen++: революция в генерации AI-изображений на iPhone

Компания Snap Inc. совершила прорыв в мобильной генерации изображений, представив инновационную модель SnapGen++. Это компактный диффузионный трансформер, способный создавать изображения высокого разрешения прямо на смартфоне всего за 1.8 секунды.

Главное достижение SnapGen++ в том, что эта модель впервые успешно адаптировала архитектуру, которая раньше использовалась только в крупных серверных моделях, для работы на мобильных устройствах. При этом, несмотря на свой скромный размер всего в 0.4 миллиарда параметров, SnapGen++ превосходит по качеству изображений гораздо более крупных конкурентов, таких как Flux.1-dev и Stable Diffusion 3.5, которые содержат до 30 раз больше параметров.

Разработчики решили ключевую проблему диффузионных трансформеров – их огромные вычислительные требования. Они создали новый метод внимания, который значительно снижает нагрузку на процессор. Вместо обработки всего изображения сразу модель комбинирует общий обзор с детальной проработкой отдельных участков. Это позволило сократить время обработки с 2000 до менее чем 300 миллисекунд на каждый шаг.

Интересной особенностью стала система Elastic Training, позволяющая за одно обучение создать три варианта модели: Tiny с 0.3 млрд параметров для бюджетных Android-устройств, Small с 0.4 млрд для топовых смартфонов и Full с 1.6 млрд параметров для серверов.

В пользовательских тестах SnapGen++ получила более высокие оценки за реалистичность, качество изображений и соответствие текстовым запросам по сравнению с конкурентами. Это достижение особенно впечатляет, учитывая, что модель работает локально на устройстве.

Для Snap Inc. это не первый опыт в разработке мобильных AI-решений. Компания активно инвестирует в AI-функции для своего мессенджера Snapchat, включая собственного чатбота My AI и недавнее партнерство с Perplexity AI на сумму $400 миллионов.

Смотрите также

Логотип Telegram

Будьте в курсе новых нейросетей — подпишитесь на наш Telegram-канал!

Ежедневные обзоры свежих AI-инструментов, лайфхаки и инструкции прямо в вашем мессенджере.

AILibri – главная страница
Ctrl / ⌘+K