Пока гиганты индустрии выкатывают модели весом в десятки гигабайт, китайские разработчики пошли другим путём. LongCat Image - это лёгкая опенсорсная модель, которая умещается в 6B параметров и при этом справляется с редактированием картинок. Никаких многочасовых загрузок и требований к железу уровня «продай почку».
Что умеет LongCat Image
Сервис работает в двух режимах: генерация изображений с нуля и редактирование готовых картинок. Для второго варианта существует специальная версия EDIT, которая заточена именно под правки. Это удобно, потому что не нужно плясать с бубном и дообучать базовую модель самостоятельно.
В плане генерации особо радоваться нечему - результаты среднего качества, ничего выдающегося. Зато редактирование показывает себя неплохо. Модель понимает запросы, вносит изменения точечно и работает без встроенной цензуры, что для опенсорсного решения редкость.
Почему стоит попробовать лёгкую модель
Компактность LongCat Image - это не только про экономию места на диске. Меньший вес означает быстрый запуск, возможность работы на среднем железе и отсутствие необходимости арендовать облачные мощности. Пока все ждут релиза тяжёлых редакторов вроде Qwen Edit или Z-Image Edit, можно спокойно тестировать готовое решение.
Опенсорсный код даёт свободу: можно покрутить параметры, подстроить под свои задачи или интегрировать в собственные проекты. Для экспериментов с редактированием изображений это вполне рабочий вариант, особенно если не хочется связываться с громоздкими коммерческими платформами или ждать доступа к закрытым бетам.