Сбер выкатил всю линейку GigaChat в опенсорс с MIT-лицензией - теперь можно крутить хоть в коммерции, хоть для души. Главная фишка здесь не в том, что «ещё одна модель», а в том, что это первая по-настоящему крупная русскоязычная генеративка, которую можно развернуть у себя и не париться насчёт ограничений.
Что умеет GigaChat 3 Ultra-Preview
Флагман линейки тянет на 702 миллиарда параметров, но в работе активны только 36 млрд - такая архитектура позволяет экономить ресурсы без потери качества. Контекстное окно в 128 тысяч токенов даёт возможность скармливать модели целые документы или длинные диалоги, и она не забудет, о чём речь шла в начале.
В бенчмарках на русском языке Ultra-Preview обошла DeepSeek V3.1 - это значит, что для задач типа генерации текстов, анализа документов или работы с кодом на русском она подходит лучше многих зарубежных аналогов. Если вы пилите продукт для русскоязычной аудитории, это реально удобно: не нужно костылить промпты под англоязычные модели.
Lightning для тех, кому нужно быстро
Облегчённая версия создана для ситуаций, когда важнее скорость, чем глубина анализа. По качеству она сравнима с Qwen3-4B, но отвечает быстрее - почти как Qwen3-1.7B. Подойдёт для чат-ботов, саппорта или любых задач, где задержка в пару секунд критична.
GigaAM-v3 и работа с аудио
Аудиомодель в составе показывает на 50% меньше ошибок распознавания речи по сравнению с Whisper-large-v3. Это особенно заметно на русском: акценты, сленг, нестандартные обороты - всё это GigaAM-v3 обрабатывает точнее. Если делаете транскрибацию подкастов, записей звонков или голосовых заметок, эта штука сэкономит часы на ручной правке.
Опенсорс и коммерческое использование
MIT-лицензия снимает почти все ограничения: можно встраивать модели в свои продукты, продавать доступ к ним, модифицировать архитектуру. Код и веса лежат на GitHub, документация там же. Для разработчиков это шанс не зависеть от API и не платить за каждый запрос - поднял модель на своих серверах и работаешь.
Три модели в одной связке закрывают разные сценарии: от тяжёлого анализа до быстрых ответов и обработки звука. Если раньше для русскоязычных проектов приходилось выбирать между качеством и доступностью, то теперь можно взять и то, и другое.