Mellum2 от JetBrains: быстрая модель для ИИ-систем
JetBrains открыла исходный код Mellum2 — 12B модели с MoE-архитектурой для роутинга, RAG, агентов и локального деплоя в инженерных системах.
JetBrains выложили в открытый доступ Mellum2 - 12-миллиардную языковую модель, заточенную под реальные производственные задачи. Apache 2.0, никаких ограничений. Модель обучена с нуля и ориентирована на три вещи, о которых все говорят, но мало кто решает нормально: задержка, пропускная способность и стоимость инференса.
Начиналось всё с автодополнения кода в IDE, но теперь Mellum2 понимает и естественный язык. Позиционируется как рабочий инструмент для роутинга запросов, суммаризации, RAG-пайплайнов и промежуточных шагов в агентных системах.

Архитектура, которая объясняет скорость
Внутри - Mixture of Experts. Формально 12B параметров, но на каждый токен активируется только 2.5B. Это и даёт скорость без потери качества. Модель не мультимодальная - только текст и код, и это осознанное решение: меньше лишнего, выше специализация.
По бенчмаркам (код, математика, рассуждения) Mellum2 держится на уровне аналогов, при этом инференс быстрее в два раза. Для продакшена это не мелочь.
Зачем это нужно на практике
Сценарии использования вполне конкретные: анализировать входящие запросы и направлять их к нужной модели, строить RAG-пайплайны с быстрой суммаризацией контекста, разбивать агентные цепочки на шаги и закрывать повторяющиеся задачи без обращения к огромным дорогим моделям. Или просто запускать локально - данные никуда не уходят.
За этим стоит идея, которую в JetBrains называют "focal model philosophy": не каждая задача требует самой большой модели. Многие шаги в современных ИИ-системах повторяются, чувствительны к задержкам и встречаются тысячи раз в день. Для них нужен быстрый, управляемый, дешёвый компонент - а не фронтирная модель по полной цене.

Разумный подход, если честно. Хайп вокруг "одной модели на все случаи" немного поутих, и индустрия постепенно приходит к тому, что реальные продукты - это координация специализированных компонентов, а не одна швейцарская модель.
Смотрите также
-
ИИ-агент·Meta запускает платного ИИ-агента за $200 в месяц
-
Ассистенты·Hinge защищает ИИ-подсказки для робких зумеров
-
Автоматизация·Как Kaggle упрощает создание AI-бенчмарков
-
Автоматизация·Майские обновления Алисы AI — что нового
-
ИИ-агент·Google Search стал агентом: что нового на I/O
-
Opensource·Kimi K2.6 - открытая модель с роем агентов
-
Opensource·Stability AI выпустила модель для генерации 6-минутных треков
-
Инструменты разработчика·Anthropic готовит Mythos 1 для Claude Code и Security
-
ИИ-агент·Gemini 3.5: новый уровень интеллекта и скорости