OpensourceИИ-агентПомощники в кодинге чтения

Mellum2 от JetBrains: быстрая модель для ИИ-систем

JetBrains открыла исходный код Mellum2 — 12B модели с MoE-архитектурой для роутинга, RAG, агентов и локального деплоя в инженерных системах.

Mellum2 от JetBrains: быстрая модель для ИИ-систем

JetBrains выложили в открытый доступ Mellum2 - 12-миллиардную языковую модель, заточенную под реальные производственные задачи. Apache 2.0, никаких ограничений. Модель обучена с нуля и ориентирована на три вещи, о которых все говорят, но мало кто решает нормально: задержка, пропускная способность и стоимость инференса.

Начиналось всё с автодополнения кода в IDE, но теперь Mellum2 понимает и естественный язык. Позиционируется как рабочий инструмент для роутинга запросов, суммаризации, RAG-пайплайнов и промежуточных шагов в агентных системах.

Архитектура, которая объясняет скорость

Внутри - Mixture of Experts. Формально 12B параметров, но на каждый токен активируется только 2.5B. Это и даёт скорость без потери качества. Модель не мультимодальная - только текст и код, и это осознанное решение: меньше лишнего, выше специализация.

По бенчмаркам (код, математика, рассуждения) Mellum2 держится на уровне аналогов, при этом инференс быстрее в два раза. Для продакшена это не мелочь.

Зачем это нужно на практике

Сценарии использования вполне конкретные: анализировать входящие запросы и направлять их к нужной модели, строить RAG-пайплайны с быстрой суммаризацией контекста, разбивать агентные цепочки на шаги и закрывать повторяющиеся задачи без обращения к огромным дорогим моделям. Или просто запускать локально - данные никуда не уходят.

За этим стоит идея, которую в JetBrains называют "focal model philosophy": не каждая задача требует самой большой модели. Многие шаги в современных ИИ-системах повторяются, чувствительны к задержкам и встречаются тысячи раз в день. Для них нужен быстрый, управляемый, дешёвый компонент - а не фронтирная модель по полной цене.

Разумный подход, если честно. Хайп вокруг "одной модели на все случаи" немного поутих, и индустрия постепенно приходит к тому, что реальные продукты - это координация специализированных компонентов, а не одна швейцарская модель.

Смотрите также

Каталог приложений Telegram Mini Apps

340+ проверенных мини-приложений: нейросети, утилиты, игры. Открываются прямо в мессенджере — без установки.

Открыть →

Поддержите Ailibri

Если наш каталог оказался полезным, вы можете оставить небольшой донат. Это поможет нам развивать проект.

♥ Поддержать

Будьте в курсе новых нейросетей — подпишитесь на наш Telegram-канал

Ежедневные обзоры свежих AI-инструментов, лайфхаки и инструкции прямо в вашем мессенджере.

Подписаться
Бесплатно · Нейросеть

Генерация изображений прямо в Telegram

3 бесплатные генерации в день через нейросеть nano banana — просто подпишись на канал @n_seti

Быстро Точно Качественно
Попробовать @gen_neurosila_bot

Нейросети и ИИ-инструменты

Все теги →
github212 text-to-text136 text-to-image111 каталог29 image-to-image23 инструмент20 курсы19 создание чат-ботов15 браузер15 удалить фон14 text-to-sound12 text-to-video11 замена лица11 gpt-49 desktop-приложение9 ии-музыка9 аниме9 удалить объект с фото8 google8 создание сайтов7
AILibri – главная страница
Ctrl / ⌘+K