Qwen3.6-27B обошёл модель в 15 раз крупнее

Alibaba выпустила Qwen3.6-27B - компактную модель на 27 млрд параметров, которая превзошла своего предшественника на 397 млрд на большинстве бенчмарков по коду.

Qwen3.6-27B обошёл модель в 15 раз крупнее

Alibaba выпустила Qwen3.6-27B - плотную (dense) модель с 27 миллиардами параметров, которая умудрилась обогнать своего значительно более тяжеловесного предшественника Qwen3.5-397B-A17B. Для понимания масштаба: предшественник весит 397 миллиардов параметров - то есть примерно в 15 раз больше.

На бенчмарке SWE-bench Verified новинка набрала 77.2 против 76.2 у старшей модели, а на Terminal-Bench 2.0 - 59.3 против 52.5. Разрыв не гигантский, но сам факт того, что компактная модель вообще выигрывает, впечатляет.

Почему это важно для разработчиков

Qwen3.6-27B - «плотная» модель, в отличие от архитектуры MoE (Mixture of Experts), где задействуется только часть подсетей в зависимости от задачи. Это делает её проще в развёртывании: не нужна сложная инфраструктура, меньше головной боли с железом.

Модель умеет работать как с текстом, так и с мультимодальными задачами - на бенчмарках GPQA Diamond и MMMU она держится наравне с такими конкурентами, как Claude 4.5 Opus.

Весовые коэффициенты опубликованы на Hugging Face и ModelScope, модель доступна через Qwen Studio и API Alibaba Cloud. Целевая аудитория - разработчики, которым нужна сильная модель для кода без необходимости тащить на себе сотни миллиардов параметров.

Как всегда, бенчмарки - это только ориентир, а не гарантия. Но направление движения интересное.

Смотрите также

Логотип Telegram

Будьте в курсе новых нейросетей — подпишитесь на наш Telegram-канал!

Ежедневные обзоры свежих AI-инструментов, лайфхаки и инструкции прямо в вашем мессенджере.

AILibri – главная страница
Ctrl / ⌘+K