Google анонсировал выход FunctionGemma — специальной версии модели Gemma 3 270M, предназначенной для преобразования голосовых команд в действия.
Главная особенность новинки — способность работать на простых устройствах вроде NVIDIA Jetson Nano и обычных смартфонов. Модель понимает команды на разных языках и может обрабатывать JSON-данные благодаря словарю из 256 тысяч слов.
Разработчики могут легко интегрировать FunctionGemma в свои проекты через популярные фреймворки: Hugging Face Transformers, Keras, NVIDIA NeMo, LiteRT-LM, vLLM, MLX, Ollama, Vertex AI и LM Studio.
Модель не просто выполняет команды, но и умеет общаться с пользователем на человеческом языке. После дополнительного обучения точность выполнения задач на мобильных устройствах выросла с 58% до впечатляющих 85%.
FunctionGemma может работать полностью автономно и без подключения к интернету, что обеспечивает приватность и быстрый отклик. Она справляется с базовыми задачами вроде установки напоминаний или изменения настроек системы, а при необходимости может передавать сложные запросы более мощным моделям.
Этот релиз — часть стратегии Google по развитию открытых ИИ-моделей. Семейство Gemma уже преодолело отметку в 300 миллионов загрузок, и компания продолжает помогать разработчикам создавать умных помощников нового поколения, способных не только поддерживать разговор, но и выполнять реальные действия.
Смотрите также
-
Обзор Chatterbox-turbo: быстрая и эффективная модель для синтеза речи
-
LG представила новую караоке-колонку Stage 501, созданную совместно с Will.i.am
-
xAI расширяет возможности: новый Voice Agent API и планы развития
-
Bixby Text Call: теперь Samsung может создать копию вашего голоса и отвечать на ваши звонки