Компания Google представила инновационную технологию Agentic Vision в составе своей модели Gemini 3 Flash. Эта разработка кардинально меняет способ работы искусственного интеллекта с визуальной информацией.
Технология уже доступна разработчикам и бизнес-пользователям через API Gemini в Google AI Studio и Vertex AI, а также постепенно появляется в приложении Gemini для обычных пользователей.
Главная особенность Agentic Vision — интерактивный подход к анализу изображений. Система работает по принципу 'Думай-Действуй-Наблюдай': сначала анализирует запрос, затем обрабатывает изображение с помощью Python-кода и на основе полученных результатов формирует точный ответ.

Среди ключевых возможностей Agentic Vision:
Автоматическое масштабирование для изучения мелких деталей Разметка и аннотирование изображений Распознавание сложных таблиц Визуализация данных в Python-окружении
По сравнению с предыдущими версиями, качество анализа изображений улучшилось на 5-10%. Например, сервис PlanCheckSolver.com уже отметил заметное повышение точности при проверке строительных планов.

Google продолжает лидировать в области мультимодального искусственного интеллекта. В будущем компания планирует расширить возможности Agentic Vision, добавив поддержку моделей разного размера и интеграцию с веб-поиском и поиском по изображениям.
Этот релиз демонстрирует стремление Google развивать свои AI-модели, делая их более надежными и универсальными для решения различных практических задач.
Смотрите также
-
Luma выпустила UNI-1 - модель, которая понимает и рисует одновременно
-
Ностальгия по пикселям: как превратить битвы из Game Boy в детализированные картины с помощью ИИ
-
Google выкатил Nano Banana 2 - теперь ИИ рисует еще реалистичнее
-
Почему ИИ-ассистенты по умолчанию женского пола — и стоит ли об этом беспокоиться?
-
ИИ деанонимизирует пользователей интернета за пару долларов и несколько минут
-
PewDiePie обучил свою ИИ-модель дома и обошёл ChatGPT (правда, спалив видеокарту)
-
Новый детектор ИИ-изображений ищет фейки в базе разоблачённых картинок
-
Anthropic выяснила: красивый ответ ИИ усыпляет бдительность пользователей
-
Samsung показала AI-редактор фото для Galaxy S26 - но что там нового?