Компания Perplexity сделала важный шаг вперед в развитии искусственного интеллекта, представив новый открытый стандарт DRACO (Deep Research Accuracy, Completeness, and Objectivity Benchmark). Этот инструмент позволяет оценивать, насколько хорошо AI-системы справляются со сложными исследовательскими задачами.
DRACO создан на основе анализа миллионов реальных запросов, которые пользователи отправляли в систему Perplexity Deep Research. Стандарт охватывает десять различных областей знаний, включая право, медицину, финансы и академические исследования. Для каждой области разработаны детальные критерии оценки, которые прошли проверку экспертами.
Вместе с этим компания объявила об улучшении сервиса Deep Research. По заявлению Perplexity, их система показывает лучшие результаты по точности и надежности среди аналогичных инструментов для глубоких исследований. Новая версия уже доступна пользователям тарифа Max, а в ближайшие дни появится и для подписчиков Pro.

Теперь любые разработчики AI, исследователи и организации могут использовать DRACO для оценки эффективности своих систем, что способствует развитию более качественных AI-решений для исследовательских задач.
Смотрите также
-
«Алиса» научилась работать прямо в строке ввода Telegram
-
Яндекс начал показывать рекламу в чате с Алисой AI - пока только 5% пользователей
-
Alibaba выпустила бесплатную Qwen3.5 - гонка китайских ИИ-моделей набирает обороты
-
QuitGPT: пользователи массово бойкотируют ChatGPT из-за политики компании
-
Airbnb тестирует ИИ-поиск жилья на небольшой группе пользователей
-
OpenAI закрывает GPT-4o, но клоны уже появились
-
Fitbit запустил AI-тренера на iOS - теперь Gemini следит за вашим здоровьем
-
Как пользователи ChatGPT оплакивали 'смерть' старой версии ИИ
-
Arena представила Max — умный маршрутизатор для языковых моделей