Команда исследователей из Принстона, UCLA и Пенсильванского университета разработала инновационный подход к созданию виртуальных миров для ИИ-агентов. Их решение объединяет четкие правила, прописанные в коде, с творческими возможностями языковых моделей.
В основе подхода лежит концепция двухслойной архитектуры. Первый слой — это программный код на TypeScript, который определяет базовые правила мира: что существует, как объекты взаимодействуют между собой, какие действия разрешены. Например, код не позволит игроку пройти сквозь запертую дверь или потратить несуществующие деньги.
Второй слой использует языковую модель для наполнения мира живым содержанием. Она создает описания окружения, диалоги персонажей и добавляет эстетические детали. При этом модель может работать только в рамках, заданных кодом. Когда игрок пытается что-то сделать, сначала код проверяет допустимость действия, и только потом ИИ описывает происходящее.

Одно из самых элегантных решений касается хранения данных. Вместо сохранения информации о бесконечной вселенной, система использует хеш-функции для воссоздания локаций по их координатам. Когда игрок посещает определенную планету, ее координаты пропускаются через математическую формулу, которая всегда дает одинаковый результат для одних и тех же входных данных. Этот результат определяет параметры для языковой модели, гарантируя, что планета будет выглядеть одинаково при каждом посещении.
Исследователи продемонстрировали работу своего подхода на семи различных приложениях. Среди них "Бесконечный атлас путешествий", позволяющий исследовать Землю, "Галактический атлас" для изучения научно-фантастической вселенной и карточная игра "AI Spire", где игроки могут создавать собственные карты с помощью текстовых запросов.

Система может работать даже при отключении ИИ, переключаясь на заранее подготовленные шаблоны. Мир теряет часть своей описательной глубины, но основные правила продолжают действовать. Это выгодно отличает данный подход от чисто генеративных систем, которые полностью зависят от работоспособности языковой модели.
Такой подход может стать важным шагом в развитии систем обучения ИИ-агентов, предоставляя им среду, достаточно стабильную для эффективного обучения, но при этом гибкую для работы с непредвиденными ситуациями. Однако пока остается открытым вопрос о масштабируемости этого решения при более сложных взаимодействиях, например, при одновременной работе множества агентов или необходимости динамического изменения правил.
Смотрите также
-
Cloudflare покупает Human Native для монетизации данных в сфере ИИ
-
ИИ-ассистент помогает управлять ускорителем частиц в Беркли
-
Opera One R3: новый браузер с цветными вкладками и умным ИИ
-
Google запустил бета-версию персонального помощника Gemini
-
Загадочные «красные точки» в космосе оказались молодыми черными дырами
-
Google представляет новый протокол для онлайн-торговли с поддержкой Walmart и Shopify
-
Google тестирует новый инструмент Gemini Auto Browse для Chrome
-
ИИ для создания лекарств: как британский стартап использует биоразнообразие планеты
-
Apple переходит на Google Gemini для улучшения Siri