Как веб-модели миров помогут ИИ-агентам исследовать виртуальные пространства

·  чтения ·  · 
Как веб-модели миров помогут ИИ-агентам исследовать виртуальные пространства

Команда исследователей из Принстона, UCLA и Пенсильванского университета разработала инновационный подход к созданию виртуальных миров для ИИ-агентов. Их решение объединяет четкие правила, прописанные в коде, с творческими возможностями языковых моделей.

В основе подхода лежит концепция двухслойной архитектуры. Первый слой — это программный код на TypeScript, который определяет базовые правила мира: что существует, как объекты взаимодействуют между собой, какие действия разрешены. Например, код не позволит игроку пройти сквозь запертую дверь или потратить несуществующие деньги.

Второй слой использует языковую модель для наполнения мира живым содержанием. Она создает описания окружения, диалоги персонажей и добавляет эстетические детали. При этом модель может работать только в рамках, заданных кодом. Когда игрок пытается что-то сделать, сначала код проверяет допустимость действия, и только потом ИИ описывает происходящее.

Одно из самых элегантных решений касается хранения данных. Вместо сохранения информации о бесконечной вселенной, система использует хеш-функции для воссоздания локаций по их координатам. Когда игрок посещает определенную планету, ее координаты пропускаются через математическую формулу, которая всегда дает одинаковый результат для одних и тех же входных данных. Этот результат определяет параметры для языковой модели, гарантируя, что планета будет выглядеть одинаково при каждом посещении.

Исследователи продемонстрировали работу своего подхода на семи различных приложениях. Среди них "Бесконечный атлас путешествий", позволяющий исследовать Землю, "Галактический атлас" для изучения научно-фантастической вселенной и карточная игра "AI Spire", где игроки могут создавать собственные карты с помощью текстовых запросов.

Система может работать даже при отключении ИИ, переключаясь на заранее подготовленные шаблоны. Мир теряет часть своей описательной глубины, но основные правила продолжают действовать. Это выгодно отличает данный подход от чисто генеративных систем, которые полностью зависят от работоспособности языковой модели.

Такой подход может стать важным шагом в развитии систем обучения ИИ-агентов, предоставляя им среду, достаточно стабильную для эффективного обучения, но при этом гибкую для работы с непредвиденными ситуациями. Однако пока остается открытым вопрос о масштабируемости этого решения при более сложных взаимодействиях, например, при одновременной работе множества агентов или необходимости динамического изменения правил.

Смотрите также

Логотип Telegram

Будьте в курсе новых нейросетей — подпишитесь на наш Telegram-канал!

Ежедневные обзоры свежих AI-инструментов, лайфхаки и инструкции прямо в вашем мессенджере.

AILibri – главная страница
Ctrl / ⌘+K