SkillOpt — это оптимизатор навыков для языковых агентов, который работает не с весами модели, а с текстовым документом-инструкцией. Вместо того чтобы дообучать нейросеть или вручную править промпты, сервис запускает замороженную целевую модель на задачах, собирает результаты, анализирует успехи и ошибки через отдельную модель-оптимизатор, предлагает правки в текст навыка и принимает их только если производительность на проверочной выборке растёт.
Механика похожа на классический цикл обучения: прогон задач собирает данные, рефлексия выявляет паттерны ошибок и успешных стратегий, ограниченные правки не дают переписать весь документ за раз, а валидация на отложенной выборке отсекает кандидатов, которые ухудшают результат. Система запоминает отклонённые правки, использует медленное обновление и мета-навык на стороне оптимизатора, чтобы учитывать долгосрочную обратную связь без раздувания итогового документа.
SkillOpt показал прирост на всех комбинациях моделей и бенчмарков — от SearchQA и SpreadsheetBench до ALFWorld и LiveMathBench. Средний прирост для GPT-5.5 составил 23,5 процентных пункта, для Qwen3.5-4B — 19,2, для GPT-5.4-nano — 24,9. Финальный навык экспортируется в один компактный файл, который можно переносить между моделями, харнессами и близкими задачами без дополнительной оптимизации: например, навык, обученный на GPT-5.4 для LiveMath, дал прирост +15,2 на GPT-5.4-nano, а навык для SpreadsheetBench, натренированный в Codex, добавил +31,8 в Claude Code.
Сервис не требует доступа к весам целевой модели, работает с замороженными агентами и выдаёт переиспользуемый артефакт, который можно развернуть в продакшене как обычную инструкцию. Код, бумага и видео доступны на странице проекта.