Команда исследователей представила впечатляющие результаты в области искусственного интеллекта для программирования. Их модель X-Coder с 7 миллиардами параметров превзошла конкурентов, имеющих вдвое больше параметров.
Ключом к успеху стал инновационный подход к обучению на синтетических данных. Исследователи обнаружили, что разнообразие задач важнее количества решений. При увеличении числа синтетических задач с 32 000 до 192 000 точность модели выросла с 43.7% до 62.7%.
Для создания качественных обучающих данных команда разработала систему SynthSmith. Она анализирует существующий код, извлекает важные элементы программирования и создает новые задачи с нуля. Система начала с 10 000 примеров кода и расширила базу до почти 177 000 алгоритмических элементов.
X-Coder достиг впечатляющих результатов на стандартных тестах LiveCodeBench. На версии v5 модель показала точность 62.9%, а на более новой v6 - 55.8%, превзойдя 14-миллиардные модели DeepCoder и AReal-boba2.

Важное преимущество синтетических данных - отсутствие проблемы запоминания тестовых задач. В то время как другие модели показывают резкое падение результатов на новых версиях тестов, X-Coder демонстрирует более стабильные показатели.
Исследователи открыли доступ к коду для подготовки обучающих данных на GitHub и планируют опубликовать веса модели. Этот проект демонстрирует растущий интерес к синтетическим данным в индустрии ИИ, где такой подход помогает решить проблему нехватки реальных данных для обучения.
Смотрите также
-
Alibaba выпустила бесплатную Qwen3.5 - гонка китайских ИИ-моделей набирает обороты
-
Google открыл API для Gemini 3 Deep Think - ИИ для сложных научных задач
-
ИИ для птиц оказался лучше в распознавании китов, чем специализированная модель
-
LLM API — единый доступ к сотням языковых моделей
-
Искусственный интеллект следит за айсбергами от рождения до распада
-
Google создала систему из пяти ИИ-агентов для автоматической генерации научных иллюстраций
-
Марсоход Perseverance впервые проложил маршрут с помощью искусственного интеллекта
-
Nvidia делает прогнозирование погоды с помощью ИИ более доступным
-
OpenAI представляет Prism — новый AI-помощник для учёных