Очередная проблема AI-видео получила неожиданное решение. Швейцарские учёные из лаборатории VITA при EPFL предложили метод, который звучит почти как издевательство: давайте кормить нейросеть её собственными ошибками.
Суть проблемы проста - AI-видео теряют связность уже через 20-30 секунд. Каждый новый кадр генерируется на основе предыдущего, и любая мелочь (размытое лицо, искажённый объект) начинает множиться как снежный ком. В итоге через полминуты на экране творится что-то невообразимое.
Причина банальна: модели тренируют на идеальных данных, а в реальности им приходится работать с собственным несовершенным выхлопом. Классический случай "в вакууме всё работало отлично".
Метод называется "переобучение через переработку ошибок" (retraining by error recycling). Вместо того чтобы избегать косяков, исследователи намеренно скармливают AI его же промахи. Модель генерирует видео, система находит расхождения между тем, что получилось, и тем, что должно было быть, а потом переобучает AI именно на этих различиях.

Результат - видео держат форму заметно дольше. Никаких жёстких временных ограничений в 30 секунд. Потенциально это открывает дорогу для симуляций, анимации и автоматического создания визуального контента.
Но есть нюансы. Во-первых, вычислительные мощности - метод требует постоянного мониторинга и дополнительных ресурсов. Во-вторых, риск переобучения на специфических ошибках. В-третьих - и это главное - непонятно, не внесёт ли такой подход новые искажения или не ухудшит ли способность модели обобщать знания.
Лабораторные тесты - это одно, а реальные творческие задачи - совсем другое. Пока рано говорить, что проблема дрифта решена окончательно. Но направление любопытное: учить AI на собственных косяках вместо бесконечной погони за идеальными датасетами.
Смотрите также
-
Bytedance выпустила Helios — ИИ генерирует минутное видео почти в реальном времени
-
Adobe Firefly научился монтировать видео по текстовому запросу
-
Ватикан запустил AI-переводчик месс на 60 языков
-
Seedance 2.0: новый AI-генератор видео уже обвиняют в массовом нарушении авторских прав
-
Голливуд нанимает "охотников за головами" для борьбы с ИИ-пиратами
-
Китайская нейросеть создает новые серии Pokemon и Dragon Ball
-
ByteDance представил новую версию ИИ для создания видео
-
Voxtral Transcribe 2: революционно доступное распознавание речи
-
Meta создаст отдельное приложение для генерации AI-видео Vibes