Sora - модель ИИ, которая превращает текст в реалистичные видео. Система понимает физику мира и показывает объекты в движении. Глубокое обучение позволяет моделировать реальность.
Как работает технология
Sora обучают на видео с текстовыми описаниями. Модель видит связи между словами и тем, что происходит в кадре. ИИ понимает, как свет падает на поверхности, как тени меняются при движении камеры, куда должен полететь брошенный предмет.
- Видео длиной до минуты
- Разрешение до 1920×1080
- Стабильная камера без дрожания
- Правильная физика объектов
Что умеет Sora
Модель создаёт сложные сцены с несколькими персонажами. Пользователь пишет: «Стильная женщина идёт по улицам Токио в дождь, камеры следуют за ней, отражения в лужах», - и получает готовый ролик. Или просит сделать трейлер фильма в духе science-fiction, описывая сюжет и визуальный стиль.
Sora понимает контекст. Если в промпте сказано «кошка прыгает со стола», животное приземлится естественно. Тень от кошки будет двигаться в такт с источником света.
Где это пригодится
Маркетологи делают тестовые ролики для рекламы без съёмочной группы. Образовательные платформы создают визуализации физических экспериментов. Сценаристы видят, как выглядит их идея в движении, ещё до производства.
Технология ещё в разработке. OpenAI ограничивает доступ - пока тестируют с узким кругом партнёров и проводят красный командинг для поиска уязвимостей.