La empresa Sber presentó una nueva versión de su innovadora red neuronal Kandinsky 3.1, que es capaz de crear imágenes basadas en descripciones de texto en ruso e inglés. Así lo informa el servicio de prensa de la empresa.
Kandinsky 3.1 se ha enriquecido con entrenamiento en un conjunto de datos ampliado, lo que ha mejorado significativamente la calidad de la generación visual. Inicialmente, categorías limitadas de usuarios tuvieron acceso al nuevo modelo: artistas, diseñadores y blogueros. Sin embargo, los representantes de Sber aclaran que pronto las capacidades de Kandinsky 3.1 estarán disponibles para el público en general sin restricciones.
El primer vicepresidente de la junta directiva de Sberbank, Alexander Vedyakhin, señaló: “Hace exactamente un año lanzamos la versión Kandinsky 2.1 y desde entonces nuestra red neuronal se ha mejorado constantemente. Kandinsky 3.1 se ha vuelto más rápido, más conveniente y más realista. Es una herramienta gratuita y rica en funciones que permite a cualquiera convertirse en artista y crear imágenes únicas. Pronto cualquiera podrá apreciar las ventajas del nuevo modelo”.
Entre las mejoras clave de Kandinsky 3.1 se encuentran: acelerar diez veces el de generación de imágenes , la capacidad de crear imágenes de alta resolución hasta 4K y la integración de un modelo de lenguaje para optimizar consultas de texto. Los usuarios también podrán utilizar funciones para crear variaciones de imágenes, mezclar imágenes y texto, crear paquetes de pegatinas y realizar cambios locales en las imágenes sin tener que volver a trabajar en toda la escena.
El futuro próximo promete la aparición de un nuevo modelo Kandinsky Video 1.1 para generar vídeo a partir de descripciones de texto, con calidad mejorada y doble resolución de vídeo en comparación con el modelo anterior Kandinsky Video 1.0.