
Los visionarios creadores de ChatGPT han presentado Sora, el último modelo de inteligencia artificial de OpenAI capaz de transformar texto en vídeos de hasta 60 segundos, con escenarios detallados, movimientos de cámara complejos y múltiples personajes.
Sam Altman, CEO de OpenAI, compartió la noticia en las redes sociales al decir: «Aquí está Sora, nuestro modelo de generación de videos». La empresa también difundió algunos videos generados a partir de texto, como un clip de 17 segundos que describe una animada y nevada ciudad de Tokio con la cámara siguiendo personas por las bulliciosas calles.
En el blog oficial de OpenAI, se detalla que Sora se basa en investigaciones previas de modelos como DALL·E y GPT. Utiliza la técnica de recaptioning de DALL·E 3 para generar subtítulos descriptivos, permitiendo al modelo seguir con fidelidad las instrucciones de texto del usuario en el vídeo resultante.
Además de generar vídeos desde cero, Sora puede trabajar con imágenes fijas existentes, animando el contenido con precisión y atención al detalle. También puede ampliar o completar vídeos existentes, adaptándose a las indicaciones del usuario.
En cuanto a la disponibilidad, Sora está actualmente accesible para miembros del «equipo rojo» de OpenAI, quienes evaluarán áreas críticas en busca de posibles daños o riesgos. También se otorgará acceso a artistas visuales, diseñadores y cineastas para obtener comentarios sobre cómo mejorar el modelo para los profesionales creativos.
Los creadores destacan la capacidad de Sora para generar escenas complejas con múltiples personajes y movimientos específicos, mostrando un profundo entendimiento del lenguaje para interpretar instrucciones con precisión. Sin embargo, también reconocen que el modelo presenta debilidades, como dificultades para simular con precisión la física de escenas complejas y posibles confusiones en detalles espacio-temporales.
OpenAI subraya su compromiso con la seguridad, trabajando con expertos para evaluar el modelo en términos de desinformación, contenido que incita al odio y prejuicios. Se están desarrollando herramientas, como un clasificador de detección, para identificar contenido engañoso generado por Sora.