OpenAI lanza Sora, la IA capaz de hacer un video a través de una descripción

De acuerdo con OpenAI, el modelo de Sora puede generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo

Ciencia y Tecnología

Feb-20-2024

153
OpenAI lanza Sora, la IA capaz de hacer un video a través de una descripción

 

RFInforma / OpenAI / martes 20 de febrero del 2024

Redacción.-

OpenAI introdujo una nueva herramienta: Sora. Este es un modelo como ChatGPT, donde escribes un texto, solo que el resultado es un video. Pero Sora tiene sus limitaciones; no podrás hacer una película entera con ella. Más bien, es capaz de generar videos de hasta un minuto de duración.

Aunque no especificaron la fecha de su lanzamiento, en la publicación oficial mencionaron que en su etapa inicial está disponible para red teamers, quienes podrán evaluar áreas críticas en busca de riesgos o perjuicios. Además, un grupo selecto de artistas visuales, diseñadores y cineastas tendrán acceso para proporcionar retroalimentación sobre cómo mejorar el modelo para profesionales creativos.

De acuerdo con OpenAI, el modelo de Sora puede generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. Entiende no solo lo que el usuario ha solicitado en el texto, sino también cómo esas cosas existen en el mundo físico.

“Sora tiene un profundo entendimiento del lenguaje, lo que le permite interpretar con precisión las indicaciones y generar personajes convincentes que expresan emociones vibrantes. Además, puede crear múltiples tomas dentro de un solo video generado, manteniendo la coherencia de los personajes y el estilo visual”, escribieron.

Sin embargo, mencionan que el modelo actual tiene algunas limitaciones. Puede tener dificultades para simular con precisión la física de una escena compleja y entender las relaciones causa-efecto específicas.

En cuanto a la seguridad, se están realizando pruebas adversariales con red teamers y se están desarrollando herramientas para detectar contenido engañoso, como un clasificador de detección que puede identificar cuando un video fue generado por Sora.

Además, OpenAI mencionó está colaborando con legisladores, educadores y artistas de todo el mundo para comprender sus preocupaciones y encontrar casos de uso positivos para esta nueva tecnología.

Sin embargo, esta no es la primera herramienta que convierte texto a video.

En noviembre del año pasado , Meta lanzó Emu, Emu Video y Emu Edit; herramientas de generación de imágenes, vídeos y edición que crean contenido a través de IA generativa.

Sin embargo, de acuerdo con MIT Tech Review, los primeros ejemplos de Meta, Google y una startup llamada Runway presentaban errores y una calidad de imagen granulada.

Estas herramientas se lanzan a menos de un año de las Huelgas de Hollywood, donde uno de los principales acuerdos fue la protección frente al uso no autorizado de la IA.tecnologia

 

» Fuente «