Google revoluciona la IA con Gemini Omni, el modelo que transforma texto, audio e imágenes en video

0
32

mbios en una conversación, mientras la IA mantiene coherencia visual y narrativa entre cada instrucción.

Con esta tecnología, es posible transformar escenarios completos, añadir personajes, cambiar acciones o alterar estilos cinematográficos sin necesidad de herramientas avanzadas de edición.

Google asegura que Omni puede convertir un video común en una escena completamente distinta, abriendo nuevas posibilidades para creadores de contenido, cineastas y usuarios casuales.

IA con comprensión física y narrativa
Gemini Omni también incorpora una mejora en razonamiento visual y contextual. Según Google, el modelo entiende conceptos como gravedad, movimiento, energía y dinámica de fluidos para generar escenas más realistas.

Además, combina el conocimiento de Gemini sobre historia, ciencia y cultura para construir narrativas visuales más coherentes y creativas, superando la simple generación automática de imágenes.

La plataforma incluso puede transformar ideas complejas en explicaciones visuales detalladas a partir de instrucciones breves.

Videos creados desde cualquier referencia
Otra de las novedades es la capacidad de usar múltiples referencias simultáneamente. Los usuarios podrán combinar dibujos, fotografías, clips de video, texto o incluso referencias de voz para producir un único video coherente.

Google adelantó que, aunque inicialmente solo se admitirán referencias de voz para audio, en futuras actualizaciones llegarán más tipos de entradas sonoras.

También será posible definir estilos visuales, movimientos de cámara y efectos especiales mediante descripciones escritas o materiales de referencia.

Avatares digitales y medidas de seguridad
Omni permitirá crear avatares digitales personalizados capaces de replicar la voz y apariencia de los usuarios para generar videos automatizados.

Como parte de sus políticas de seguridad, Google informó que todos los contenidos creados con Gemini Omni incluirán la marca de agua digital SynthID, diseñada para identificar material generado por inteligencia artificial.

Disponible para usuarios y creadores
Gemini Omni Flash ya está disponible para suscriptores de Google IA Plus, Pro y Ultra a través de la app Gemini y Google Flow.

Sin embargo, algunas funciones también llegarán gratuitamente a usuarios de YouTube Shorts y YouTube Create.

Google adelantó que próximamente el modelo estará disponible para desarrolladores y empresas mediante acceso vía API.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí