Acceder al contenido

Potencia tu creatividad con nuevos modelos y herramientas multimedia generativos

[]

Potencia tu creatividad con nuevos modelos y herramientas multimedia generativos

May 20, 2025

EliCollins1637

Eli Collins

VP, Google DeepMind

Video con varias imagenes coloridas y de distintos estilos

Hoy queremos anunciar el lanzamiento de nuestros modelos multimedia de IA generativa más recientes, que marcan grandes avances en la generación de contenido multimedia. A través de la increíble creación de imágenes, videos y música, estos modelos impulsan a los artistas a desafiar los límites de su creatividad y a hacer realidad sus ideas más innovadoras, además de impulsar asombrosas herramientas para que todos puedan expresarse a su manera.

Veo 3 e Imagen 4, nuestros modelos de generación de imágenes y videos más recientes, llevan la generación de contenido multimedia más allá gracias a sus funciones innovadoras. También ampliaremos el acceso a Lyria 2 para que los músicos cuenten con más herramientas para crear música. Por último, invitamos a los narradores visuales a que prueben Flow, nuestra herramienta de creación cinematográfica con IA, que utiliza los modelos más avanzados de Google DeepMind y les da la posibilidad de crear películas cinematográficas con un control más sofisticado de las escenas, los estilos y los personajes, de manera que puedan hacer realidad su historia.

Nos asociamos estrechamente con las industrias creativas, como cineastas, músicos, artistas y creadores de YouTube, para ayudar a moldear estos modelos y productos de forma responsable, y brindarles a los creadores nuevas herramientas que les permitan descubrir un mundo de posibilidades al usar la IA en su rubro artístico.

Veo 3: Video y audio

Veo 3, nuestro nuevo modelo de generación de videos de vanguardia, no solo supera la calidad de Veo 2, sino que también, por primera vez, permite generar videos con audio: ya sean ruidos de fondo de tráfico en la calle de una ciudad, pájaros cantando en un parque o, incluso, diálogo entre los personajes.

A nivel general, Veo 3 se destaca tanto en la generación de imágenes y texto como en la física del mundo real y la sincronización de labios. Comprende de maravilla; si le cuentas una historia en tu instrucción, el modelo puede generar un clip que la hace realidad. Veo 3 está disponible actualmente en la aplicación de Gemini y en Flow para suscriptores de Ultra que residan en los Estados Unidos, y en Vertex AI para usuarios corporativos.

Actualizaciones de Veo 2: Nuevas funciones creadas con y para cineastas

A medida que mejoramos Veo 3, también agregamos nuevas funciones a nuestro popular modelo Veo 2, que se basan en nuestro trabajo con creadores y cineastas. Hoy lanzamos varias de ellas, que incluyen lo siguiente:

Función de video de última generación potenciada por referencias: Te permite brindarle a Veo imágenes de personajes, escenas, objetos y estilos para tener un mejor control creativo y mayor coherencia.
Controles de cámara: Te ayudan a definir movimientos de cámara precisos, como rotaciones, dollies y zooms, para que logres la toma perfecta.
Extensión de imagen: Es útil para ampliar el marco y convertir un video en formato vertical a horizontal, de manera que pueda adaptarse a cualquier tamaño de pantalla y agregar valor a la escena de forma inteligente.
Posibilidad de agregar y quitar objetos de tus videos: Dado que Veo comprende la escala, las interacciones y las sombras, puede crear una escena natural y con un aspecto realista.

La función de video potenciada por referencias y los controles de cámara están disponibles en Flow. Nos complace poder ofrecer todas estas nuevas funcionalidades para la API de Vertex AI en las próximas semanas, además a más productos en los próximos meses.

Flow: Una herramienta de creación cinematográfica con IA diseñada para Veo

Diseñada por y para mentes creativas, Flow es una herramienta de IA que te permite crear historias, escenas y clips cinematográficos sin esfuerzo gracias a los modelos más avanzados de Google DeepMind que trabajan en conjunto: Veo, Imagen y Gemini. Usa lenguaje natural para describirle tu ejemplo a Flow, administra los elementos para tu historia (reparto, locaciones, objetos y estilos) en un solo lugar y transforma tu narración en escenas asombrosas.

Flow está disponible actualmente para suscriptores de los planes Google AI Pro y Ultra que residan en los Estados Unidos, y próximamente lo estará para más países.

Imagen 4: Calidad excepcional y tipografía superior

Nuestro modelo de Imagen más reciente combina velocidad con precisión para crear imágenes deslumbrantes. Imagen 4 ofrece una claridad excepcional en detalles sutiles como diseños textiles elaborados, gotas de agua y pelaje de animales, además de destacarse tanto en estilos fotorrealistas como abstractos. Además, permite generar imágenes en una amplia variedad de relaciones de aspecto y con una resolución de hasta 2K, lo que es incluso mejor para impresiones o presentaciones. Crear tus propias tarjetas de felicitaciones, pósteres y hasta cómics te resultará mucho más fácil gracias a su excelente ortografía y tipografía.

Una ballena en la calle

foto tipo comic

imagen tipo videojuego

imagen de un carton de huevos

imagen de una persona caminando por campos de flores con una sombrilla roja

imagen de una cabaña junto al agua

imagen de una mujer con un vestido de alta costura

imagen de un perro sacando la lengua

imagen de tres personas tipo caricatura

imagen de un trex tipo caricatura

Imagen 4 está disponible actualmente en la aplicación de Gemini, Whisk y Vertex AI, y en Presentaciones, Vids, Documentos y mucho más en Workspace.

Próximamente también lanzaremos una variante de Imagen 4 que será 10 veces más veloz que Imagen 3, para que puedas explorar ideas aún más rápido.

Lyria 2: Composición potente y exploración sin límites

En abril, ampliamos el acceso a Music AI Sandbox, con la tecnología de Lyria 2. Music AI Sandbox ofrece un conjunto de herramientas experimentales para músicos, productores y compositores que abre un mundo de posibilidades creativas y permite que los artistas exploren ideas musicales únicas. La experiencia y los valiosos comentarios de la industria musical nos ayudan a garantizar que nuestras herramientas potencien el trabajo de los creadores, a la vez que les muestran las enormes posibilidades que ofrece la IA en su arte.

Lyria 2, ahora disponible para creadores con YouTube Shorts y para empresas con Vertex AI, permite realizar composiciones potentes y explorar sin límites. También creamos Lyria RealTime, nuestro modelo de generación de música interactivo cuya tecnología se usa para MusicFX DJ, disponible a través de una API y en AI Studio. Con Lyria RealTime, todos pueden crear, controlar y tocar música generada por IA en tiempo real de forma interactiva.

Creación y colaboración responsables con la comunidad creativa

A partir de su lanzamiento en 2023, SynthID ha incluido marcas de agua en más de 10.000 millones de imágenes, videos, archivos de audio y textos, con el objetivo de identificar el contenido generado por IA y disminuir las posibilidades de que se proporcione información y atribución erróneas. Los resultados generados por Veo 3, Imagen 4 y Lyria 2 seguirán teniendo marcas de agua de SynthID.

Hoy lanzamos SynthID Detector, un portal de verificación para ayudar a las personas a identificar contenido generado por IA. Cuando subas contenido, esta herramienta identificará si todo el archivo o solo una parte incluye SynthID.

Con todos nuestros modelos de IA generativa, buscamos liberar el potencial creativo de los seres humanos y brindarles a los artistas y creadores las herramientas necesarias para que hagan realidad sus ideas de forma más rápida y fácil, como nunca antes.

Publicado en: