Acceder al contenido

Potencia tu creatividad con nuevos modelos y herramientas multimedia generativos

[]

Potencia tu creatividad con nuevos modelos y herramientas multimedia generativos

20, May, 2025

Novedades de herramientas y modelos para desarrollar la creatividad

EliCollins1637

Eli Collins

VP, Google DeepMind

Hoy anunciamos nuestros últimos modelos multimedia generativos, que marcan avances importantes en la generación de este tipo de contenido. Estos modelos crean impactantes imágenes, vídeos y música, lo que permite que los artistas den vida a su visión creativa. Además, se integran en herramientas muy potentes con las que todo el mundo puede expresarse.

Veo 3 e Imagen 4, nuestros modelos de generación de imágenes y videos más recientes, llevan la generación de contenido multimedia más allá gracias a sus pioneras funciones. También vamos a extender el acceso a Lyria 2, con el que los músicos tendrán más herramientas para sus creaciones. Por último, invitamos a los narradores visuales a que prueben Flow, nuestra nueva herramienta de creación de películas con IA. Al utilizar los modelos más avanzados de Google DeepMind, Flow te permite crear películas cinematográficas con un control más sofisticado de las escenas, los estilos y los personajes, para que puedas contar tu historia.

Hemos colaborado estrechamente con creativos del sector (cineastas, músicos, artistas y creadores de YouTube) para dar forma a estos modelos y productos de manera responsable con el fin de ofrecer a los creadores nuevas herramientas con las que aplicar el poder de la IA en su arte.

Veo 3: Vídeos con audio

Veo 3, nuestro modelo de generación de vídeos de última generación, no solo mejora la calidad que ofrece Veo 2, sino que por primera vez también genera vídeos con audio, como el sonido del tráfico de fondo en una escena en las calles de una ciudad, el canto de los pájaros en un parque o incluso un diálogo entre personajes.

Veo 3 destaca consistentemente en las peticiones con imágenes y texto, en cómo recrea el mundo físico real y en la sincronización de labios. Tiene una gran capacidad de comprensión: le puedes contar una historia corta en tu petición y el modelo creará un vídeo en el que se haga realidad. Veo 3 está disponible desde hoy para los suscriptores de Gemini Ultra en Estados Unidos en la aplicación de Gemini y en Flow. También está disponible para usuarios de empresa en Vertex AI.

Veo 2: Nuevas funciones creadas con y para cineastas

A la vez que hemos anunciado Veo 3, también hemos añadido nuevas funciones a nuestro popular modelo Veo 2 inspiradas en nuestra colaboración con creadores y cineastas. Hoy lanzamos varias de ellas:

Nuestra avanzada función de generación de vídeos a partir de referencias permite proporcionar a Veo imágenes de personajes, escenas, objetos e incluso estilos para tener un mejor control creativo y mayor coherencia.
Los controles de cámara ayudan a definir movimientos de cámara precisos, como rotaciones, dollies y zooms, para lograr la toma perfecta.
La expansión de imagen te permite ampliar el encuadre para convertir tu vídeo de formato vertical a horizontal, lo que hace que sea más sencillo que encaje en cualquier pantalla y añade valor a la escena de forma inteligente.
La posibilidad de añadir y quitar objetos hace que puedas controlar lo que aparece en tus vídeos. Veo entiende las escalas, interacciones y sombras de forma que puede crear una escena natural y realista.

Los controles de cámara y la función de generación de vídeos a partir de referencias ya están disponibles en Flow. Y ofreceremos todas estas nuevas funciones en la API Vertex AI en las próximas semanas y en más productos en unos meses.

Flow: La herramienta de creación con IA para Veo

Flow es la herramienta de generación de vídeos con IA creada con y para creadores. Te permite crear escenas, historias y clips cinematográficos con los modelos más avanzados de Google DeepMind: Veo, Imagen y Gemini. Usa un lenguaje natural para describir tus tomas a Flow, gestiona los ingredientes de tu historia (personajes, localizaciones, objetos y estilos) desde un solo lugar y utiliza Flow para convertirlo todo en bellas escenas.

Flow está disponible desde hoy mismo para los suscriptores de Google AI Pro y Ultra en Estados Unidos, y próximamente en más países.

Imagen 4: Impresionante calidad y una tipografía superior

Nuestro modelo Imagen más reciente combina velocidad y precisión para crear imágenes impactantes. Imagen 4 ofrece una claridad extraordinaria en los pequeños detalles como intrincadas fibras, gotas de agua o pelaje animal, y sobresale en los estilos fotorrealista y abstracto. Imagen 4 puede crear imágenes en diferentes relaciones de aspecto y en una resolución de hasta 2K, o más si es para impresiones o presentaciones. También es superior en ortografía y tipografía, lo que hace que sea más fácil crear tarjetas, pósteres e incluso cómics.

imagen 3

Imagen 4 está disponible desde hoy en la aplicación de Gemini, Whisk y Vertex AI, además de en Vids, Presentaciones, Documentos y más en Workspace.

Pronto lanzaremos una versión rápida de Imagen 4 que es diez veces más rápida que Imagen 3, para que puedas explorar ideas a mayor velocidad.

Lyria 2: Potentes composiciones y exploración sin fin

En abril, ampliamos el acceso a Music AI Sandbox, basado en Lyria 2. Music AI Sandbox ofrece a músicos, productores y compositores una serie de herramientas experimentales, que pueden encender la chispa de la creatividad y ayudar a los artistas a explorar nuevas ideas musicales. La colaboración y los valiosos conocimientos de los músicos de la industria nos permiten asegurar que nuestras herramientas potencian la creatividad e invitan a los creadores a aprovechar las posibilidades de la IA en su arte.

Lyria 2 ofrece potentes composiciones y exploración sin fin y ya está disponible para los creadores en YouTube Shorts y para las empresas en Vertex AI. También ofrecemos Lyria RealTime, nuestro modelo de generación de música interactivo en el que se basa MusicFX DJ, a través de una API y en AI Studio. Lyria RealTime permite a todo el mundo crear, controlar y hacer música generativa en tiempo real.

Creación responsable y colaboración con la comunidad creativa

Desde su lanzamiento en el 2023, SynthID ha aplicado una marca de agua a más de 10.000 millones de imágenes, vídeos, archivos de audio y textos, para identificarlos como generados por IA y reducir así las posibilidades de desinformación y atribución errónea. Todo lo que se genere con Veo 3, Imagen 4 y Lyria 2 seguirán teniendo la marca de agua de SynthID.

Hoy, lanzamos SynthID Detector, un portal de verificación que ayuda a las personas a identificar contenido generado por IA. Solo hay que subir el contenido y SynthID Detector indica si todo el archivo o solo una parte tiene SynthID.

Con todos nuestros modelos de IA generativa queremos liberar la creatividad humana y ayudar a artistas y creadores a dar vida a sus ideas de una forma más rápida y sencilla que nunca antes.

Publicado en: