Presentamos Gemini Omni
El año pasado, Nano Banana llevó la inteligencia de Gemini a la generación y edición de imágenes. Desde entonces, ha ayudado a millones de personas a restaurar fotos antiguas, diseñar a partir de bocetos y visualizar ideas de formas que antes no eran posibles. Gemini siempre ha sido multimodal de forma nativa: así lo hemos desarrollado, y ahora vamos a dar un paso más.
Presentamos Gemini Omni, donde la capacidad de razonamiento de Gemini se une a su capacidad de crear. Omni es nuestro nuevo modelo que puede crear partiendo de cualquier entrada, empezando por vídeo. Con Omni, puedes combinar imágenes, audio, vídeo y texto para generar vídeos de gran calidad fundamentados en los conocimientos de Gemini sobre el mundo real. También puedes editar fácilmente tus vídeos con una simple conversación.
Hoy lanzamos el primer modelo de la familia Omni, Gemini Omni Flash, en la aplicación Gemini, Google Flow y YouTube Shorts. Con el tiempo, añadiremos modalidades de salida como imagen y audio. Estos son algunos de los motivos por los que Omni es especial:
Edita vídeos con una conversación
Gemini Omni te ofrece una manera más sencilla de editar vídeo: con lenguaje natural. Cada instrucción que recibe se suma a las anteriores. Los personajes tienen continuidad, no se rompen las leyes de la física y las escenas concuerdan con lo que ocurrió antes.
Transforma el mundo que te rodea. Cambia todo o solo elementos concretos. Tu vídeo es el punto de partida de algo que nunca podrías haber grabado por tu cuenta.
Prompt: Make the sculpture out of bubbles.
Recrea la acción. Toma un vídeo que hayas grabado y pídele a Omni que cambie lo que ocurre en él. Edita la acción, añade nuevos personajes u objetos, o transforma un momento en algo inesperado.
Prompt: When the person touches the mirror, make the mirror ripple beautifully like liquid, and the person's arm turns into reflective mirror material.
Prompt: Dim the lights in the room. Put a black and white checkerboard room inside a glass sphere that floats tracking above the hand, inside it contains a recursive representation of the same hand holding the sphere, creating an infinite recursive of rooms. Camera slowly gets closer into the sphere, creating a video loop.
Prompt: The lights of the apartments start turning on in sync with the music.
Perfecciona tus vídeos en varias revisiones. Cambia el entorno, el ángulo, el estilo o incluso detalles concretos, sin perder en ningún momento el hilo de la escena original.
A video of a violinist playing a song.
Prompt: Transport the violinist to the image environment
Prompt: Change the camera angle to be over the violinist’s shoulder.
Da vida a tus ideas con Gemini y su conocimiento del mundo real
Omni no se limita a crear escenas que parezcan reales: razona sobre lo que debería ocurrir a continuación. Combina una comprensión intuitiva de la física con los conocimientos de Gemini sobre historia, ciencia y contexto cultural, por lo que supone un salto del fotorrealismo a la narración con sentido.
Crea elementos visuales con una física más real. Omni comprende mejor, de manera intuitiva, fuerzas como la gravedad, la energía cinética y la dinámica de fluidos, por lo que te permite crear escenas más realistas.
Prompt: A marble rolling fast on a chain reaction style track, continuous smooth shot.
Mezcla conocimiento y creatividad. Omni se basa en los conocimientos de Gemini para conectar el lenguaje, las imágenes y el significado de formas mucho más avanzadas que si se limitara a seguir patrones.
Prompt: The video shows items of the alphabet. An unusual item starting with each letter is shown sitting on a table (like a Capybara for C, disco globe for D and Lava Lamp for L). All 26 letters must be represented by 26 items with matching lower thirds displaying the letter. Only one item and lower third at a time. Each lower third must look like a black marker written on a slip of paper in the bottom left. Rapid fire, roughly 9 frames per item at 24FPS. Last frame is a slip of paper "THE END". The whole video is accompanied by calm smooth music.
Visualiza ideas complejas.
Omni puede crear contenido explicativo a partir de una breve petición, generando elementos visuales que desglosen ideas más complejas.
Prompt: claymation explainer of protein folding, everything is made out of clay, no hands, stop motion, accurate
Crea vídeos a partir de distintos tipos de entradas
Usa las referencias que quieras. Omni convierte cualquier referencia (imagen, texto, vídeo o audio) en un único resultado cohesionado. Aunque inicialmente solo admite audios de voz, pronto se añadirán otros tipos de entradas de audio.
Prompt: Dynamic sci-fi film style video based on image_0.png. Elements light up similar to video_0.mp4 synchronized to the beat of the music from audio_0.wav
Prompt: Referring to the extreme camera movement, perspective, and distortion in video-0, create a front-facing full-body walk cycle of the character from image-0, quickly style-shifting into multiple visual styles during the walk cycle, starting from realistic cinema. Keep the environment, only change styles. Hard cut backgrounds always centering the sky. Continuous walking, continuous audio, and style shifts in perfect sync to the beat of the audio. Cinematic, 16:9.
Prompt: Add harp sounds synchronized to when I touch each fern leaf. Change the leaf structure to all resemble semi translucent 3d bioluminescent plant life, with bioluminescent fireflies flying around it that react as I play, in sync with the sounds, subtle bokeh depth of field dynamic lighting, reflecting off the walls in the room, keeping the room structure the same
Empieza con lo que tengas. Con las referencias de entrada, puedes usar imágenes de personajes, escenas o dibujos para crear lo que estés imaginando.
Prompt: Imagine the world gradually changing into retro futuristic style (grainy and moody as image-1) as I walk. Use the audio for a retro-futuristic background music. 10s.
Prompt: turn this into realistic footage, using the drawing only as a guide for movement, do not show the drawing in the final video
Prompt: Apply the pose and motion from input video to provided character from this image. Apply style from image reference to the new video
Aplica estilos, movimiento o efectos. Define el lenguaje visual introduciendo referencias o, simplemente, descríbelo con lenguaje natural. Omni combina las referencias de entrada para crear un vídeo cohesionado.
Prompt: edit this keeping everything the same. add animated motion effects coming out of the skateboard
Prompt: Apply the motion of the whale swimming from the provided video to the provided image of fluid reflective material. Do not show the whale or water; instead, have this reflective moving material form a shape that resembles the whale as it swims. Replace water with white smooth material shapes that move
Crea vídeos con tu propio avatar digital
Tenemos el compromiso de desarrollar la IA responsablemente y hemos establecido políticas claras para proteger a los usuarios y para regular el uso de nuestras herramientas de IA. Para empezar, puedes crear vídeos con tu propia voz usando la función Avatar, que crea una versión digital de ti que puedes usar para generar vídeos con tu apariencia y tu forma de hablar. Adicionalmente, estamos trabajando en otras maneras de editar el audio y la voz de los vídeos, todavía en fase de pruebas para asegurarnos de que podemos ofrecerlo a los usuarios de forma responsable.
Todos los vídeos creados con Omni incluyen nuestra marca de agua digital SynthID. Puedes verificar fácilmente si un vídeo se ha generado con Gemini Omni usando la aplicación Gemini, Gemini en Chrome o la Búsqueda de Google. También puedes consultar en nuestro blog más información sobre nuestras iniciativas para mejorar la transparencia del contenido y las herramientas de verificación, de modo que puedas saber cómo se ha creado y editado el contenido de la Web.
Ya puedes probar Omni
Hoy se lanza el primer modelo de la familia Omni, Gemini Omni Flash, para todos los suscriptores de Google AI Plus, Pro y Ultra de todo el mundo, a través de la aplicación Gemini y de Google Flow. También se va a lanzar sin coste para los usuarios de YouTube Shorts y la aplicación YouTube Create esta semana.
Durante las próximas semanas lo pondremos también a disposición de desarrolladores y clientes empresariales, por medio de APIs.