Presentamos Gemini Omni
El año pasado, Nano Banana incorporó la inteligencia de Gemini en la generación y edición de imágenes. Desde entonces, ha ayudado a millones de personas a restaurar fotografías antiguas, generar diseños a partir de bocetos y visualizar ideas de maneras que antes eran impensadas. Desde el principio, diseñamos Gemini para que fuera multimodal de forma nativa, y ahora estamos dando el siguiente paso.
Presentamos Gemini Omni, donde la habilidad de Gemini para razonar se fusiona con su habilidad de crear. Omni es nuestro nuevo modelo capaz de crear cualquier cosa a partir de cualquier entrada, comenzando con video. Con Omni, puedes combinar entradas de imágenes, audio, videos y texto para generar videos de alta calidad basados en los conocimientos de Gemini del mundo real. También puedes editar tus videos fácilmente a través de conversaciones.
Hoy lanzamos Gemini Omni Flash, el primer modelo de la familia Omni, para la app de Gemini, Google Flow y YouTube Shorts. Próximamente, ofreceremos compatibilidad con modalidades de resultados como imágenes y audio. A continuación te mostramos qué es lo que hace especial a Omni:
Edita tus videos a través de conversaciones
Gemini Omni te permite editar videos más fácilmente: usando lenguaje natural. Cada instrucción se basa en la anterior. Tus personajes mantienen una coherencia, las leyes físicas se respetan y la escena recuerda qué pasó antes.
Transforma el mundo a tu alrededor. Cambia elementos específicos o absolutamente todo. Tu video es el punto de partida de algo que nunca hubieras podido filmar por tu cuenta.
Prompt: Make the sculpture out of bubbles.
Reimagina la acción. Usa un video que hayas tomado para pedirle a Omni que cambie lo que está sucediendo. Edita la acción, agrega nuevos objetos o personajes, o transforma un momento en una situación inesperada.
Prompt: When the person touches the mirror, make the mirror ripple beautifully like liquid, and the person's arm turns into reflective mirror material.
Prompt: Dim the lights in the room. Put a black and white checkerboard room inside a glass sphere that floats tracking above the hand, inside it contains a recursive representation of the same hand holding the sphere, creating an infinite recursive of rooms. Camera slowly gets closer into the sphere, creating a video loop.
Prompt: The lights of the apartments start turning on in sync with the music.
Mejora tus videos en múltiples tomas. Cambia el ambiente, el ángulo, el estilo o incluso detalles específicos, sin perder el hilo de tu escena original.
A video of a violinist playing a song.
Prompt: Transport the violinist to the image environment
Prompt: Change the camera angle to be over the violinist’s shoulder.
Da vida a tus ideas basadas en los conocimientos de Gemini
Gemini Omni no solo crea escenas que parecen reales, también razona sobre lo que debería pasar a continuación. Combina la comprensión intuitiva de la física con los conocimientos de historia, ciencia y el contexto cultural de Gemini, generando un puente entre el fotorrealismo y la narración significativa.
Crea imágenes con física más precisa. Omni tiene una mejor comprensión intuitiva de fuerzas como la gravedad, la energía cinética y la dinámica de fluidos, lo que te permite crear escenas más realistas.
Prompt: A marble rolling fast on a chain reaction style track, continuous smooth shot.
Combina el conocimiento con la creatividad. Omni se basa en los conocimientos de Gemini para conectar el lenguaje, las imágenes y el significado de maneras que van más allá de la coincidencia de patrones.
Prompt: The video shows items of the alphabet. An unusual item starting with each letter is shown sitting on a table (like a Capybara for C, disco globe for D and Lava Lamp for L). All 26 letters must be represented by 26 items with matching lower thirds displaying the letter. Only one item and lower third at a time. Each lower third must look like a black marker written on a slip of paper in the bottom left. Rapid fire, roughly 9 frames per item at 24FPS. Last frame is a slip of paper "THE END". The whole video is accompanied by calm smooth music.
Ideas complejas convertidas en imágenes. Omni puede crear explicaciones atractivas a partir de instrucciones cortas y así generar elementos visuales que desglosen ideas más complejas.
Prompt: claymation explainer of protein folding, everything is made out of clay, no hands, stop motion, accurate
Crea videos a partir de cualquier combinación de entradas
Usa la referencia que quieras. Omni convierte cualquier referencia (imágenes, videos o audio) en un resultado único y coherente. Si bien al principio solo se admitirán referencias de voz para el audio, próximamente implementaremos otros tipos de entrada de audio.
Prompt: Dynamic sci-fi film style video based on image_0.png. Elements light up similar to video_0.mp4 synchronized to the beat of the music from audio_0.wav
Prompt: Referring to the extreme camera movement, perspective, and distortion in video-0, create a front-facing full-body walk cycle of the character from image-0, quickly style-shifting into multiple visual styles during the walk cycle, starting from realistic cinema. Keep the environment, only change styles. Hard cut backgrounds always centering the sky. Continuous walking, continuous audio, and style shifts in perfect sync to the beat of the audio. Cinematic, 16:9.
Prompt: Add harp sounds synchronized to when I touch each fern leaf. Change the leaf structure to all resemble semi translucent 3d bioluminescent plant life, with bioluminescent fireflies flying around it that react as I play, in sync with the sounds, subtle bokeh depth of field dynamic lighting, reflecting off the walls in the room, keeping the room structure the same
Empieza con lo que tienes. Con las referencias de entrada, puedes usar imágenes de personajes, escenas o dibujos para crear lo que tengas en mente.
Prompt: Imagine the world gradually changing into retro futuristic style (grainy and moody as image-1) as I walk. Use the audio for a retro-futuristic background music. 10s.
Prompt: turn this into realistic footage, using the drawing only as a guide for movement, do not show the drawing in the final video
Prompt: Apply the pose and motion from input video to provided character from this image. Apply style from image reference to the new video
Aplica estilos, movimiento o efectos. Determina el lenguaje visual con referencias de entrada o simplemente usa lenguaje natural. Omni combina estas referencias para crear un video coherente.
Prompt: edit this keeping everything the same. add animated motion effects coming out of the skateboard
Prompt: Apply the motion of the whale swimming from the provided video to the provided image of fluid reflective material. Do not show the whale or water; instead, have this reflective moving material form a shape that resembles the whale as it swims. Replace water with white smooth material shapes that move
Crea videos usando tu propio avatar digital
Nos comprometemos a desarrollar la IA de forma responsable y contamos con políticas claras para proteger a los usuarios y regular el uso de nuestras herramientas de IA. Para empezar, puedes crear vídeos con tu propia voz utilizando avatares, que crean una versión digital de ti mismo para que puedas generar vídeos que se vean y suenen como tú. Más allá de la función de avatares, en lo que respecta a la edición de vídeos para cambiar el audio y la voz, todavía estamos trabajando para probar esta función y comprender mejor cómo podemos ofrecer esta capacidad a los usuarios de forma responsable.
Todos los videos creados con Omni incluyen nuestra marca de agua imperceptible de SynthID. Puedes verificar fácilmente que los videos se generaron con Gemini Omni a través de la aplicación Gemini, Gemini en Chrome y la Búsqueda de Google. Puedes obtener más información sobre cómo estamos ampliando nuestras herramientas de transparencia y verificación de contenido para ayudarte a comprender cómo se creó y editó el contenido en la web en nuestra entrada de blog.
Prueba Gemini Omni hoy mismo
Hoy lanzamos Gemini Omni Flash para todos los suscriptores de Google AI Pro y Ultra del mundo a través de la app de Gemini y Google Flow. Además, estará disponible sin costo para usuarios de YouTube Shorts y la app de YouTube Create a partir de esta semana.
En las próximas semanas, los desarrolladores y los clientes empresariales también podrán acceder al modelo a través de APIs.