Conheça o Gemini Omni
No ano passado, o Nano Banana trouxe a inteligência do Gemini para a geração e edição de imagens. Desde então, ele ajudou milhões de pessoas a restaurar fotos antigas, criar a partir de esboços e visualizar ideias de formas que antes não eram possíveis. Desde o início, desenvolvemos o Gemini para ser multimodal de maneira nativa, e agora estamos dando o próximo passo.
Apresentamos o Gemini Omni, onde a capacidade de raciocínio do Gemini se une à capacidade de criação. Com o Omni, você pode combinar imagens, áudio, vídeo e texto como entrada e gerar vídeos de alta qualidade baseados no conhecimento de mundo do Gemini. Além disso, você pode editar facilmente seus vídeos por meio de conversas.
Hoje, estamos lançando o primeiro modelo da família Omni: o Gemini Omni Flash, disponível no app do Gemini, no Google Flow e no YouTube Shorts. Nos próximos meses, vamos oferecer suporte a outras modalidades de saída, como imagem e áudio. Veja o que torna o Omni tão especial:
Edite seus vídeos enquanto conversa
O Omni oferece uma forma mais simples de editar vídeos — com linguagem natural. Cada instrução se baseia na anterior. Os personagens permanecem consistentes, a física se sustenta e a cena lembra o que veio antes.
Transforme o mundo ao seu redor. Mude elementos específicos ou mude tudo. Seu vídeo se torna o ponto de partida para algo que você nunca poderia ter filmado sozinho.
Prompt: Make the sculpture out of bubbles.
Reimagine a ação. Escolha um vídeo que você gravou e peça ao Omni para mudar o que está acontecendo. Edite a ação, adicione novos personagens ou objetos, ou transforme um momento em algo inesperado.
Prompt: When the person touches the mirror, make the mirror ripple beautifully like liquid, and the person's arm turns into reflective mirror material.
Prompt: Dim the lights in the room. Put a black and white checkerboard room inside a glass sphere that floats tracking above the hand, inside it contains a recursive representation of the same hand holding the sphere, creating an infinite recursive of rooms. Camera slowly gets closer into the sphere, creating a video loop.
Prompt: The lights of the apartments start turning on in sync with the music.
Refine seus vídeos em várias interações. Mude o ambiente, o ângulo, o estilo ou até mesmo detalhes específicos, sem nunca perder a essência da sua cena original.
A video of a violinist playing a song.
Prompt: Transport the violinist to the image environment
Prompt: Change the camera angle to be over the violinist’s shoulder.
Dê vida às suas ideias com o conhecimento de mundo do Gemini
O Omni não se limita a criar cenas que parecem reais, ele também raciocina sobre o que deve acontecer a seguir. Ele combina uma compreensão intuitiva da física com o conhecimento do Gemini sobre história, ciência e contexto cultural, fazendo a ponte entre o fotorrealismo e a narrativa significativa.
Crie imagens com física mais precisa. O Omni tem uma compreensão intuitiva aprimorada de forças como a gravidade, a energia cinética e a dinâmica dos fluidos, permitindo que você crie cenas mais realistas.
Prompt: A marble rolling fast on a chain reaction style track, continuous smooth shot.
Combine conhecimento e criatividade. O Omni usa o conhecimento do Gemini para conectar linguagem, imagem e significado de formas que vão muito além da correspondência de padrões.
Prompt: The video shows items of the alphabet. An unusual item starting with each letter is shown sitting on a table (like a Capybara for C, disco globe for D and Lava Lamp for L). All 26 letters must be represented by 26 items with matching lower thirds displaying the letter. Only one item and lower third at a time. Each lower third must look like a black marker written on a slip of paper in the bottom left. Rapid fire, roughly 9 frames per item at 24FPS. Last frame is a slip of paper "THE END". The whole video is accompanied by calm smooth music.
Transforme ideias complexas em recursos visuais. O Omni pode criar explicações envolventes a partir de comandos curtos, gerando recursos visuais que simplificam ideias mais complexas.
Prompt: claymation explainer of protein folding, everything is made out of clay, no hands, stop motion, accurate
Crie vídeos a partir de qualquer combinação de entradas
Use qualquer referência. O Omni transforma qualquer tipo de referência — imagem, texto, vídeo ou áudio — em uma saída única e coesa. No início, apenas referências de voz serão compatíveis com áudio, mas vamos disponibilizar outros tipos de entrada de áudio em breve.
Prompt: Dynamic sci-fi film style video based on image_0.png. Elements light up similar to video_0.mp4 synchronized to the beat of the music from audio_0.wav
Prompt: Referring to the extreme camera movement, perspective, and distortion in video-0, create a front-facing full-body walk cycle of the character from image-0, quickly style-shifting into multiple visual styles during the walk cycle, starting from realistic cinema. Keep the environment, only change styles. Hard cut backgrounds always centering the sky. Continuous walking, continuous audio, and style shifts in perfect sync to the beat of the audio. Cinematic, 16:9.
Prompt: Add harp sounds synchronized to when I touch each fern leaf. Change the leaf structure to all resemble semi translucent 3d bioluminescent plant life, with bioluminescent fireflies flying around it that react as I play, in sync with the sounds, subtle bokeh depth of field dynamic lighting, reflecting off the walls in the room, keeping the room structure the same
Comece com o que você tem. Com referências de entrada, você pode usar imagens de personagens, cenas ou desenhos para criar algo que se encaixe no que você tem em mente.
Prompt: Imagine the world gradually changing into retro futuristic style (grainy and moody as image-1) as I walk. Use the audio for a retro-futuristic background music. 10s.
Prompt: turn this into realistic footage, using the drawing only as a guide for movement, do not show the drawing in the final video
Prompt: Apply the pose and motion from input video to provided character from this image. Apply style from image reference to the new video
Aplique estilos, movimentos ou efeitos. Defina a linguagem visual usando referências de entrada ou simplesmente descreva-a em linguagem natural. O Omni combina as referências de entrada para criar um clipe coeso.
Prompt: edit this keeping everything the same. add animated motion effects coming out of the skateboard
Prompt: Apply the motion of the whale swimming from the provided video to the provided image of fluid reflective material. Do not show the whale or water; instead, have this reflective moving material form a shape that resembles the whale as it swims. Replace water with white smooth material shapes that move
Crie vídeos com o seu próprio avatar digital
Prevemos que alguns dos pedidos mais comuns de edição de vídeo envolvam alterações em áudio e fala. Estamos trabalhando para testar melhor essa funcionalidade e entender como disponibilizá-la aos usuários de forma responsável. Por enquanto, você pode criar vídeos com a sua própria voz usando o seu avatar de IA. Os avatares criam uma versão digital de você para que você possa gerar vídeos com a sua aparência e voz.
Todos os vídeos criados com o Omni incluem nossa marca d'água digital imperceptível SynthID e as Credenciais de Conteúdo C2PA. Você pode verificar facilmente se os vídeos foram gerados com o Gemini Omni pelo app do Gemini, pelo Gemini no Chrome e pela Pesquisa Google. Saiba mais sobre como estamos ampliando nossas ferramentas de transparência e verificação de conteúdo para ajudar você a entender como o conteúdo foi criado e editado na web em nosso post.
Teste já o Omni
O Gemini Omni Flash está sendo lançado hoje para todos os assinantes do Google AI Pro e Ultra em todo o mundo, pelo app do Gemini e pelo Google Flow. Também está sendo disponibilizado sem custo financeiro aos usuários do YouTube Shorts e do app YouTube Create a partir desta semana.
Nas próximas semanas, vamos disponibilizá-lo para desenvolvedores e clientes corporativos via APIs.