Découvrez Gemini Omni
L'année dernière, Nano Banana a mis l'intelligence de Gemini au service de la génération et de la retouche d'images. Depuis, des millions de personnes l’utilisent pour restaurer de vieilles photos, créer à partir d'esquisses ou donner vie à leurs idées. Depuis le début, nous avons conçu Gemini pour être nativement multimodal, et aujourd'hui, nous franchissons une nouvelle étape.
Voici Gemini Omni, la rencontre entre la capacité de raisonnement de Gemini et le pouvoir de la création. Omni est notre nouveau modèle capable de tout créer à partir de n'importe quelle entrée, en commençant par la vidéo. Avec Omni, combinez images, audio, vidéo et texte pour générer des vidéos de haute qualité, enrichies par la connaissance du monde réel de Gemini. Et retouchez vos vidéos simplement, en discutant.
Nous lançons aujourd'hui le premier modèle de la famille Omni: Gemini Omni Flash, dans l'application Gemini, Google Flow et YouTube Shorts. À terme, nous prendrons en charge d'autres modalités de sortie, comme l'image et l'audio. Voici ce qui rend Omni vraiment unique :
Retouchez vos vidéos dans une conversation
Avec Gemini Omni, retoucher une vidéo devient aussi simple qu'une conversation. Chaque instruction s'appuie sur la précédente. Vos personnages restent cohérents, la physique est respectée et la scène garde la mémoire de ce qui s'est passé avant.
Transformez ce qui vous entoure. Modifiez un détail ou changez tout. Votre vidéo devient le point de départ de quelque chose que vous n'auriez jamais pu filmer vous-même.
Prompt: Make the sculpture out of bubbles.
Réinventez l'action . Partez d'une vidéo existante et demandez à Omni de changer ce qui se passe : modifiez l'action, introduisez de nouveaux personnages ou objets, ou transformez un instant en quelque chose d'inattendu.
Prompt: When the person touches the mirror, make the mirror ripple beautifully like liquid, and the person's arm turns into reflective mirror material.
Prompt: Dim the lights in the room. Put a black and white checkerboard room inside a glass sphere that floats tracking above the hand, inside it contains a recursive representation of the same hand holding the sphere, creating an infinite recursive of rooms. Camera slowly gets closer into the sphere, creating a video loop.
Prompt: The lights of the apartments start turning on in sync with the music.
Affinez au fil des échanges . Changez l'environnement, l'angle de vue, le style ou des détails précis, sans jamais perdre le fil de votre scène d'origine. Faites défiler le carrousel pour voir comment les modifications se superposent.
A video of a violinist playing a song.
Prompt: Transport the violinist to the image environment
Prompt: Change the camera angle to be over the violinist’s shoulder.
Donnez vie à vos idées, avec toute la connaissance de Gemini
Gemini Omni ne se contente pas de créer des scènes réalistes, il réfléchit à ce qui devrait se passer ensuite. En associant une compréhension intuitive des lois physiques aux connaissances de Gemini en histoire, en sciences et en culture, il fait le pont entre photoréalisme et narration.
Créez des visuels physiquement cohérents. Omni maîtrise mieux que jamais les forces comme la gravité, l'énergie cinétique ou la dynamique des fluides, pour des scènes toujours plus réalistes.
Prompt: A marble rolling fast on a chain reaction style track, continuous smooth shot.
Associez connaissances et créativité. Omni puise dans les connaissances de Gemini pour tisser des liens entre langage, images et sens, bien au-delà de la simple reconnaissance de formes.
Prompt: The video shows items of the alphabet. An unusual item starting with each letter is shown sitting on a table (like a Capybara for C, disco globe for D and Lava Lamp for L). All 26 letters must be represented by 26 items with matching lower thirds displaying the letter. Only one item and lower third at a time. Each lower third must look like a black marker written on a slip of paper in the bottom left. Rapid fire, roughly 9 frames per item at 24FPS. Last frame is a slip of paper "THE END". The whole video is accompanied by calm smooth music.
Des idées complexes, mises en images. Omni peut créer des contenus explicatifs percutants à partir de simples requêtes, en générant des visuels qui clarifient les idées plus complexes.
Prompt: Claymation explainer of protein folding, everything is made out of clay, no hands, stop motion, accurate
Créez des vidéos à partir de n'importe quelle combinaison d'éléments
Utilisez n'importe quelle référence. Omni transforme toute source (image, texte, vidéo ou audio) en un résultat unique et cohérent. Dans un premier temps, seules les références vocales seront prises en charge pour l'audio, mais nous déploierons d'autres types de sources audio très prochainement.
Prompt: Dynamic sci-fi film style video based on image_0.png. Elements light up similar to video_0.mp4 synchronized to the beat of the music from audio_0.wav
Prompt: Referring to the extreme camera movement, perspective, and distortion in video-0, create a front-facing full-body walk cycle of the character from image-0, quickly style-shifting into multiple visual styles during the walk cycle, starting from realistic cinema. Keep the environment, only change styles. Hard cut backgrounds always centering the sky. Continuous walking, continuous audio, and style shifts in perfect sync to the beat of the audio. Cinematic, 16:9.
Prompt: Add harp sounds synchronized to when I touch each fern leaf. Change the leaf structure to all resemble semi translucent 3d bioluminescent plant life, with bioluminescent fireflies flying around it that react as I play, in sync with the sounds, subtle bokeh depth of field dynamic lighting, reflecting off the walls in the room, keeping the room structure the same
Partez de ce que vous avez. Utilisez des images de personnages, de décors ou de dessins comme références pour créer quelque chose qui correspond exactement à votre vision.
Prompt: Imagine the world gradually changing into retro futuristic style (grainy and moody as image-1) as I walk. Use the audio for a retro-futuristic background music. 10s.
Prompt: turn this into realistic footage, using the drawing only as a guide for movement, do not show the drawing in the final video
Prompt: Apply the pose and motion from input video to provided character from this image. Apply style from image reference to the new video
Appliquez des styles, des mouvements, des effets. Définissez l'identité visuelle de votre vidéo avec des références ou décrivez-la en quelques mots. Omni les harmonise pour créer une vidéo cohérente et soignée.
Prompt: edit this keeping everything the same. add animated motion effects coming out of the skateboard
Prompt: Apply the motion of the whale swimming from the provided video to the provided image of fluid reflective material. Do not show the whale or water; instead, have this reflective moving material form a shape that resembles the whale as it swims. Replace water with white smooth material shapes that move
Créez des vidéos avec votre avatar numérique
Nous nous engageons à développer l'IA de manière responsable et avons établi des règles claires pour protéger les utilisateurs contre tout préjudice et encadrer l'utilisation de nos outils d'IA. Pour commencer, vous pouvez créer des vidéos avec votre propre voix grâce aux Avatars, qui génèrent un double numérique vous permettant de produire des vidéos à votre image et avec votre voix. Au-delà de cette fonctionnalité d'avatar, en ce qui concerne le montage vidéo visant à modifier l'audio et la parole, nous effectuons encore des tests pour mieux comprendre comment proposer cette option à nos utilisateurs de façon responsable.
Toutes les vidéos créées avec Omni intègrent le filigrane numérique imperceptible SynthID Vous pouvez vérifier facilement qu'une vidéo a été générée avec Gemini Omni depuis l'application Gemini, Gemini dans Chrome ou Google Search. Pour en savoir plus sur le développement de nos outils de transparence et de vérification, conçus pour vous aider à comprendre comment les contenus sont créés et modifiés sur le web, consultez notre article de blog.
Essayez Gemini Omni dès maintenant
Aujourd'hui, nous lançons le premier modèle de la famille Omni : Gemini Omni Flash.
Gemini Omni Flash est disponible dès aujourd'hui pour tous les abonnés Google AI Plus, Pro et Ultra dans le monde entier via l’application Gemini et Google Flow. Il est également accessible gratuitement sur YouTube Shorts et YouTube Create App à partir de cette semaine.
Dans les prochaines semaines, développeurs et clients entreprise pourront y accéder via des API.