I/O 2026 : Bienvenue dans l’ère agentique de Gemini
Note de l’éditeur : Ci-dessous se trouve une transcription des remarques du PDG de Google, Sundar Pichai, à la conférence Google I/O 2026. Cette transcription a été adaptée pour inclure plus de ce qui a été annoncé sur scène. Vous pouvez consulter toutes les annonces dans notre collection.
L’année a été extraordinaire depuis notre dernier I/O, une période sans repos d’expédition, d’avancement technologique et de grands progrès. Nous sommes maintenant à l’étape du cycle où les personnes veulent voir la valeur des produits qu’ils utilisent au quotidien. Nous nous sommes concentrés sur cette facette, et vous pourrez le constater dans les produits et les fonctionnalités que nous annoncerons aujourd’hui lors d’I/O.
Il s’est écoulé 10 ans depuis que nous avons fait de Google une compagnie axée sur l’IA, et nous voyons toujours l’IA comme la façon la plus importante de faire avancer notre mission et d’améliorer la vie des personnes à grande échelle. Voilà pourquoi nous avons pris une approche intégrale et différenciée pour l’innovation de l’IA, de notre silicium personnalisé et notre fondation sécurisée à nos produits et plateformes qui sont utilisés par des milliards de personnes. Cette approche nous permet d’itérer et d’innover plus rapidement de façon à élever chaque secteur de la compagnie.
C’est incroyable de voir comment les personnes utilisent l’IA, que ce soit un étudiant se préparant pour les examens de fin d’année avec l’appli Gemini, des musiciens et des artistes utilisant l’IA générative, comme Lyria et Veo, dans leur flux créatif, ou des développeurs codant et donnant vie à leur idée.
L’essor de l’IA dans l’ensemble de la pile technologique
Ces histoires sur comment les personnes utilisent l’IA sont la meilleure façon de mesurer le progrès. Pour comprendre dans quelle mesure les personnes adoptent l’IA, il faut tenir compte d’un autre élément important : les jetons, des unités de données fondamentales que nos modèles traitent, plusieurs représentant la résolution d’un problème.
Il y a deux ans, nous traitions 9,7 billions de jetons provenant de toutes nos surfaces, un nombre énorme. Lan dernier à I/O, ce nombre était passé à 480 billions de jetons. En date d’aujourd’hui, ce nombre a septuplé, passant à 3,2 mille billions par mois.
Cela nous dit quelque chose d’important sur nos produits et la façon dont d’autres conçoivent aussi, particulièrement les développeurs et les entreprises :
- Plus de 8,5 millions de développeurs développent maintenant de nouvelles applis et expériences avec nos modèles, tous les mois.
- Nos modèles d’API traitent maintenant près de 19 milliards de jetons par minute.
- Au cours des douze derniers mois, plus de 375 clients Google Cloud ont traité individuellement plus d’un billion de jetons, représentant une demande incroyable pour toutes les IA de l’industrie.
L’essor de nos produits
Aujourd’hui, nous avons 13 produits avec plus d’un milliard d’utilisateurs; 5 d’entre eux ont plus de trois milliards d’utilisateurs.
Nos modèles Gemini sont une des raisons principales pour lesquelles de plus en plus de personnes utilisent nos produits et pour lesquelles ils les utilisent plus.
Tout cela commence avec Recherche, qui met l’IA générative à profit pour plus de personnes que tout autre produit dans le monde. Les aperçus générés par l’IA ont désormais plus de 2,5 milliards d’utilisateurs actifs par mois. Et le mode IA a été une révélation, notre plus grande mise à niveau de Recherche à ce jour. Les personnes l’adorent, et en seulement une année, il a dépassé le milliard d’utilisateurs actifs par mois.
Lorsque les gens utilisent nos fonctionnalités propulsées par l’IA dans Recherche, ils utilisent encore plus Recherche. Ce moteur de recherche ne se limite plus aux requêtes individuelles et ressemble plus à une conversation continue, vous donnant des informations plus détaillées et vous connectant avec l’immensité du Web.
Un autre endroit où nous avons rapidement innové est l’appli Gemini. Lors de I/O l’an dernier, l’appli Gemini avait plus de 400 millions d’utilisateurs actifs par mois. Aujourd’hui, nous avons dépassé les 900 millions d’utilisateurs, plus du double en une année. Dans le même laps de temps, les requêtes quotidiennes ont plus que septuplé.
Nous avons ajouté plusieurs fonctionnalités uniques, comme l’Intelligence personnalisée, qui personnalise encore plus les réponses et les rend plus utiles. Et à ce jour, plus de 50 milliards d’images ont été générées avec notre modèle de génération d’image, Nano Banana. Il a fait fureur au cours de cette dernière année et il a montré à quel point il y a de la créativité cachée dans le monde.
IA conversationnelle naturelle dans les produits
Il y a aussi beaucoup de productivité cachée à découvrir. Au cours de la dernière année, nous avons permis des conversations plus naturelles avec Gemini directement dans nos produits. Récemment, Maps a eu sa plus grande mise à niveau de la décennie, dans laquelle la nouvelle fonctionnalité, Demander à Maps, était comprise. Les personnes utilisent Demander à Maps pour poser des questions plus longues et complexes.
Nous intégrons désormais une IA conversationnelle naturelle à plus de nos produits.
Demander à YouTube
Tous les jours, les personnes viennent sur YouTube pour poser des questions. Il y a beaucoup de bonnes vidéos, mais parfois, il est difficile de savoir par où commencer.
La fonctionnalité Demander à YouTube a entièrement réimaginé cette expérience, rendant l’information plus facile à comprendre et à naviguer. Vous verrez des vidéos qui correspondent plus à vos intérêts, et plus important encore, la fonctionnalité permet de passer directement au moment de la vidéo le plus pertinent pour vous.
Nous avons déjà commencé à tester la fonctionnalité Demander à YouTube, et elle sera déployée plus largement aux États-Unis cet été.
Docs Live propulsé par la voix
Il y a plusieurs moments où je voudrais effectuer mes tâches à la même vitesse que celle de ma parole. C’est dorénavant de plus en plus possible grâce aux pas de géant de la technologie dans nos modèles audio.
Une nouvelle fonctionnalité, Docs Live, fait passer les choses à un autre niveau. Avant, pour créer un document avec Gemini, il fallait écrire une requête précise. Avec Docs Live, il suffit de dire à voix haute ce qui nous passe par la tête et de laisser Gemini faire le reste.
Éventuellement, vous pourrez créer de nouveaux documents et les modifier directement, le tout avec votre voix. Docs Live sera offert aux abonnés cet été, et les capacités vocales puissantes seront aussi offertes avec Gmail et Keep.
Infrastructure soutenant l’innovation à grande échelle
C’est incroyable de voir la vitesse à laquelle l’innovation se déploie dans tous nos produits. Soutenir le tout à grande échelle pour nos utilisateurs tout en servant les entreprises et les développeurs du monde entier, nécessite des investissements massifs en matière d’infrastructure. Nous avons investi pour le présent et l’avenir. En 2022, nous dépensions 31 milliards USD annuellement en investissement. Cette année, c’est six fois plus que nous prévoyons, soit approximativement 190 milliards USD, et un élément important de cet investissement est notre silicium personnalisé.
Il y a dix ans, nous avons annoncé notre tout premier processeur tenseur commercial, ou TPU, sur la scène de I/O. Depuis, nous avons transformé la façon dont l’industrie développe pour l’IA. Nous avons récemment annoncé notre 8ᵉ génération de TPU lors de la conférence Cloud Next. Pour la première fois, nous avons pris une approche à double processeur avec une architecture spécialisée pour l’entraînement et l’interférence : les TPU 8t et 8i.
- Le TPU 8t est optimisé pour le pré-entraînement à grande échelle et a presque trois fois la puissance de calcul brute de la génération précédente. Nous avons pris une approche fondamentalement différente avec notre infrastructure d’entraînement. Avec JAX et Pathways, nos entraînements ne se limitent plus à un immense centre de données unique. À la place, nous pouvons désormais distribuer l’entraînement de façon fluide à travers plusieurs sites, répartissant ainsi l’entraînement sur plus d’un million de TPU à travers le monde. Cela nous permet de créer le plus grand groupe de secteurs d’entraînement au monde. Pour des concepteurs de modèles, cela veut dire qu’on peut entraîner des modèles plus grands et avec plus de capacités en quelques semaines plutôt qu’en quelques mois.
- Le TPU 8i est conçu pour l’interférence. Nous avons amélioré de façon spectaculaire la vitesse à chaque étape. S’il y a une chose que nous avons apprise de 27 ans de travail sur Recherche, c’est que la latence est importante.
En plus de la vitesse, nous avons aussi pensé à les rendre durables. Les deux processeurs sont plus écoénergétiques et peuvent fournir des performances par watt jusqu’à deux fois meilleures.
Gemini Omni
Ce progrès avec les TPU est la façon dont nous pouvons faire des avancées dans les calculs dans tous nos modèles, le codage et les agents. Grâce aux modèles mondiaux, l’IA est passée des textes prédictifs à la simulation de la réalité. Nous avons travaillé à repousser les limites de ce que les modèles peuvent faire.
Gemini Omni est notre nouveau modèle, capable de générer des échantillons, à partir de n’importe quel type d’entrée vers n’importe quel type de sortie. Nous commençons avec les sorties vidéo, et au fil du temps, nous permettrons les images en texte. Ce nouveau modèle combine l’intelligence de Gemini avec nos modèles de médias génératifs, un grand pas en avant dans le monde de la compréhension. Nous lançons le premier modèle de la famille Omni : Gemini Omni Flash.
Gemini Omni Flash est offert à partir d’aujourd’hui. Vous aurez la possibilité de l’essayer dans l’appli Gemini, dans Google Flow et dans YouTube Shorts. Nous l’offrirons aussi aux développeurs et aux entreprises via les API au cours des prochaines semaines.
Nouvelles mises à jour SynthID et nouveaux partenaires
À mesure que l’IA générative s’améliore, le besoin pour plus de transparence augmente aussi. Les études montrent que les personnes peuvent correctement identifier les vidéos d’hypertrucage de haute qualité seulement une fois sur quatre. Il y a trois ans, nous avons lancé SynthID, notre filigrane invisible à l’ œil nu. Depuis son lancement, SynthID a filigrané plus d’un milliard d’images et de vidéos, en plus de l’équivalent de 60 000 années d’éléments audio.
Un million de personnes utilisent notre détecteur SynthID dans l’appli Gemini pour vérifier du contenu généré par l’IA. Et nous faisons un pas de plus en ajoutant la vérification Content Credentials dans tous nos produits. Cette vérification vous montrera si le contenu a été généré par IA ou pris par un appareil photo, et s’il a été modifié avec des outils d’IA générative. Nous voulons que plus de personnes puissent accéder facilement à ces outils, nous intégrerons donc la vérification Content Credentials et SynthID à Recherche et à Chrome.
Bien sûr, cela ne peut fonctionner que si plus de partenaires décident de filigraner leur propre contenu généré par IA. Nvidia s’est inscrit à SynthID l’année dernière. Et aujourd’hui, nous sommes heureux d’annoncer que OpenAI, Kakao et Eleven Labs ont aussi adopté SynthID. C’est merveilleux de voir une collaboration se faire à travers les différentes industries. Nous sommes impatients de collaborer avec plus de partenaires et d’établir une nouvelle norme en matière de transparence pour l’ère de l’IA.
Gemini 3.5 Flash
Gemini 3 a été lancé il y a quelques mois, avec une famille complète de modèles. C’est notre série la plus adoptée à ce jour. Nous avons adoré voir les développeurs utiliser Flash comme disque quotidien et bâtir des expériences incroyables avec le raisonnement approfondi et les capacités multimodales de Pro. Nous avons travaillé fort à l’amélioration de ces modèles, en nous concentrant particulièrement sur le codage agentique, les tâches à long terme et les flux de travail réels.
Aujourd’hui, nous introduisons Gemini 3.5 Flash, notre première série de modèles combinant une intelligence et une action de pointe. Voici deux choses que je voudrais souligner :
- Lorsqu’on le compare à 3.1 Pro, 3.5 Flash est meilleur sur presque tous les points. Il a fait d’énormes progrès dans le codage, et que dire de l’avancée extraordinaire dans GDPVal. Plusieurs tâches économiques importantes réelles sont prises en charge.
Gemini 3.5 Flash est un modèle très capable, de pointe et comparable aux meilleurs modèles, mais tout de même très rapide. Voilà pourquoi lorsque l’on compare l’intelligence versus la vitesse de production du résultat, il est dans une ligue à part et parmi les meilleurs. Lorsque l’on prend en compte les jetons de sortie par seconde, il est quatre fois plus rapide que les autres modèles de pointe.
Ce nouveau modèle a changé la donne pour nous, à l’interne, chez Google. Nous utilisons 3.5 Flash avec une version réimaginée de notre plateforme de développement agentique, Antigravity, et il a grandement accéléré comment nous développons. En mars, nous avons traité un demi-billion de jetons par jour à l’interne sur tous nos outils d’IA pour les développeurs, et nous avons doublé ce nombre toutes les quelques semaines. Désormais, nous traitons plus de trois billions de jetons par jour. Cette augmentation a créé une puissante boucle de rétroaction nous permettant d’améliorer 3.5.
Ce qui est merveilleux à propos de Flash, c’est sa façon de fournir des capacités de pointe à la moitié du coût des modèles de pointe comparables. Nous avons entendu dire que plusieurs entreprises ont déjà dépassé leurs budgets annuels en jetons, et nous ne sommes qu’en mai. Si les entreprises utilisent un mélange de Flash et d’autres modèles de pointe, elles pourraient économiser beaucoup d’argent. Pour mettre ça en perspective, les entreprises ayant les plus gros volumes traitent environ un billion de jetons par jour. Si elles transféraient 80 % de leurs flux de travail d’un autre modèle de pointe vers 3.5 Flash, elles pourraient économiser plus d’un milliard USD annuellement. C’est une économie réelle qu’elles peuvent ensuite réinvestir dans leur entreprise.
Gemini 3.5 Flash est offert à tous à partir d’aujourd’hui, dans tous nos produits et API. Nous sommes aussi excités pour Gemini 3.5 Pro. Nous l’utilisons à l’interne, et il présente de grandes améliorations. Il sera lancé le mois prochain.
Antigravity 2.0
Nous offrons aussi 3.5 Flash aux développeurs dans Antigravity.
Antigravity va au-delà de l’environnement de codage, le transformant en une plateforme pour développer et gérer des cohortes d’agents IA autonomes. Cela comprend Antigravity 2.0, une nouvelle application pour ordinateur qui agit comme le point central pour les interactions de l’agent, où tous peuvent gérer les agents pour toutes sortes de tâches. Et nous développons une version encore plus optimisée de Flash; non pas 4 fois, mais bien 12 fois plus rapide que les autres modèles de pointe.
Les utilisateurs dans Antigravity peuvent avoir un aperçu de cette expérience dès aujourd’hui. Apprenez-en plus à propos de Antigravity 2.0 ici.
Gemini Spark est votre agent 24 heures sur 24, 7 jours sur 7
Gemini 3.5 et Antigravity ont débloqué un nouveau monde de capacités d’agent et agentiques. Nous les offrons aux développeurs et aux entreprises pour un certain temps. Nous sommes désormais vraiment axés à offrir la puissance des agents, de façon sécuritaire et sécurisée, aux clients afin qu’ils fonctionnent pour tous. Vous verrez des expériences agentiques sur plusieurs de nos produits aujourd’hui.
Je suis particulièrement excité à propos de Gemini Spark, votre agent IA personnel dans l’appli Gemini qui vous aide à naviguer dans votre vie numérique en effectuant des actions pour vous et sous votre supervision.
- Il s’exécute sur des machines virtuelles dédiées sur Google Cloud, et il fonctionne 24 heures sur 24, 7 jours sur 7 afin que vous n’ayez pas à garder votre ordinateur allumé.
- Il est propulsé par Gemini 3.5 et Google Antigravity, qui lui permettent de performer sur des tâches à long terme facilement et en arrière-plan.
- Spark s'intégrera facilement aux outils, à commencer par les nôtres, et dans des outils tiers via MCP au cours des prochaines semaines.
- Et vous pouvez travailler avec Spark quand cela vous convient, dans l’appli Gemini, et bientôt dans les courriels et les clavardages.
- Sur Android, vous pourrez voir, en direct, les mises à jour et les progrès des agents, comme Spark, dans une nouvelle IU appelée Android Halo, qui sera offerte plus tard cette année. Vers la fin de l’été, Spark s’exécutera directement dans Chrome, agissant comme un navigateur agentique sur le Web.
Nous commençons à déployer Gemini Spark pour les testeurs approuvés cette semaine, et la version bêta sera offerte aux abonnés à Google AI Ultra aux États-Unis la semaine prochaine.
Recherche à l’ère agentique
Gemini Spark est une première expérience rendue possible par les modèles 3.5 et par Antigravity. Cette combinaison nous offre de nouvelles façons d’accélérer notre mission et de transformer nos produits pour être radicalement plus utiles.
Alors que nous entrons dans l’ère agentique, Recherche sera plus utile et puissant que jamais. Aujourd’hui, nous présentons les agents informationnels dans Recherche. Ce sont des agents IA personnalisés qui vous permettent de planifier votre travail en arrière-plan, 24 heures sur 24, 7 jours sur 7, vous permettent de rechercher ce dont vous avez besoin au bon moment, et vous aident à agir. Les agents informationnels seront déployés cet été, en commençant par les abonnés à Google AI Pro et AI Ultra.
Une autre façon pour nous de bâtir un moteur de recherche agentique est en y introduisant les capacités de codage agentique. Avec la puissance de Gemini 3.5 Flash et de Google Antigravity, Recherche offrira des expériences personnalisées modulées pour vos questions uniques, comme des mises en page dynamiques et des rendus visuels interactifs. Ces capacités d’IU génératives seront offertes à tous dans Recherche cet été, sans frais.
.
Et pour des tâches nécessitant plus de temps pour s’exécuter et auxquelles vous devez revenir, Recherche fait un pas de plus en bâtissant des tableaux de bord persistants et personnalisés, ou des dispositifs de suivi dans lesquels vous pouvez suivre les progrès. Vous pouvez les voir comme de mini applis conçues spécifiquement pour vos tâches. Vous aurez la possibilité de créer des expériences personnalisées avec Antigravity, à même Recherche, dans les mois à venir, en commençant avec les abonnés à Google AI Pro et AI Ultra aux États-Unis.
Profitez encore plus de l’ère agentique de Gemini
Voici ce que nous avons aussi partagé à la I/O :
- Daily Brief est un autre agent qui sort de l’ordinaire et qui sera offert dans l’appli Gemini. Il vous offre des résumés personnalisés et synthétise l’information de votre boîte de réception, votre agenda et d’autres tâches pour trouver les choses les plus importantes à vous rappeler. Il ne fait pas qu’offrir des données résumées; il priorise, organise et suggère les prochaines étapes à faire afin que vous puissiez agir facilement, le tout dans un résumé super concis qui est conçu pour être allégé.
- Google Flow déploie, aujourd’hui et à tous, un nouvel agent qui peut planifier et raisonner dans des tâches complexes avec vos sorties, sous votre supervision. Intégré aux modèles Gemini, il apporte une expertise et une compréhension profonde de vos projets pour vous aider avec le remue-méninges, la création et la modification. Vous pouvez aussi faire du codage vibe avec n’importe quel outil de création, à même Flow, comme des outils de conception d’effets vidéo, d’animations dessinées à la main et de superposition de texte.
- Google Pics est votre nouvel outil de création et de modification d’image par IA, intégré à notre modèle Nano Banana le plus récent, qui vous aide à créer à peu près n’importe quoi avec les commandes de créations que vous voulez. Que ce soit pour concevoir un design pour un canva vierge ou pour modifier une photo existante, Pics traite chaque élément individuellement plutôt que comme une image statique et ennuyeuse. Cela vous permet de créer, de déplacer et de perfectionner des détails en particulier afin de donner vie à votre vision. Google Pics est offert aux testeurs approuvés et sera offert plus tard cet été aux abonnés à Google AI Pro et AI Ultra dans Workspace.
- Nous avons aussi partagé plus d'informations sur les lunettes intelligentes. Nous en avions déjà offert un aperçu l’année dernière, y compris les lunettes audio qui offrent une aide vocale dans votre oreille et les lunettes d’affichage qui vous montrent l’information dont vous avez besoin quand vous en avez besoin. Les deux vous permettent de garder les mains libres et la tête haute, avec l’aide de Gemini, juste en le demandant. Le lancement des lunettes audio se fera en premier plus tard cet automne.
- Gemini for Science combine plusieurs outils d’IA pour aider à accélérer la recherche scientifique. Conçu à partir du raisonnement approfondi et des capacités de recherche de Gemini ainsi qu’à partir de Deep Think et Deep Research, il comprend de nouvelles expériences dans Labs ainsi que Science Skills qui connecte les plateformes agentiques, comme Google Antigravity, à plus de 30 bases de données et outils scientifiques majeurs. Les utilisateurs peuvent montrer leur intérêt à essayer les expériences Gemini for Science dans Google Labs, et Science Skills sera offert à partir d’aujourd’hui sur Github et directement dans Antigravity.
Lorsque l’on regarde l’ensemble de la pile technologique de l’innovation, de l’infrastructure derrière le TPU 8i aux capacités de pointe de Gemini 3.5 et d’Antigravity, il est clair que nous sommes bel et bien dans l’ère agentique de Gemini. Je suis heureux de voir que cela permettra de débloquer de nouvelles façons d’accélérer notre mission et de transformer nos produits pour être radicalement plus utiles, pour tous, partout.
Vous pouvez consulter toutes les annonces ici.