Accéder au menu principal
Blogue Google Canada

Google Cloud

Apporter Gemini aux organisations partout dans le monde



Tout au long de l’année 2023, nous avons présenté d’incroyables innovations en matière d’IA à nos clients et à l’ensemble de la communauté des développeurs et des utilisateurs, notamment: le superordinateur à l’IA pour former et servir des modèles d’IA générative; la prise en charge de l’IA générative dans Vertex, notre plateforme d’IA d’entreprise; Duet AI dans Google Workspace; et Duet AI pour Google Cloud. Nous avons livré un certain nombre de nouvelles capacités dans notre infrastructure optimisée pour l’IA avec des avancées notables dans les GPU, les TPU, les logiciels et compilateurs d’apprentissage automatique, la gestion de la charge de travail et autres; de nombreuses innovations dans Vertex AI; et une toute nouvelle suite de capacités avec les agents Duet AI dans les plateformes Google Workspace et Google Cloud.

Nous avons déjà constaté une croissance considérable du nombre de développeurs et d’utilisateurs. Par exemple, entre le deuxième et le troisième trimestre de cette année, le nombre de projets d’intelligence artificielle actifs sur Vertex AI a été multiplié par plus de 7. De grandes marques telles que Forbes, Formula E et Spotify utilisent Vertex AI pour créer leurs propres agents, et Anthropic, AI21 Labs et Cohere entraînent leurs modèles. L’étendue et la créativité des applications développées par les clients sont époustouflantes. Fox Sports crée un contenu plus attrayant. Priceline crée un concierge de voyage numérique. Six Flags crée un concierge numérique. Et Estée Lauder est en train de créer un gestionnaire de marque numérique.

Aujourd’hui, nous présentons un certain nombre de nouvelles capacités importantes dans notre pile d’IA pour soutenir Gemini, notre modèle le plus performant et le plus général à ce jour. Il a été conçu dès le départ pour être multimodal, ce qui signifie qu’il peut généraliser et comprendre, exploiter et combiner de manière fluide différents types d’informations, y compris le texte, le code, l’audio, l’image et la vidéo, de la même manière que les humains voient, entendent, lisent, écoutent et parlent simultanément de nombreux types d’informations différents.

La pile d’IA unifiée de Google Cloud

Dès aujourd’hui, Gemini fait partie d’une pile technologique d’IA intégrée et optimisée verticalement, qui se compose de plusieurs éléments importants, tous conçus pour fonctionner ensemble :

  • Infrastructure d’IA super évolutive: Google Cloud propose aux entreprises une infrastructure optimisée pour l'IA, la même que celle utilisée par Google pour former et servir des modèles. Nous vous proposons cette infrastructure dans nos régions cloud en tant que service, pour l'exécuter dans vos centres de données avec Google Distributed Cloud, et à la périphérie. L'ensemble de notre infrastructure d'IA a été conçu avec un codesign au niveau des systèmes afin d'améliorer l'efficacité et la productivité de l'entraînement, du réglage et de l'utilisation de l'IA.
  • Des modèles de classe mondiale: Nous continuons à fournir une gamme de modèles d'IA avec différentes compétences. Fin 2022, nous avons lancé notre modèle linguistique Pathways (PaLM), rapidement suivi par PaLM 2, et nous livrons maintenant Gemini Pro. Nous avons également introduit des modèles spécifiques à certains domaines, tels que Med-PaLM et Sec-PaLM.
  • Vertex AI - Plateforme d'IA d'entreprise pour les développeurs : Pour aider les développeurs à créer des agents et à intégrer l'IA dans leurs applications, nous avons rapidement amélioré Vertex AI, notre plateforme de développement de l'IA. Vertex AI aide les clients à découvrir, personnaliser, augmenter, déployer et gérer des agents construits à l'aide de l'API Gemini, ainsi que d'une liste de plus de 130 modèles d'IA open-source et tiers qui répondent aux normes strictes de sécurité et de qualité de Google pour les entreprises. Vertex AI s'appuie sur les contrôles intégrés de Google Cloud en matière de gouvernance des données et de confidentialité, et fournit également des outils pour aider les développeurs à utiliser les modèles de manière responsable et sûre. Vertex AI propose également Search and Conversation, des outils qui utilisent une approche « low code » pour développer des agents de recherche et de conversation sophistiqués qui peuvent fonctionner sur de nombreux canaux.
  • Duet AI - Agents d'IA assistée pour Workspace et Google Cloud : Duet AI est notre collaborateur doté d'une intelligence artificielle qui assiste les utilisateurs lorsqu'ils utilisent Google Workspace et Google Cloud. Duet AI dans Google Workspace, par exemple, aide les utilisateurs à écrire, à créer des images, à analyser des feuilles de calcul, à rédiger et à résumer des e-mails et des messages de chat, ainsi qu'à résumer des réunions. Duet AI dans Google Cloud, par exemple, aide les utilisateurs à coder, déployer, mettre à l'échelle et surveiller les applications, ainsi qu'à identifier et accélérer la résolution des menaces de cybersécurité.

Aujourd’hui, nous sommes heureux de faire des annonces dans chacun de ces domaines :

Renforcer notre infrastructure de classe mondiale

La taille et la complexité des modèles génétiques d'IA ont augmenté, tout comme leurs besoins en matière d'entraînement, de réglage et d'inférence. Par conséquent, la demande d'une infrastructure d'IA performante, hautement évolutive et rentable pour l'entraînement et l'utilisation des modèles augmente de façon exponentielle.

Ce n'est pas seulement vrai pour nos clients, mais aussi pour Google. Les TPU sont depuis longtemps à la base de la formation et de l'utilisation de produits alimentés par l'IA tels que YouTube, Gmail, Google Maps, Google Play et Android. En fait, Gemini a été formé et est servi à l'aide de TPU.

La semaine dernière, nous avons annoncé Cloud TPU v5p, notre accélérateur d'IA le plus puissant, le plus évolutif et le plus flexible à ce jour. La TPU v5p est 4 fois plus évolutive que la TPU v4 en termes de FLOPs disponibles par pod. En début d'année, nous avons annoncé la disponibilité générale de Cloud TPU v5e. Avec une amélioration de 2,7 fois la performance d'inférence par dollar dans un benchmark industriel par rapport à la TPU v4 de génération précédente, il s'agit de notre TPU le plus rentable à ce jour.

Nous avons également annoncé notre superordinateur à l’IA, une architecture de supercalculateur révolutionnaire qui utilise un système intégré de matériel aux performances optimisées, de logiciels ouverts, de cadres ML de premier plan et de modèles de consommation flexibles. AI Hypercomputer dispose d'une large gamme d'options d'accélération, y compris plusieurs classes de TPU de 5ème génération et de GPU NVIDIA.

Offrir nos derniers modèles révolutionnaires

Gemini est également notre modèle le plus flexible à ce jour, capable de fonctionner efficacement dans tous les domaines, des centres de données aux appareils mobiles. Gemini Ultra est notre modèle le plus grand et le plus performant pour les tâches très complexes, tandis que Gemini Pro est notre meilleur modèle pour la mise à l'échelle d'un large éventail de tâches, et Gemini Nano est notre modèle le plus efficace pour les tâches sur les appareils. Ses capacités de pointe amélioreront considérablement la façon dont les développeurs et les entreprises clientes construisent et mettent à l'échelle l'IA.

Aujourd'hui, nous avons également présenté une version améliorée de notre modèle d'image, Imagen 2, notre technologie de conversion de texte en image la plus avancée. Cette dernière version offre des capacités améliorées de photoréalisme, de rendu de texte et de génération de logos afin que vous puissiez facilement créer des images avec des superpositions de texte et générer des logos.

En outre, dans le prolongement de nos efforts concernant les modèles spécifiques à un domaine avec Med-PaLM, nous sommes ravis d'annoncer MedLM, notre suite de modèles adaptés au domaine médical. MedLM est disponible pour les clients de Vertex AI et leur permet de bénéficier de la puissance des modèles de base de Google, enrichis d'une expertise médicale.

Optimisation de la plate-forme Vertex AI avec Gemini

Aujourd'hui, nous annonçons que Gemini Pro est désormais disponible en avant-première sur Vertex AI. Il permet aux développeurs de créer des agents nouveaux et différenciés capables de traiter des informations sous forme de texte, de code, d'images et de vidéo à ce jour. Vertex AI vous aide à déployer et à gérer les agents en production, à évaluer automatiquement la qualité et la fiabilité des réponses des agents, ainsi qu'à les surveiller et à les gérer.

Vertex AI offre une prise en charge complète de Gemini, avec la possibilité de découvrir, de personnaliser, d'augmenter, de gérer et de déployer des agents conçus à partir de l'API Gemini, notamment :

  • De multiples façons de personnaliser les agents construits avec Gemini en utilisant vos propres données, y compris l'ingénierie de l'invite, le réglage fin basé sur l'adaptateur tel que l'adaptation de faible rang (LoRA), l'apprentissage par renforcement à partir du feedback humain (RLHF) et la distillation.
  • Des outils d'augmentation qui permettent aux agents d'utiliser les embeddings pour récupérer, comprendre et agir sur les informations du monde réel avec des blocs de construction configurables de génération augmentée de récupération (RAG). Vertex AI propose également des extensions permettant de prendre des mesures au nom des utilisateurs dans des applications tierces.
  • Grounding pour améliorer la qualité des réponses de Gemini et d'autres modèles d'IA en comparant les résultats à des sources de données Web et d'entreprise de haute qualité.
  • Un large éventail de contrôles qui vous aident à être sûr et responsable lors de l'utilisation de modèles d'IA génériques, y compris Gemini.

En plus de la prise en charge de Gemini dans Vertex AI, nous annonçons également aujourd'hui :

  • Automatic Side by Side (Auto SxS), un outil automatisé pour comparer les modèles. Auto SxS est plus rapide et plus rentable que l'évaluation manuelle des modèles, et peut être personnalisé en fonction de diverses spécifications de tâches afin de gérer de nouveaux cas d'utilisation de l'IA générative.
  • L'ajout de Mistral, ImageBind et DITO dans le Model Garden de Vertex AI, poursuivant notre engagement envers un écosystème de modèles ouvert.
  • Nous intégrerons bientôt Gemini Pro à Vertex AI Search and Conversation pour vous aider à créer rapidement des applications attrayantes de niveau production.

Extension des capacités de Duet AI

Avec Duet AI, nous nous engageons à aider nos clients à accroître leur productivité, à obtenir des avantages concurrentiels et, en fin de compte, à améliorer leurs résultats. Aujourd'hui, Duet AI for Developers et Duet AI in Security Operations sont généralement disponibles, et nous intégrerons Gemini dans notre portefeuille Duet AI au cours des prochaines semaines.

Duet AI for Developers aide les utilisateurs à coder plus rapidement grâce à la complétion de code IA, à la génération de code et au chat dans plusieurs environnements de développement intégrés (IDE). Il rationalise les tâches et les processus répétitifs des développeurs grâce à des raccourcis pour les tâches courantes, notamment la génération de tests unitaires et l'explication du code, accélère le dépannage et la résolution des problèmes, et contribue à réduire les changements de contexte. Duet AI accélère également l'apprentissage basé sur les compétences en donnant aux utilisateurs la possibilité de poser des questions par le biais d'un chat en langage naturel.

Aujourd'hui, nous annonçons également que plus de 25 partenaires d'aide au codage et de bases de connaissances fourniront des ensembles de données spécifiques à leurs plateformes, de sorte que les utilisateurs de Duet AI for Developers puissent bénéficier d'une assistance IA basée sur les modèles de codage et de données des partenaires, la documentation produit, les meilleures pratiques et d'autres ressources d'entreprise utiles.

Duet AI in Security Operations, la plateforme unifiée d'opérations de sécurité de Google Cloud, peut permettre aux défenseurs de protéger plus efficacement leurs organisations contre les cyberattaques. Les équipes de sécurité peuvent améliorer leurs compétences et accélérer la détection des menaces, les enquêtes et les réponses grâce à la puissance de l'IA générique. Avec Duet AI in Security Operations, nous offrons une assistance IA d'abord dans Chronicle, où les utilisateurs peuvent rechercher de vastes quantités de données en quelques secondes avec des requêtes personnalisées générées à partir du langage naturel, réduire les examens manuels qui prennent du temps, faire ressortir rapidement le contexte critique en tirant parti des résumés automatiques des données de cas et des alertes, et améliorer le temps de réponse en utilisant des recommandations pour les étapes suivantes afin de soutenir la remédiation de l'incident.

Google est propriétaire de l'ensemble de la pile technologique Duet AI, de l'infrastructure et des modèles de base à l'intégration de haut niveau et à l'expérience utilisateur. Nous sommes fiers que nos ingénieurs et nos chercheurs collaborent de manière unique pour offrir aux clients nos dernières avancées technologiques en matière d'IA, avec une expérience produit cohérente et unifiée. Au début de l'année prochaine, nous prévoyons d'étendre Duet AI à l'ensemble de notre portefeuille, y compris Duet AI dans BigQuery, Looker, nos produits de base de données, Apigee, et plus encore.

Propulser la prochaine génération de solutions d'IA

En plus de ces nouvelles capacités à travers notre pile technologique d'IA intégrée verticalement, nous avons des prix compétitifs qui rendent Gemini accessible à plus d'organisations, et nous étendons notre indemnisation pour vous aider à vous protéger contre les problèmes de droits d'auteur.

La sortie de Gemini, combinée à notre portefeuille d'infrastructures d'IA super évolutives, Vertex AI et Duet AI, offre un nuage complet et puissant pour les développeurs et les clients. Grâce à ces innovations, Google Cloud propulse la prochaine génération d'agents alimentés par l'IA dans tous les secteurs, en permettant aux organisations de construire, d'utiliser et d'adopter avec succès l'IA générative pour alimenter leurs transformations numériques.