Mettere Gemini a disposizione delle aziende
Nel corso del 2023 abbiamo introdotto nuove e incredibili innovazioni nel campo dell'IA per i nostri clienti e per la comunità più ampia di sviluppatori e utenti, tra cui: AI Hypercomputer per addestrare e supportare i modelli di IA generativa; il supporto dell'IA generativa in Vertex, la nostra piattaforma di IA per le aziende; Duet AI per Google Workspace e Duet AI per Google Cloud. Abbiamo introdotto una serie di nuove funzionalità nella nostra infrastruttura ottimizzata per l'intelligenza artificiale, con notevoli progressi nelle GPU, nelle TPU, nel software e nei compilatori ML, nella gestione dei carichi di lavoro e altro ancora; diverse innovazioni in Vertex AI e un'intera nuova suite di funzionalità con gli agenti Duet AI in Google Workspace e Google Cloud Platform.
Abbiamo già registrato un'enorme crescita di sviluppatori e utenti. Ad esempio, tra il secondo e il terzo trimestre di quest'anno, il numero di progetti di intelligenza artificiale generativa attivi su Vertex AI è cresciuto di oltre 7 volte. Marchi leader di mercato come Forbes, Formula E e Spotify stanno utilizzando Vertex AI per creare i propri agenti, mentre Anthropic, AI21 Labs e Cohere stanno addestrando i loro modelli. La gamma e la creatività delle applicazioni che i clienti stanno sviluppando è sorprendente. Fox Sports sta creando contenuti più coinvolgenti. Priceline sta dando vita a un assistente digitale per i viaggi. Six Flags sta creando un concierge digitale. Ed Estée Lauder un brand manager digitale.
Oggi introduciamo una serie di nuove importanti funzionalità all’interno del nostro stack IA a supporto di Gemini, il nostro modello IA più grande e capace. Gemini è stato costruito fin dalle sue fondamenta per essere multimodale, il che significa che può generalizzare, comprendere, operare e combinare senza discontinuità diversi tipi di informazioni, tra cui testo, immagini, audio, video e codice informatico allo stesso modo in cui gli esseri umani vedono, sentono, leggono, ascoltano e parlano di molti tipi diversi di informazioni contemporaneamente.
Lo stack IA unificato di Google Cloud
A partire da oggi, Gemini farà parte di uno stack tecnologico di intelligenza artificiale integrato e ottimizzato verticalmente, composto da diversi elementi essenziali, tutti progettati per funzionare insieme:
- Infrastruttura IA super-scalabile: Google Cloud offre alle aziende un'infrastruttura leader ottimizzata per l'IA - la stessa utilizzata da Google - per addestrare e supportare i modelli. Offriamo questa infrastruttura in diverse modalità: as a sevice nelle nostre regioni cloud, tramite Google Distributed Cloud per l'utilizzo nei data center aziendali, e all'edge. Il nostro intero stack di infrastruttura IA è stato realizzato con un codesign a livello di sistema per incrementare l'efficienza e la produttività nell'ambito dell'addestramento, della messa a punto e del supporto dell’IA.
- Modelli di livello mondiale: continuiamo a fornire modelli di intelligenza artificiale con diverse abilità. Alla fine del 2022 abbiamo lanciato il nostro Pathways Language Model (PaLM), seguito a stretto giro da PaLM 2, e ora stiamo distribuendo Gemini Pro. Abbiamo anche introdotto modelli specifici per settore, come Med-PaLM e Sec-PaLM.
- Vertex AI - Piattaforma IA aziendale leader per gli sviluppatori: per aiutare gli sviluppatori a creare agenti e integrare l’IA generativa nelle loro applicazioni, abbiamo rapidamente migliorato Vertex AI, la nostra piattaforma di sviluppo IA. Vertex AI aiuta i clienti a scoprire, personalizzare, potenziare, implementare e gestire gli agenti costruiti utilizzando API Gemini, e un elenco curato di oltre 130 modelli di IA open-source e di terze parti che soddisfano i rigorosi standard di sicurezza e qualità di livello aziendale di Google. Vertex AI utilizza la governance dei dati e i controlli sulla privacy integrati di Google Cloud e fornisce strumenti per aiutare gli sviluppatori a utilizzare i modelli in modo responsabile e sicuro. Vertex AI offre inoltre Search and Conversation, strumenti che utilizzano un approccio low code per sviluppare sofisticati agenti di ricerca e conversazione che possono funzionare su diversi canali.
- Duet AI - Agenti IA assistivi per Workspace e Google Cloud: Duet AI è il nostro supporto collaborativo alimentato dall’IA che fornisce assistenza agli utenti quando utilizzano Google Workspace e Google Cloud. Duet AI in Google Workspace, ad esempio, aiuta gli utenti a scrivere, creare immagini, analizzare fogli di calcolo, redigere e riassumere e-mail, messaggi di chat e ricapitolare il contenuto di riunioni. Duet AI in Google Cloud invece può aiutare gli utenti a codificare, implementare, scalare e monitorare le applicazioni, nonché a identificare e accelerare la risoluzione delle minacce di cybersecurity.
Oggi siamo felici di comunicare importanti novità per ognuna di queste aree:
Rafforzare la nostra infrastruttura di classe mondiale
Con l'aumento delle dimensioni e della complessità dei modelli di IA generativa, sono cresciuti anche i requisiti per l’addestramento, la messa a punto e l’inferenza. Di conseguenza, la domanda di infrastrutture di IA ad alte prestazioni, altamente scalabili e convenienti per l'addestramento e il funzionamento dei modelli sta aumentando in modo esponenziale.
Questo non vale solo per i nostri clienti, ma anche per Google. Le TPU sono la base per l'addestramento e il funzionamento di prodotti alimentati dall’IA come YouTube, Gmail, Google Maps, Google Play e Android. In effetti, Gemini è stato addestrato e viene utilizzato grazie alle TPU.
La scorsa settimana abbiamo annunciato Cloud TPU v5p, il nostro acceleratore IA più potente, scalabile e flessibile di sempre. La TPU v5p è quattro volte più scalabile della TPU v4 in termini di FLOP totali disponibili per pod. Quest'anno abbiamo annunciato la disponibilità generale di Cloud TPU v5e. Con un miglioramento delle prestazioni di inferenza per dollaro di 2,7 volte rispetto alla precedente generazione di TPU v4 in un benchmark di settore, questo rende la nostra TPU la più conveniente di sempre.
Abbiamo inoltre annunciato il nostro AI Hypercomputer, un’infrastruttura innovativa di supercomputer che impiega un sistema integrato di hardware ottimizzato per le prestazioni, software aperto, framework ML leader, e modelli di consumo flessibili. AI Hypercomputer offre un'ampia gamma di opzioni di accelerazione, tra cui diverse classi di TPU di quinta generazione e GPU NVIDIA.
Offrire i nostri modelli più recenti e all'avanguardia
Gemini è anche il nostro modello più flessibile fino a oggi, in grado di funzionare in modo efficiente ovunque, dagli smartphone ai data center. Gemini Ultra è il nostro modello più grande e potente, per compiti altamente complessi; Gemini Pro è il nostro modello migliore per essere applicato su scala a un'ampia gamma di attività; mentre Gemini Nano è il nostro modello più efficiente per attività da svolgere su un singolo dispositivo (on-device). Le sue funzionalità all’avanguardia miglioreranno in modo significativo il modo in cui gli sviluppatori e le aziende costruiscono e scalano i loro progetti con l’intelligenza artificiale.
Oggi abbiamo anche presentato una versione aggiornata del nostro modello per immagini, Imagen 2, la nostra tecnologia text-to-image più avanzata. Quest'ultima versione offre funzionalità migliorate di fotorealismo, di text rendering e di generazione di loghi, che consentono di creare facilmente immagini con sovrapposizioni di testo e loghi.
Inoltre, proseguendo nel percorso intrapreso con la creazione di modelli specifici per settore con Med-PaLM, siamo entusiasti di annunciare MedLM, la nostra suite di modelli specifici per l’ambito medico. MedLM offre ai clienti la potenza dei modelli di base di Google ottimizzati per l’ambito medico.
Potenziare la piattaforma Vertex AI con Gemini
Oggi, annunciamo che Gemini Pro è ora disponibile in anteprima su Vertex AI e permetterà agli sviluppatori di creare agenti innovativi e diversificati attualmente in grado di elaborare informazioni da testo, codice, immagini e video. Vertex AI aiuterà i clienti a distribuire e gestire gli agenti in produzione, valutare automaticamente la qualità e l'affidabilità delle risposte degli agenti, così come a monitorarli e gestirli.
Vertex AI offre un supporto completo per Gemini, con la possibilità di scoprire, personalizzare, potenziare, gestire e implementare agenti costruiti con API Gemini, tra cui:
- diversi modi per personalizzare gli agenti costruiti con Gemini utilizzando i propri dati, come progettazione dei prompt, tuning basato su adattatori come Low-Rank Adaptation (LoRA), apprendimento per rinforzo dal feedback umano (RLHF) e distillazione.
- strumenti di potenziamento, per consentire agli agenti di utilizzare gli elementi integrati per recuperare, comprendere e agire sulle informazioni del mondo reale con blocchi configurabili di retrieval augmented generation (RAG). Vertex AI offre anche estensioni per intraprendere azioni per conto degli utenti in applicazioni di terze parti.
- ancoraggio per migliorare la qualità delle risposte di Gemini e di altri modelli di IA, confrontando i risultati con fonti di dati web e aziendali di alta qualità.
- un'ampia gamma di controlli per aiutare i clienti a utilizzare i modelli di IA generativa, compreso Gemini, in modo sicuro e responsabile.
Oltre al supporto di Gemini in Vertex AI, oggi annunciamo anche:
- Automatic Side by Side (Auto SxS), uno strumento automatizzato per confrontare i modelli. Auto SxS è più veloce e più conveniente rispetto alla misurazione manuale dei modelli ed è inoltre personalizzabile in base a diverse attività specifiche per la gestione di nuovi casi d'uso di IA generativa.
- l'aggiunta di Mistral, ImageBind e DITO al Model Garden di Vertex AI, continuando il nostro impegno per un ecosistema di modelli aperto.
- presto porteremo Gemini Pro all’interno di Vertex AI Search and Conversation, per aiutare i nostri clienti a creare rapidamente applicazioni coinvolgenti pronte per la produzione.
Espandere le funzionalità di Duet AI
Con Duet AI, ci impegniamo ad aiutare i nostri clienti a incrementare la produttività, ottenere vantaggi competitivi e, di conseguenza, migliorare i loro profitti. Oggi Duet AI per gli Sviluppatori e Duet AI per le Operazioni di sicurezza sono generalmente disponibili e nelle prossime settimane integreremo Gemini nel nostro portfolio Duet AI.
Duet AI per gli Sviluppatori aiuta gli utenti a codificare più velocemente grazie al completamento e alla generazione di codice e alla chat IA in diversi ambienti di sviluppo integrati (Integrated Development Environment - IDE). Semplifica le attività e i processi ripetitivi degli sviluppatori tramite scorciatoie per le operazioni più comuni - tra cui la generazione di test unitari e la comprensione del codice - velocizza la risoluzione dei problemi e la correzione di anomalie e aiuta a ridurre il passaggio da un contesto all'altro. Duet AI accelera anche l'apprendimento basato sulle competenze, offrendo agli utenti la possibilità di porre domande utilizzando la chat in linguaggio naturale.
Oggi annunciamo anche che oltre 25 partner di code-assist e knowledge-base offriranno set di dati specifici per le loro piattaforme, permettendo agli utenti di Duet AI per gli Sviluppatori di ricevere assistenza IA basata sui loro modelli di codifica e di dati, sulla documentazione dei prodotti, sulle best practice e su altre risorse aziendali utili dei partner.
Duet AI per le Operazioni di sicurezza, la piattaforma unificata per le operazioni di sicurezza di Google Cloud, può consentire di proteggere più efficacemente le organizzazioni dagli attacchi informatici. I team di sicurezza possono migliorare le loro competenze e contribuire ad accelerare il rilevamento, le indagini e la risposta alle minacce utilizzando la potenza dell'IA generativa. Con Duet AI per le Operazioni di sicurezza offriamo assistenza AI su Chronicle, dove gli utenti possono cercare vaste quantità di dati in pochi secondi attraverso query personalizzate formulate in linguaggio naturale, ridurre le lunghe revisioni manuali, far emergere rapidamente il contesto critico sfruttando riepiloghi automatici dei dati e degli alert, e migliorare i tempi di risposta utilizzando suggerimenti per le fasi successive a supporto per la risoluzione degli incidenti.
Google possiede l'intero stack tecnologico di Duet AI, dall'infrastruttura e dai modelli di base, all'integrazione di alto livello fino all'esperienza utente. Siamo orgogliosi che i nostri ingegneri e ricercatori collaborino in modo unico per offrire i nostri ultimi progressi tecnologici in ambito IA ai clienti con un'esperienza di prodotto coerente e unificata. All'inizio del prossimo anno, abbiamo in programma di espandere Duet AI ad altre soluzioni del nostro portfolio, tra cui BigQuery, Looker, i nostri prodotti di database, Apigee e altro ancora.
Promuovere la prossima generazione di soluzioni IA
Oltre a queste nuove funzionalità sul nostro stack di tecnologie IA integrate verticalmente, offriamo prezzi competitivi che rendono Gemini accessibile a un maggior numero di organizzazioni e stiamo incrementando la nostra garanzia di indennizzo per aiutare i clienti a proteggersi da preoccupazioni legate al copyright.
Il rilascio di Gemini, unito alla nostra offerta di infrastrutture IA super-scalabile, Vertex AI e Duet AI, offre un cloud completo e potente a tutti gli sviluppatori e i clienti. Con queste innovazioni, Google Cloud sta promuovendo la prossima generazione di agenti basati sull'IA in tutti i settori, consentendo alle organizzazioni di creare, utilizzare e adottare con successo l'intelligenza artificiale per alimentare la loro trasformazione digitale.