I/O 2026: Benvenuti nell'era degli agenti Gemini
Nota dell'editore: di seguito riportiamo una trascrizione adattata del discorso di Sundar Pichai, CEO di Google, al Google I/O 2026, integrata con i principali annunci fatti sul palco.
Dall'ultimo I/O è trascorso un anno straordinario, segnato da un rilascio continuo di prodotti, progressi tecnologici e un'evoluzione rapidissima. Siamo ora in una fase del ciclo dell'AI in cui le persone vogliono toccare con mano il valore dei prodotti che usano quotidianamente. Ci siamo concentrati proprio su questo, come dimostrano le novità e le funzioni che presentiamo oggi all'I/O.
A dieci anni dal passaggio a un approccio "AI-first", consideriamo ancora l'intelligenza artificiale come lo strumento più potente per portare avanti la nostra missione e migliorare concretamente la vita delle persone su larga scala. Per questo abbiamo adottato un approccio all'innovazione differenziato e full-stack: dai nostri chip personalizzati a un'infrastruttura sicura, dalla ricerca e dai modelli d'eccellenza fino ai prodotti e alle piattaforme scelti da miliardi di utenti. Questo approccio ci consente di innovare più velocemente, portando benefici in ogni area dell'azienda.
È incredibile vedere come le persone utilizzano l'AI: dagli studenti che preparano gli esami con l'app Gemini, ai musicisti e artisti che integrano modelli generativi come Lyria e Veo nel loro processo creativo, fino agli sviluppatori che scrivono codici e danno vita alle proprie idee.
Lo slancio dell'AI lungo tutto lo stack tecnologico
Queste case history sono il miglior metro di misura dei nostri progressi. Per comprendere la portata dell'adozione dell'AI, esiste però un altro indicatore fondamentale: i token, le unità di base con cui i nostri modelli elaborano i dati e risolvono problemi.
Due anni fa, elaboravamo 9,7 trilioni di token al mese su tutte le nostre piattaforme — un numero già enorme. Lo scorso anno all'I/O, la cifra è salita a circa 480 trilioni. Oggi quel numero è cresciuto di 7 volte, superando i 3,2 quadrilioni al mese.
Questi dati raccontano l'evoluzione dei nostri prodotti e di come sviluppatori e aziende stanno costruendo il futuro:
- Oltre 8,5 milioni di sviluppatori creano ogni mese nuove app ed esperienze basate sui nostri modelli.
- Le API dei nostri modelli elaborano circa 19 miliardi di token al minuto.
- Negli ultimi 12 mesi, più di 375 clienti di Google Cloud hanno elaborato singolarmente oltre un trilione di token, a testimonianza di una domanda incredibile di AI in ogni settore.
Il successo dei nostri prodotti
Oggi contiamo 13 prodotti con oltre un miliardo di utenti ciascuno. Cinque di questi superano i 3 miliardi.
I modelli Gemini sono il motivo principale per cui sempre più persone scelgono e utilizzano intensamente i nostri prodotti.
Tutto parte dalla Ricerca Google, che sta portando i vantaggi dell'AI generativa a più persone di qualsiasi altro prodotto al mondo. AI Overviews conta ora oltre 2,5 miliardi di utenti attivi mensili. E AI Mode è stata una vera rivelazione, rappresentando il più grande aggiornamento mai apportato alla Ricerca. Gli utenti la adorano: in un solo anno ha già superato il miliardo di utenti attivi mensili.
Quando le persone utilizzano le funzioni basate sull'AI nella Ricerca, tendono a cercare di più. La Ricerca non riguarda più solo singole query, ma assomiglia sempre più a una conversazione continua, capace di offrire approfondimenti e connettere gli utenti con l'immensità del web.
Un altro ambito di rapida innovazione è l'app Gemini. Lo scorso anno all'I/O, l'app Gemini contava 400 milioni di utenti attivi mensili. Oggi ha superato i 900 milioni, numero più che raddoppiato in un anno. Nello stesso periodo, le richieste giornaliere sono cresciute di oltre sette volte.
Abbiamo introdotto funzioni uniche come l'Personal Intelligence, che rende le risposte più personalizzate e utili. Ad oggi, sono state generate più di 50 miliardi di immagini con i nostri modelli di generazione immagini Nano Banana. È stato un successo incredibile nell'ultimo anno, che dimostra quanta creatività latente ci sia nel mondo.
Un'AI naturale e conversazionale nei nostri prodotti
C'è anche molta produttività inespressa da poter sbloccare. Nell'ultimo anno, abbiamo integrato la possibilità di avere conversazioni più naturali con Gemini direttamente nei nostri prodotti. Recentemente, Google Maps ha ricevuto il suo aggiornamento più significativo dell'ultimo decennio, inclusa la nuova funzione Ask Maps. Gli utenti la utilizzano per porre domande più complesse e molto più lunghe.
Ora stiamo portando questa AI conversazionale naturale in ancora più prodotti.
Ask YouTube
Ogni giorno le persone visitano YouTube per trovare risposte. Ci sono tantissimi video validi, ma a volte è difficile capire da dove iniziare.
Ask YouTube reinventa completamente l'esperienza sulla piattaforma, rendendo le informazioni molto più accessibili e facili da consultare. Troverai i video che meglio corrispondono ai tuoi interessi e, cosa più importante, l'AI ti porterà direttamente al punto del video più pertinente per te.
Stiamo iniziando i test di Ask YouTube ora, e la funzione verrà distribuita su larga scala negli Stati Uniti questa estate.
We’re starting to test Ask YouTube now, and it will roll out broadly in the U.S. this summer.
Docs Live a comando vocale
Spesso vorrei poter lavorare con la rapidità della mia voce. Oggi questo è molto più possibile grazie ai balzi tecnologici dei nostri modelli audio.
La nuova funzione Docs Live porta tutto questo a un livello superiore. Prima, per creare un documento con Gemini, dovevi scrivere un prompt preciso. Con Docs Live, puoi semplicemente fare un "brain dump" vocale di tutto quello che hai in mente e lasciare che Gemini faccia il resto. Ecco una demo in tempo reale:
In futuro, potrai creare nuovi documenti e modificarli direttamente, tutto con la voce. Docs Live sarà disponibile per gli abbonati questa estate, e potenti funzionalità vocali arriveranno nello stesso periodo anche su Gmail e Keep.
Un'infrastruttura a supporto dell'innovazione su scala
È incredibile vedere il ritmo dell'innovazione nei nostri prodotti. Sostenere questa portata per i nostri utenti, servendo al contempo aziende e sviluppatori in tutto il mondo, richiede importanti investimenti in infrastrutture. Abbiamo investito pensando al presente e al futuro. Nel 2022, la nostra spesa annuale in conto capitale era di 31 miliardi di dollari. Quest'anno, prevediamo che tale cifra sarà circa sei volte superiore, raggiungendo circa 190 miliardi di dollari. Un elemento chiave di questo investimento è il nostro silicio personalizzato.
Dieci anni fa, annunciammo proprio sul palco dell'I/O la nostra prima Tensor Processing Unit (TPU) commerciale. Da allora, abbiamo trasformato il modo in cui il settore costruisce per l'AI. Recentemente, al Cloud Next, abbiamo presentato l'ottava generazione di TPU. Per la prima volta, abbiamo adottato un approccio a doppio chip con architetture specializzate per l'addestramento e l'inferenza: TPU 8t e 8i.
- TPU 8t è ottimizzata per il pre-addestramento su larga scala e offre quasi tre volte la potenza di calcolo grezza rispetto alla generazione precedente. Abbiamo rivoluzionato l'approccio alla nostra infrastruttura di addestramento: con JAX e Pathways, non siamo più limitati dai confini di un singolo, enorme data center. Possiamo invece distribuire l'addestramento in modo fluido su più siti, scalando su oltre 1 milione di TPU a livello globale. Questo ci permette di creare il cluster di addestramento più grande al mondo. Per chi sviluppa modelli, questo significa poter addestrare versioni più capaci in settimane anziché mesi.
- TPU 8i è progettata per l'inferenza. Abbiamo migliorato drasticamente la velocità in ogni fase. Perché se abbiamo imparato qualcosa in 27 anni di lavoro sulla Ricerca, è che la latenza è fondamentale.
Oltre alla velocità, puntiamo sulla sostenibilità: entrambi i chip sono più efficienti dal punto di vista energetico, offrendo prestazioni per watt fino a due volte superiori.
Gemini Omni
I progressi con le TPU ci permettono di far evolvere modelli, programmazione e agenti. Con i "world models", l'AI sta passando dal prevedere testo al simulare la realtà. Lavoriamo costantemente per superare i limiti di ciò che questi modelli possono fare.
Gemini Omni è il nostro nuovo modello capace di generare campioni in qualsiasi modalità di output a partire da qualsiasi input. Cominceremo con i video e, nel tempo, abiliteremo immagini e testo. Questo modello combina l'intelligenza di Gemini con i nostri modelli generativi multimediali: un enorme passo avanti nella comprensione del mondo. Presentiamo il primo modello della famiglia Omni: Gemini Omni Flash.
Gemini Omni Flash è disponibile da oggi. Potrai provarlo sull'app Gemini, su Google Flow e su YouTube Shorts. Nelle prossime settimane lo renderemo disponibile tramite API anche per sviluppatori e clienti aziendali.
Nuovi aggiornamenti e partner per SynthID
Con il perfezionamento dell'AI generativa, cresce la necessità di trasparenza. Le ricerche mostrano che le persone riescono a identificare correttamente i video deepfake di alta qualità solo in un quarto dei casi. Tre anni fa abbiamo lanciato SynthID, la nostra filigrana invisibile ad occhio nudo. Dal suo lancio, SynthID ha contrassegnato oltre cento miliardi di immagini e video, oltre a sessantamila anni di contenuti audio.
Milioni di persone usano lo strumento di rilevamento SynthID nell'app Gemini per verificare i contenuti generati dall'AI. Ora facciamo un passo avanti aggiungendo la verifica dei Content Credentials nei vari prodotti. Questo permetterà di sapere se l'origine del contenuto è l'AI o una fotocamera, e se è stato modificato con strumenti di AI generativa. Vogliamo che questi strumenti siano accessibili a tutti, quindi estenderemo la verifica dei Content Credentials e di SynthID alla Ricerca e a Chrome.
Naturalmente, questo sistema funziona su vasta scala solo se più partner scelgono di applicare la filigrana ai propri contenuti generati dall'AI.
Nvidia ha adottato SynthID lo scorso anno. Oggi siamo entusiasti di annunciare che anche OpenAI, Kakaw ed Eleven Labs stanno implementando SynthID. È fantastico vedere questa collaborazione tra i leader del settore. Non vediamo l'ora di accogliere nuovi partner e migliorare sempre più lo standard di trasparenza per l'era dell'AI.
Gemini 3.5 Flash
Gemini 3 è stato lanciato pochi mesi fa con un'intera famiglia di modelli, diventando la nostra serie più adottata di sempre. È stato entusiasmante vedere gli sviluppatori usare Flash come strumento quotidiano e creare esperienze incredibili grazie alle capacità multimodali e di ragionamento profondo della versione Pro. Abbiamo lavorato sodo per migliorare questi modelli, concentrandoci in particolare sulla programmazione via agenti, sui compiti a lungo termine e sui flussi di lavoro reali.
Oggi presentiamo Gemini 3.5 Flash, il primo di una serie di modelli che unisce intelligenza d'avanguardia e capacità d'azione. Due aspetti degni di nota:
- Rispetto alla versione 3.1 Pro, 3.5 Flash è superiore in quasi tutti i benchmark. Ha fatto passi da gigante nella programmazione — e vanta un incremento straordinario in GDPVal. Questo parametro cattura molte attività del mondo reale economicamente rilevanti.
- Gemini 3.5 Flash è un modello estremamente capace, paragonabile ai migliori sul mercato, pur rimanendo velocissimo. Per questo, nel rapporto tra intelligenza e velocità di output, si posiziona in una classe a sé stante nel quadrante in alto a destra. Se guardiamo ai token di output al secondo, è quattro volte più veloce degli altri modelli di frontiera.
Il nuovo modello ha segnato una svolta per noi di Google. Abbiamo usato 3.5 Flash con una versione rinnovata della nostra piattaforma di sviluppo incentrata sugli agenti Antigravity, accelerando drasticamente i tempi di creazione. A marzo elaboravamo mezzo trilione di token al giorno internamente con i nostri strumenti per sviluppatori AI, e la cifra è raddoppiata ogni poche settimane. Ora ne elaboriamo più di tre trilioni al giorno. Questa crescita ha creato un importante flusso feedback che ci ha aiutato a perfezionare la versione 3.5.
La cosa straordinaria di Flash è che offre capacità di altissimo livello a meno della metà del prezzo rispetto a modelli simili. Molte aziende hanno già esaurito i loro budget annuali per i token, e siamo solo a maggio. Utilizzando un mix di Flash e altri modelli di frontiera, le aziende potrebbero risparmiare somme considerevoli. Per intenderci, le principali aziende elaborano circa 1 trilione di token al giorno. Spostando l'80% del carico di lavoro da altri modelli a 3.5 Flash, risparmierebbero oltre 1 miliardo di dollari all'anno. Risorse reali da reinvestire nelle proprie attività.
Gemini 3.5 Flash è disponibile da oggi per tutti i nostri prodotti e API. Siamo inoltre entusiasti per Gemini 3.5 Pro: lo stiamo testando internamente con ottimi risultati e arriverà il mese prossimo.
Antigravity 2.0
Stiamo portando 3.5 Flash anche agli sviluppatori su Antigravity.
Antigravity si sta espandendo oltre l'ambiente di programmazione, diventando una piattaforma per sviluppare e gestire coorti di agenti AI autonomi. Questo include Antigravity 2.0, una nuova applicazione desktop standalone che funge da hub centrale per l'interazione con gli agenti, dove chiunque può coordinarli per svariate attività. Inoltre, abbiamo sviluppato una versione di Flash ancora più ottimizzata: non solo 4 volte, ma ben 12 volte più veloce di altri modelli di ultima generazione.
Gli utenti di Antigravity possono iniziare a provare questa esperienza da oggi. Scopri di più su Antigravity 2.0 qui.
Gemini Spark è il tuo agente disponibile 24/7
Gemini 3.5 e Antigravity stanno aprendo le porte a un nuovo mondo di agenti e capacità operative. Forniamo agenti a sviluppatori e aziende da tempo, ma ora ci stiamo concentrando per portare questa potenza, in modo sicuro, a tutti gli utenti. Oggi vedrete esperienze basate su agenti in molti dei nostri prodotti.
Sono particolarmente entusiasta di Gemini Spark, il tuo agente AI personale nell'app Gemini che ti aiuta a gestire la tua vita digitale, agendo per tuo conto sotto il tuo controllo.
- Gira su macchine virtuali dedicate su Google Cloud ed è attivo 24 ore su 24, così non dovrai tenere il computer acceso.
- È alimentato da Gemini 3.5 e dalla piattaforma Google Antigravity, che gli permette di svolgere compiti complessi in background con facilità.
- Spark si integrerà perfettamente con vari strumenti, a partire dai nostri e, nelle prossime settimane, con strumenti di terze parti tramite MCP.
- Potrai interagire con Spark nel modo più comodo: nell'app Gemini o, presto, via email e chat.
- Su Android potrai monitorare i progressi e gli aggiornamenti live di agenti come Spark attraverso un nuovo spazio dell'interfaccia chiamato Android Halo, in arrivo entro l'anno. Più avanti questa estate, Spark opererà direttamente in Chrome, agendo come il tuo browser-agente sul web.
Stiamo iniziando a distribuire Gemini Spark a un gruppo di tester selezionati questa settimana, mentre la versione Beta arriverà per gli abbonati a Google AI Ultra negli Stati Uniti la prossima settimana.
La Ricerca nell'era degli agenti
Gemini Spark è la prima esperienza resa possibile dai modelli 3.5 e da Antigravity. Questa combinazione ci offre nuovi modi per accelerare la nostra missione e rendere i nostri prodotti nettamente più utili.
Con l'ingresso in questa nuova era, la Ricerca Google sarà più potente e utile che mai. Oggi presentiamo gli agenti informativi nella Ricerca: assistenti AI personalizzati che puoi impostare per lavorare in background 24 ore su 24, trovando ciò che ti serve al momento giusto e aiutandoti a passare all'azione. Gli agenti informativi saranno disponibili questa estate per gli abbonati Google AI Pro e Ultra.
Un altro modo in cui stiamo rendendo la Ricerca un vero sistema di agenti è dotandola di capacità di programmazione assistita. Grazie alla potenza di Gemini 3.5 Flash e Google Antigravity, la Ricerca creerà esperienze su misura per le tue domande, come layout dinamici e grafiche interattive. Queste funzionalità di interfaccia generativa saranno disponibili gratuitamente per tutti nella Ricerca questa estate.
Per le attività che richiedono più tempo e che vanno seguite costantemente, la Ricerca potrà fare un ulteriore passo avanti — creare dashboard o tracker personalizzati e persistenti. Immaginali come delle mini app dedicate ai tuoi compiti specifici. Potrai creare queste esperienze personalizzate con Antigravity direttamente nella Ricerca nei prossimi mesi, a partire dagli abbonati Google AI Pro e Ultra negli Stati Uniti.
Altro dall'era degli agenti Gemini
Ecco cos'altro abbiamo condiviso all'I/O:
- Daily Brief è un altro agente pronto all'uso in arrivo nell'app Gemini. Ti offre un riepilogo personalizzato sintetizzando le informazioni da Gmail, Calendar e Tasks per farti trovare le cose più importanti. Non si limita a riassumere i dati: stabilisce priorità, organizza e suggerisce i passaggi successivi, facilitando ogni azione. Il tutto in un riassunto mattutino conciso, pensato per una lettura rapida.
- Google Flow introduce oggi un nuovo agente per tutti, capace di pianificare e ragionare su compiti complessi seguendo i tuoi input e sotto il tuo controllo. Sviluppato con i modelli Gemini, mette a disposizione competenza e una comprensione profonda del tuo progetto per aiutarti nel brainstorming iniziale, nella creazione e nell'editing. In Flow puoi anche usare il "vibe coding" per qualsiasi strumento creativo — ad esempio per progettare effetti video, animazioni fatte a mano o livelli di testo.
- Google Pics è il nostro nuovo strumento di creazione e modifica immagini tramite AI. Basato sul nostro ultimo modello Nano Banana, ti permette di creare qualsiasi cosa con il massimo controllo creativo. Che tu stia partendo da zero o modificando una foto esistente, Pics tratta ogni elemento come un oggetto individuale e non come un'immagine statica. Questo ti consente di creare, sostituire o perfezionare dettagli specifici per dare vita alla tua visione esatta. Google Pics è ora disponibile per i tester selezionati e arriverà in estate per gli abbonati Google AI Pro e Ultra in Workspace.
- Abbiamo anche mostrato i progressi dei nostri occhiali intelligenti, anticipati lo scorso anno. Si tratta di occhiali audio che offrono assistenza vocale direttamente nell'orecchio e occhiali con display che mostrano le informazioni necessarie proprio quando servono. Entrambi permettono di avere le mani libere e lo sguardo sempre rivolto avanti, chiedendo aiuto a Gemini con la voce. Gli occhiali audio saranno i primi a essere lanciati, il prossimo autunno.
- Gemini for Science riunisce vari strumenti di AI per accelerare la ricerca scientifica. Basandosi sulle capacità di ragionamento profondo di Gemini, Deep Think e Deep Research, include nuovi esperimenti su Labs e Science Skills per connettere piattaforme di agenti come Google Antigravity a oltre 30 tra i principali database e strumenti di scienze biologiche. È possibile candidarsi per provare gli esperimenti di Gemini for Science su Google Labs, e Science Skills è disponibile da oggi su Github e direttamente in Antigravity.
Guardando all'intero stack tecnologico, dall'infrastruttura delle TPU 8i alle capacità di frontiera di Gemini 3.5 e Antigravity, è chiaro che siamo entrati pienamente nell'era degli agenti Gemini. Sono entusiasta di vedere come tutto questo aprirà nuove strade per accelerare la nostra missione e trasformare i nostri prodotti affinché siano radicalmente più utili, per tutti e ovunque.