Google I/O 2023: Rendere l'Intelligenza Artificiale più utile per tutti
Nota: di seguito trovate alcuni brani presi dal discorso di apertura di Sundar Pichai a Google I/O 2023.
Sette anni dopo che abbiamo cominciato ad operare come un’azienda AI-first, oggi siamo a un punto di svolta entusiasmante e abbiamo l’opportunità di rendere l’Intelligenza Artificiale ancora più utile per le persone, le aziende e le comunità, insomma per tutti.
Da tempo stiamo utilizzando l’IA per rendere i nostri prodotti radicalmente più utili e con l’IA generativa facciamo un ulteriore passo avanti. Grazie ad un approccio audace e responsabile allo stesso tempo, stiamo reinventando tutti i nostri prodotti principali, inclusa la Ricerca Google.
L’Intelligenza Artificiale nei nostri prodotti
“Help me write” in Gmail
Ci sono esempi brillanti di come l’IA generativa sta aiutando a far evolvere i nostri prodotti, a partire da Gmail. Nel 2017 abbiamo lanciato Risposta Rapida, brevi risposte che si possono selezionare semplicemente con un clic. Poi è arrivata Scrittura Intelligente, che offre suggerimenti su cosa scrivere mentre si sta digitando il testo. Scrittura Intelligente ha portato a funzionalità di scrittura più avanzate, abilitate dall’IA, che sono state usate in Workspace 180 miliardi di volte solo durante lo scorso anno. E ora, grazie a un modello generativo molto più potente, facciamo un ulteriore passo con “Help me write” in Gmail.
Mettiamo che abbiate ricevuto una mail che dice che il vostro volo è stato cancellato. La compagnia aerea vi ha mandato un voucher, ma quello che voi volete veramente è il rimborso dell’intero costo del biglietto. Potreste rispondere usando “Help me write”.
Digitate semplicemente il suggerimento di quello che volete - una mail per chiedere un rimborso completo - cliccate su ‘create’ e vi apparirà una bozza completa. Come potete vedere, include già anche i dettagli del volo presi dall’email precedente. Il messaggio è molto vicino a una versione da inviare, ma potreste volerlo rifinire ulteriormente perché un messaggio più elaborato potrebbe incrementare le vostre possibilità di ottenere un rimborso. “Help me write” comincerà ad essere reso disponibile con gli aggiornamenti di Workspace, ed esattamente come con Scrittura Intelligente, lo vedrete migliorare nel tempo.
Immersive View for routes in Maps
Sin dagli albori di Street View, l’IA ha combinato miliardi di immagini panoramiche in modo che le persone possano esplorare il mondo dal proprio dispositivo. Ad I/O l’anno scorso abbiamo introdotto Immersive View, che usa l’IA per creare una rappresentazione altamente fedele di un luogo, così che ne possiate fare esperienza prima di visitarlo.
Ora, utilizziamo la stessa tecnologia per fare quello che Google Maps fa al meglio: aiutarvi ad andare dove volete andare. Google Maps fornisce ogni giorno 20 miliardi di km di direzioni: sono un sacco di viaggi. Immaginate se si potesse visualizzare l’intero viaggio prima di partire: con Immersive View for Routes ora è possibile, tanto che vogliate camminare, pedalare o guidare.
Diciamo che siete a New York e volete fare un giro in bicicletta. Google Maps vi ha proposto un paio di opzioni vicino a dove vi trovate. Quella sul lungomare sembra panoramica, ma volete dare un’occhiata prima: Immersive view for Routes è un modo completamente nuovo di guardare al vostro viaggio. Si può fare zoom e guardare il percorso a volo d’uccello.
Immersive View for Routes verrà reso disponibile dall’estate e lancerà in 15 città entro la fine dell’anno, incluse Londra, New York, Tokyo e San Francisco.
Una nuova esperienza di Magic Editor in Foto
Un altro prodotto migliorato dall’IA è Google Foto. L’abbiamo introdotto ad I/O nel 2015 ed è stato uno dei nostri primi prodotti nativamente basati sull’IA. Le innovazioni del Machine Learning hanno consentito di cercare tra le vostre foto persone, tramonti e cascate.
Ovviamente, vogliamo che possiate fare di più che cercare tra le foto; vogliamo che possiate migliorarle. Ogni mese, 1,7 miliardi di immagini vengono modificate in Google Foto e i miglioramenti dell’IA ci offrono soluzioni più potenti per farlo. Per esempio, Magic Eraser, lanciato dapprima su Pixel, usa la fotografia computazionale abilitata dall’IA per rimuovere gli elementi indesiderati. E più avanti quest’anno, grazie a una combinazione di comprensione semantica e IA generativa sarà possibile fare ancora di più con una nuova esperienza chiamata Magic Editor.
Ecco un esempio: Questa è un'ottima foto, ma come genitore probabilmente vorreste che il vostro bambino fosse al centro dell’inquadratura. E poi sembra che i palloncini siano stati un po’ tagliati in questa foto. Ora potete riposizionare il festeggiato nella foto e Magic Editor ricrea automaticamente le parti della panchina e dei palloncini che non sono state catturate nello scatto originale. Come tocco finale, è possibile migliorare il colore del cielo; questo cambia anche l'illuminazione del resto della foto, in modo che la modifica risulti coerente. Magic Editor in Google Foto lancerà nel corso dell'anno.
Una foto trasformata da Magic Editor in Google Foto
Rendere l'Intelligenza Artificiale più utile per tutti.
Gmail, Google Foto e Google Maps sono solo alcuni degli esempi di come l’IA può aiutarvi quando serve. E possiamo fare molto di più per sfruttare appieno il potenziale dell'intelligenza artificiale nei prodotti che conoscete e che amate.
Oggi abbiamo 15 prodotti che servono ciascuno oltre mezzo miliardo di persone e aziende; 6 di questi prodotti servono oltre due miliardi di utenti ciascuno. Il che significa che abbiamo moltissime opportunità di focalizzarci sulla nostra missione, che è quella di rendere l'informazione universalmente accessibile e utile.
Una missione che diventa sempre più importante nel tempo. E guardando al futuro, rendere l’intelligenza artificiale utile per tutti è il modo più profondo in cui porteremo avanti la nostra missione.Lo stiamo facendo in quattro modi:
- Primo, migliorando la vostra conoscenza e l'apprendimento e approfondendo la vostra comprensione del mondo
- Secondo, stimolando la creatività e la produttività, in modo che possiate esprimere voi stessi e portare a termine i vostri progetti
- Terzo, consentendo agli sviluppatori e alle aziende di creare i propri prodotti e servizi all’avanguardia
- Infine, sviluppando e implementando l'IA in modo responsabile, così che tutti ne possano beneficiare nella stessa misura.
PaLM 2 + Gemini
La nostra capacità di rendere l'intelligenza artificiale utile per tutti si basa sul continuo progresso dei nostri modelli di base e siamo entusiasti delle opportunità future. Ecco perché voglio approfondire come approcciamo i modelli di base..
L'anno scorso ci avete sentito parlare di PaLM, un modello che ha reso possibili molti miglioramenti nei nostri prodotti. Oggi siamo pronti ad annunciare la messa in produzione del nostro ultimo modello: PaLM 2.
PaLM 2 si basa sulla nostra ricerca di base e sulla nostra infrastruttura più recente. È altamente capace di svolgere un'ampia gamma di compiti e facile da implementare. Oggi annunciamo più di 25 prodotti e funzionalità basati su PaLM 2.
I modelli PaLM 2 offrono eccellenti capacità fondamentali in un'ampia gamma di dimensioni. Li abbiamo chiamati affettuosamente Gecko, Otter, Bison e Unicorn. Gecko è così leggero da poter funzionare su dispositivi mobili: abbastanza veloce da consentire eccellenti applicazioni interattive sul dispositivo anche quando è offline. I modelli PaLM 2 sono più forti nella logica e nel ragionamento grazie a un'ampia formazione su argomenti scientifici e matematici. Inoltre, sono addestrati su testi multilingue (oltre 100 lingue), in modo da comprendere e generare risultati ricchi di sfumature.
Grazie a potenti capacità di coding, PaLM 2 può anche aiutare gli sviluppatori a collaborare da un paese all’altro. Vediamo un esempio. Supponiamo che stiate lavorando con un collega di Seoul e stiate eseguendo un debug del codice. Potete chiedere di risolvere un bug e aiutare il vostro collega aggiungendo commenti in coreano al codice. Il programma riconosce innanzitutto che il codice è ricorsivo, quindi suggerisce una correzione, spiega il ragionamento che sta alla base della correzione e aggiunge commenti in coreano come richiesto.
Sebbene PaLM 2 sia altamente capace, eccelle davvero quando viene messo a punto sulla base di conoscenze specifiche di un certo dominio. Di recente abbiamo rilasciato Sec-PaLM, ottimizzato per i casi d'uso della sicurezza. Utilizza l'intelligenza artificiale per rilevare meglio gli script dannosi e può aiutare gli esperti di sicurezza a comprendere e risolvere le minacce.
Un altro esempio è Med-PaLM 2. In questo caso, è stato perfezionato sulla base di conoscenze mediche. Questa messa a punto ha permesso di ridurre di 9 volte l’imprecisione nei ragionamenti rispetto al modello, avvicinandosi alle prestazioni di medici esperti che hanno risposto alla stessa serie di domande. In effetti, Med-PaLM 2 è stato il primo modello linguistico a ottenere prestazioni di livello "esperto" su domande in stile esame di abilitazione alla professione medica, e attualmente rappresenta lo stato dell'arte.
Stiamo anche lavorando per aggiungere a Med-PaLM 2 funzionalità che gli consentano di sintetizzare informazioni provenienti da immagini mediche come radiografie e mammografie. Si può immaginare un collaboratore IA che aiuti i radiologi a interpretare le immagini e a comunicare i risultati. Questi sono alcuni esempi di utilizzo di PaLM 2 in ambiti specializzati. Non vediamo l'ora di vederlo utilizzato in altri ambiti. Ecco perché sono lieto di annunciare che PaLM 2 è ora disponibile in anteprima.
PaLM 2 è il più recente sviluppo del nostro viaggio decennale per portare l'IA in modo responsabile a miliardi di persone. Si basa sui progressi compiuti da due team di ricerca riconosciuti a livello mondiale, il Brain Team e DeepMind.
Se si considerano i progressi più importanti dell'IA dell'ultimo decennio, questi team hanno contribuito a un numero significativo di essi: AlphaGo, Transformers, modelli sequenza-sequenza e così via. Tutto ciò ha contribuito a gettare le basi per arrivare al punto di svolta a cui ci troviamo oggi.
Di recente abbiamo riunito questi due team in un'unica unità, Google DeepMind. Utilizzando le risorse computazionali di Google, si stanno concentrando sulla realizzazione di sistemi più efficienti, in modo sicuro e responsabile.
Questo include il nostro modello di base di prossima generazione, Gemini, che è ancora in fase di addestramento. Gemini è stato creato da zero per essere multimodale, altamente efficiente nelle integrazioni di strumenti e API e costruito per consentire innovazioni future, come memoria e pianificazione. Anche se siamo ancora agli inizi, stiamo già vedendo capacità multimodali impressionanti, non riscontrabili nei modelli precedenti.
Una volta messo a punto e rigorosamente testato per la sicurezza, Gemini sarà disponibile in varie dimensioni e funzionalità, proprio come PaLM 2.
Responsabilità dell'intelligenza artificiale: Strumenti per identificare i contenuti generati
A mano a mano investiamo in modelli più capaci, facciamo anche importanti investimenti nella responsabilità dell'IA, che include avere gli strumenti per identificare i contenuti generati sinteticamente ogni volta che li si incontra.
Due approcci importanti sono il watermarking e i metadati. Il watermarking incorpora informazioni direttamente nel contenuto, in modo che si mantengano anche a seguito di un modesto editing dell’immagine. Stiamo costruendo i nostri modelli perché in futuro includano il watermarking fin dall'inizio.
I metadati consentono ai creatori di contenuti di associare un contesto aggiuntivo ai file originali, fornendo maggiori informazioni ogni volta che si incontra un'immagine. Ci assicureremo che ogni nostra immagine generata dall'intelligenza artificiale sia dotata di tali metadati. Maggiori informazioni sul nostro approccio audace e responsabile.
Aggiornamenti a Bard e Workspace
Una delle opportunità più interessanti è quella di metterli a disposizione delle persone i nostri modelli, perché possano interagirvi direttamente.
Questa è l'opportunità che abbiamo con Bard, il nostro esperimento di IA conversazionale. Stiamo rapidamente evolvendo Bard, che ora supporta un'ampia gamma di capacità di programmazione ed è diventato molto più smart nel ragionamento e nelle richieste di tipo matematico. Inoltre, da oggi gira completamente su PaLM 2. Scopri di più sugli ultimi aggiornamenti di Bard.
Stiamo anche introducendo nuove funzionalità in Workspace con Duet AI . Oltre a “Help me write" in Docs e Gmail, Duet AI in Google Workspace offre strumenti per generare immagini da descrizioni testuali in Slides e Meet, creare piani personalizzati in Sheets e altro ancora. Scopri di più sugli ultimi aggiornamenti di Workspace.
Introduciamo Labs e la nostra nuova Search Generative Experience
Mentre l'intelligenza artificiale continua a migliorare rapidamente, siamo impegnati a fornire funzioni utili alle persone. A partire da oggi, vi offriamo un nuovo modo per provare in anteprima alcune esperienze in Workspace e in altri prodotti. Si chiama Labs. Ho detto nuovo, ma in realtà Google ha una lunga storia di utilizzo dei Labs come modo per consentire l'accesso anticipato e ottenere feedback, e potrete iniziare a iscrivervi già da oggi (negli Stati Uniti).
Oltre alle funzionalità di Workspace che avete appena visto, una delle prime esperienze che potrete testare in Labs riguarda il nostro prodotto di base, la Ricerca Google. Il motivo per cui abbiamo iniziato a investire profondamente nell'intelligenza artificiale molti anni fa è che abbiamo visto l'opportunità di migliorare la Ricerca. E grazie ai progressi di questi anni, l'abbiamo resa sempre più utile e intuitiva.
I miglioramenti nella comprensione del linguaggio ci permettono di porre domande in modo più naturale e di raggiungere i contenuti più pertinenti sul web. I progressi nella computer vision hanno introdotto nuove modalità di ricerca visiva. Ora, anche se non avete le parole per descrivere ciò che state cercando, potete cercare tutto ciò che vedete con Google Lens. E infatti Lens viene utilizzato per oltre 12 miliardi di ricerche visive ogni mese, un numero che si è quadruplicato in soli due anni. Lens, combinato con la multimodalità, ha portato alla Ricerca Multipla, che consente di effettuare ricerche utilizzando sia un'immagine sia un testo.
In prospettiva, la profonda comprensione delle informazioni da parte di Google unita alle capacità uniche dell'IA generativa può trasformare ancora una volta il modo in cui funziona la Ricerca, rendendo possibile rispondere con la Ricerca a domande completamente nuove e creando esperienze sempre più utili per connettervi alla ricchezza del web.
Naturalmente, l'applicazione dell'IA generativa alla ricerca è ancora agli inizi. Le persone di tutto il mondo si affidano alla Ricerca nei momenti più importanti; sappiamo quindi quanto sia fondamentale fare le cose per bene e continuare a guadagnarci la loro fiducia. E questo principio continua a guidarci.
Per questo motivo, stiamo affrontando l'innovazione in modo responsabile, puntando alla massima qualità delle informazioni esattamente come abbiamo sempre fatto fin dall'inizio, e portando prima la nostra nuova Search Generative Experience nei Labs.
Rendere l’innovazione più semplice per gli altri
L'intelligenza artificiale non è solo un potente fattore abilitante, ma anche un grande cambiamento a livello di piattaforma. Ogni azienda e organizzazione sta pensando a come guidare la trasformazione, ecco perché siamo impegnati a far sì che per gli altri innovare con l’IA sia facile e scalabile.
Ciò significa fornire l'infrastruttura di elaborazione più avanzata, comprese le più moderne TPU e GPU, e ampliare l'accesso ai più recenti modelli di base di Google che sono stati rigorosamente testati nei nostri prodotti. Stiamo anche lavorando per fornire strumenti efficaci in modo che i clienti possano addestrare, perfezionare ed eseguire i propri modelli, con sicurezza, protezione e privacy di livello aziendale. Ulteriori informazioni dal CEO di Google Cloud Thomas Kurian.
Guidare il progresso con Android
Il nostro approccio audace e responsabile all'intelligenza artificiale può liberare la creatività e il potenziale delle persone. Vogliamo assicurarci che il maggior numero possibile di persone possa trarne vantaggi e lo facciamo attraverso le nostre piattaforme informatiche come Android. Oggi abbiamo condiviso come i progressi dell'IA possono rendere il vostro telefono ancora più personale, grazie a soluzioni come Magic Compose, Cinematic Wallpapers e Generative AI Wallpapers.
Nuovi dispositivi Pixel per le vostre tasche e la vostra casa
Stiamo inoltre introducendo Pixel 7a, Pixel Fold e Pixel Tablet per un ecosistema completo di dispositivi dotati di intelligenza artificiale e progettati da Google. Pixel 7a è disponibile per l'acquisto a partire da oggi, mentre sono aperti i preordini per Pixel Fold e Pixel Tablet.
Costruire il futuro insieme
Ho riflettuto sui grandi cambiamenti tecnologici di cui tutti siamo stati parte. Il cambiamento in corso con l'IA ha un grande impatto ed è per questo che è così importante che rendiamo l'IA utile a tutti. Stiamo affrontando questo cambiamento con audacia, con entusiasmo e in modo responsabile, sottolineando il nostro profondo impegno nell’approcciarci all’IA nel modo giusto.
Nessuna azienda può farcela da sola. La nostra comunità di sviluppatori avrà un ruolo chiave per dare spazio alle enormi opportunità che ci attendono. Non vediamo l'ora di lavorare e costruire insieme.