Toegankelijkheid

The Keyword Nederland

Google I/O 2024: een I/O voor een nieuwe generatie

[]

Google I/O 2024: een I/O voor een nieuwe generatie

14 mei 2024

Sundar Pichai

CEO, Google

Sunder Pichai op het podium van Google I/O 2024.

Hieronder volgt een bewerkte transcriptie van wat Sundar Pichai zei op I/O 2024, met meer informatie die hij op het podium deelde.

Google bevindt zich volledig in het Gemini-tijdperk. Al meer dan 10 jaar investeren we in AI en innoveren we op het gebied van onderzoek, producten en infrastructuur. Daar gaan we het vandaag allemaal over hebben.

Toch bevinden we ons nog in de beginfase van de AI-platformverschuiving. We zien ontzettend veel toekomstige mogelijkheden voor creators, ontwikkelaars, startups, en voor iedereen. Het Gemini-tijdperk draait in de kern om het bevorderen van deze mogelijkheden. Dus laten we snel beginnen.

Het Gemini-tijdperk

Afgelopen jaar deelden we op het I/O-podium voor het eerst onze plannen voor Gemini. Het moest worden gebouwd als een geavanceerd model dat vanaf het begin native multimodaal is en over tekst, afbeeldingen, video en code kan redeneren. Het is baanbrekend in de manier waarop het elke input in elke output kan omzetten. Een 'I/O' voor een nieuwe generatie.

Daarna introduceerden we de eerste Gemini-modellen, de krachtigste tot nu toe. In elke multimodale benchmark scoorden ze topprestaties. Twee maanden later introduceerden we Gemini 1.5 Pro. Het was een doorbraak op het gebied van lange context en het kan consistent 1 miljoen tokens in productie uitvoeren, meer dan welk ander grootschalig basismodel tot nu toe.

We willen dat iedereen baat heeft bij de capaciteiten van Gemini. Daarom hebben we hard gewerkt om de vooruitgang die we hebben geboekt met jullie te delen. Tegenwoordig gebruiken meer dan 1,5 miljoen ontwikkelaars Gemini-modellen in onze tools. Jullie gebruiken het om code te debuggen, nieuwe inzichten op te doen en de volgende generatie AI-applicaties te ontwikkelen.

Ook hebben we onze producten verrijkt met de krachtige mogelijkheden van Gemini. Vandaag laten we daar enkele voorbeelden van zien in Zoeken, Foto's, Workspace en Android.

Vooruitgang in producten

Momenteel is Gemini geïntegreerd in al onze producten met 2 miljard gebruikers.

Ook hebben we nieuwe ervaringen geïntroduceerd waarbij mensen rechtstreeks met Gemini kunnen communiceren, zoals op mobiel. Dat kan via de app die nu beschikbaar is op Android en iOS, en via Gemini Advanced, dat toegang biedt tot onze meest capabele modellen. Binnen 3 maanden tijd hebben meer dan 1 miljoen mensen zich aangemeld om het uit te proberen, en dit aantal blijft groeien.

AI-overzichten uitbreiden in Zoeken

Een van de meest opwindende Gemini-transformaties vond plaats in Google Zoeken.

Het afgelopen jaar hebben we miljarden vragen beantwoord als onderdeel van onze Search Generative Experience. Met Gemini kunnen mensen op nieuwe manieren zoeken, nieuwe soorten langere, complexere vragen stellen en zelfs zoeken met foto's. Zo krijgen ze de beste resultaten die het web te bieden heeft.

We hebben deze ervaring buiten Labs getest en zijn erg tevreden dat niet alleen het gebruik van Zoeken is toegenomen, maar ook de gebruikerstevredenheid.

Ik heb het genoegen om aan te kondigen dat we deze gloednieuwe ervaring, AI Overviews, deze week voor iedereen in de VS lanceren. Binnenkort zijn ook andere landen aan de beurt.

We zijn Zoeken op ontzettend veel manieren aan het innoveren. Dankzij Gemini kunnen we veel krachtiger zoekervaringen creëren, ook binnen onze producten.

Ask Photos

Een voorbeeld is Google Foto's, dat we bijna negen jaar geleden hebben gelanceerd. Sindsdien gebruiken mensen het vaak om hun belangrijkste herinneringen te ordenen. Daardoor uploaden ze nu meer dan 6 miljard foto's en video's per dag.

Ze gebruiken Foto's ook graag om allerlei dingen in hun leven te zoeken. Met Gemini maken we dat een stuk makkelijker.

Stel dat je bij de parkeergarage betaalt, maar dat je het kenteken van je auto niet meer weet. Vroeger zocht je in Foto's op trefwoorden en daarna bladerde je door jaren aan afbeeldingen om je kenteken te vinden. Nu kun je simpelweg Foto's vragen om dat voor je te doen. Het weet welke auto's vaak voorkomen, bepaalt welke auto van jou is en vertelt je het kenteken.

Met Ask Photos kun je ook herinneringen grondiger doorzoeken. Als je bijvoorbeeld terugdenkt aan de belangrijke momenten in het vroege leven van je dochter Lucie, kun je nu aan Foto's vragen: 'Wanneer heeft Lucie leren zwemmen?'

Daarna kun je iets ingewikkelders vragen: 'Toon hoe Lucie steeds beter is gaan zwemmen.'

Gemini gaat verder dan een eenvoudige zoekopdracht en herkent verschillende contexten. Denk bijvoorbeeld aan baantjes trekken in het zwembad, snorkelen in de oceaan en de tekst en datums op haar zwemdiploma's. Foto's brengt het allemaal samen, zodat je er optimaal van geniet en fantastische herinneringen opnieuw beleeft. Deze zomer brengen we Ask Photos uit en in de toekomst zullen we nog meer mogelijkheden toevoegen.

Met Ask Photos kun je foto's en video's grondiger doorzoeken.

Met Ask Photos kun je foto's en video's grondiger doorzoeken.

Multimodaliteit en lange context voor meer beschikbare kennis

We hebben Gemini van de grond af aan multimodaal ontwikkeld om meer kennis op verschillende formaten beschikbaar te maken. Het is één model met alle modaliteiten ingebouwd. Het begrijpt dus niet alleen elk type input, maar zoekt er ook verbanden tussen.

Door deze multimodaliteit kun je veel meer vragen stellen en antwoorden krijgen. Lange context breidt dit nog verder uit, waardoor je nog meer informatie kunt terugvinden. Denk aan honderden pagina's tekst, uren audio of een uur video, hele codeopslagplaatsen, of een honderdtal fastfoodmenu's.

Voor zoveel menu's heb je een contextvenster van 1 miljoen tokens nodig. Dat is nu mogelijk met Gemini 1.5 Pro. Ontwikkelaars hebben het al op fascinerende manieren gebruikt.

De afgelopen maanden hebben we Gemini 1.5 Pro met lange context als preview uitgerold. We hebben een reeks kwaliteitsverbeteringen doorgevoerd op het gebied van vertalen, coderen en redeneren. Vanaf vandaag zie je deze updates terug in het model.

Ik kondig met trots aan dat we deze verbeterde versie van Gemini 1.5 Pro aan alle ontwikkelaars wereldwijd beschikbaar stellen. Daarnaast is Gemini 1.5 Pro met een contextvenster van 1 miljoen tokens nu in 35 talen beschikbaar voor consumenten in Gemini Advanced.

Uitbreiden naar 2 miljoen tokens in de privépreview

Een contextvenster van 1 miljoen tekens biedt compleet nieuwe mogelijkheden. Dat is spannend, maar ik denk dat we nog veel verder kunnen gaan.

Daarom breiden we het contextvenster vandaag uit naar 2 miljoen tokens en maken we het beschikbaar voor ontwikkelaars in een privépreview.

Het is geweldig om terug te blikken en te zien hoeveel vooruitgang we in een paar maanden tijd hebben geboekt. Deze mijlpaal is de volgende stap in onze reis naar het uiteindelijke doel van oneindige context.

Gemini 1.5 Pro voor Workspace

Tot zover hebben we twee technische ontwikkelingen besproken, multimodaliteit en lange context. Allebei op zich zijn ze krachtig, maar gecombineerd bieden ze nog meer mogelijkheden en intelligentie.

Dit is pas echt duidelijk in Google Workspace.

Mensen zoeken voortdurend naar hun e-mails in Gmail. Daarom zijn we dat veel doeltreffender aan het maken met Gemini. Als ouder wil je bijvoorbeeld graag op de hoogte blijven van alles wat er op de school van je kind speelt. Gemini zorgt ervoor dat je niets mist.

Je kunt Gemini nu vragen om alle recente e-mails van de school samen te vatten. Op de achtergrond identificeert het relevante e-mails en analyseert het zelfs bijlagen, zoals pdf's. Je krijgt een samenvatting van de belangrijkste punten en acties die ondernomen worden. Misschien was je een weekje weg en kon je de vergadering van de ouderraad niet bijwonen. De opname van de vergadering duurt een uur. Als hij in Google Meet is opgenomen, kun je Gemini vragen om de belangrijkste punten te tonen. Als een oudergroep op zoek is naar vrijwilligers en jij bent die dag vrij, kan Gemini een antwoord voor je opstellen.

Er zijn talloze andere voorbeelden van hoe Gemini het leven makkelijker kan maken. Gemini 1.5 Pro is vanaf vandaag beschikbaar in Workspace Labs. Aparna vertelt er meer over.

Spraak in NotebookLM

We bespraken net een voorbeeld met tekstoutput. Maar met een multimodaal model kunnen we nog veel meer doen.

We hebben veel vooruitgang geboekt op dit gebied en er is nog veel meer op komst. Audio-overzichten in NotebookLM zijn een goed voorbeeld. NotebookLM gebruikt Gemini om op basis van je bronmateriaal een persoonlijk en interactief audiogesprek te genereren.

Dit zijn de mogelijkheden die multimodaliteit biedt. Binnenkort kun je inputs en outputs mixen en matchen. Dat bedoelen we met een I/O voor een nieuwe generatie. Maar kunnen we nog verder gaan?

Verder gaan met AI-agenten

AI-agenten zijn een van de mogelijkheden waarmee we nog verder kunnen gaan. Ik beschouw ze als intelligente systemen die redeneren, plannen en zich informatie kunnen herinneren, meerdere stappen vooruit kunnen 'denken' en met verschillende software en systemen kunnen werken. Dit doen ze om iets voor jou voor elkaar te krijgen, en dat doen ze bovenal onder jouw toezicht.

Ze staan nog in de kinderschoenen, maar ik wil graag illustreren welke gebruiksscenario's we aan het uitwerken zijn.

Laten we beginnen met winkelen. Het is leuk om schoenen te kopen, maar een stuk minder leuk om ze te retourneren als ze niet passen.

Stel je voor dat Gemini alle stappen voor je uitvoert:

Je inbox zoeken naar de kassabon …
Het bestelnummer in je e-mail opzoeken …
Een retourformulier invullen …
Zelfs een dag plannen om het pakketje op te laten halen.

Veel makkelijker, toch? Laten we nog een voorbeeld nemen dat iets complexer is.

Stel dat je net naar Utrecht bent verhuisd. Je kunt je voorstellen dat Gemini en Chrome samenwerken om een aantal zaken voor te bereiden door van alles te organiseren, te beredeneren en samen te vatten.

Je wilt bijvoorbeeld de stad verkennen en diensten in de buurt vinden, van stomerijen tot hondenuitlaters. En je moet je nieuwe adres op tientallen websites bijwerken.

Gemini kan deze taken uitvoeren en vraagt zo nodig om meer informatie, zodat je altijd de controle behoudt.

Dat aspect is erg belangrijk. Terwijl we prototypes van deze ervaringen ontwikkelen, denken we veel na over hoe we dit kunnen doen op een manier die privé en veilig is en die voor iedereen werkt.

Dit zijn eenvoudige gebruiksscenario's, maar ze geven je een goed beeld van de soorten problemen die we willen oplossen door intelligente systemen te ontwikkelen die vooruitdenken, redeneren en plannen maken om jou te helpen.

Het belang voor onze missie

Met multimodaliteit, lange context en agenten brengt de kracht van Gemini ons dichter bij ons einddoel: AI voor iedereen nuttig maken.

We zien Gemini als het middel waarmee we het snelst onze missie kunnen volbrengen: de informatie in de wereld organiseren via elke input, deze toegankelijk maken via elke output, en deze combineren met de informatie in jouw wereld, op een manier die daadwerkelijk nuttig voor jou is.

Nieuwe wegen inslaan

Om het volledige potentieel van AI te realiseren, moeten we nieuwe wegen inslaan. Het team van Google DeepMind heeft hier hard aan gewerkt.

Veel mensen waren erg enthousiast over 1.5 Pro en het lange contextvenster. Maar we hoorden ook van ontwikkelaars dat ze iets snellers en kosteneffectievers wilden. Daarom introduceren we morgen Gemini 1.5 Flash, een lichter model gebouwd om te schalen. Het is geoptimaliseerd voor taken waarbij lage latentie en kosten het belangrijkst zijn. 1.5 Flash is vanaf dinsdag beschikbaar in AI Studio en Vertex AI.

Als we verder vooruitkijken, hebben we altijd al een universele agent willen creëren die nuttig is in het dagelijks leven. Project Astra kan multimodale informatie verwerken en in realtime gesprekken voeren.

We hebben ook vooruitgang geboekt op het gebied van video- en beeldgeneratie met Veo en Imagen 3. Daarnaast hebben we Gemma 2.0 geïntroduceerd, onze volgende generatie open modellen voor verantwoorde AI-innovatie. Lees er meer over van Demis Hassabis.

Infrastructuur voor het AI-tijdperk: de introductie van Trillium

State-of-the-art modellen trainen vereist veel rekenkracht. De vraag vanuit de sector naar ML-compute is de afgelopen 6 jaar met factor 1 miljoen gegroeid. En elk jaar vertienvoudigt de vraag.

Google is hiervoor gebouwd. Al 25 jaar investeren we in technische infrastructuur van wereldklasse, van de geavanceerde hardware die Zoeken aanstuurt tot onze speciale tensorverwerkingseenheden die onze AI-ontwikkelingen mogelijk maken.

Gemini is volledig getraind en geleverd op onze vierde en vijfde generatie TPU's. Andere toonaangevende AI-bedrijven, waaronder Anthropic, hebben hun modellen ook op TPU’s getraind.

Vandaag kondigen we met trots onze 6e generatie TPU's aan, Trillium genaamd. Trillium is onze krachtigste en meest efficiënte TPU tot nu toe. Deze generatie rekent 4,7 maal sneller per chip ten opzichte van chips van de vorige generatie, TPU v5e.

Eind 2024 maken we Trillium beschikbaar voor onze Cloud-klanten.

Naast onze TPU's bieden we met trots CPU's en GPU's aan die elke werklast ondersteunen.

Dit zijn bijvoorbeeld de nieuwe Axion-processors die we vorige maand hebben aangekondigd, onze eerste Arm-gebaseerde CPU op maat met eersteklas prestaties en energie-efficiëntie.

We zijn er ook trots op dat we een van de eerste cloudproviders zijn die de geavanceerde Blackwell GPU's van NVIDIA aanbieden, die begin 2025 op de markt komen. We hebben het geluk dat we al lang samenwerken met NVIDIA en kijken ernaar uit om de baanbrekende mogelijkheden van Blackwell aan onze klanten aan te bieden.

Chips vormen een fundamenteel onderdeel van ons geïntegreerde end-to-end-systeem, van prestatie-geoptimaliseerde hardware en open software tot flexibele verbruiksmodellen. Dit komt allemaal samen in onze AI Hypercomputer, een baanbrekende supercomputerarchitectuur.

Bedrijven en ontwikkelaars gebruiken hem om complexere uitdagingen aan te pakken. Dat is meer dan tweemaal zo efficiënt als het kopen van de ruwe hardware en chips. De vooruitgang die we hebben geboekt met onze AI Hypercomputer wordt deels mogelijk gemaakt door de manier waarop we vloeistofkoeling in onze datacenters toepassen.

We doen dit al bijna tien jaar, lang voordat het state-of-the-art werd in de sector. De totale capaciteit van onze koelinstallaties bedraagt nu bijna 1 gigawatt, en deze blijft maar groeien. Het is bijna 70 keer de capaciteit van welke andere koelinstallatie dan ook.

Dat komt door de enorme schaal van ons netwerk, dat onze infrastructuur wereldwijd verbindt. Ons netwerk beslaat meer dan 3,2 miljoen kilometer aan glasvezelkabel op land en in de zee, ruim 10 keer (!) het bereik van de volgende toonaangevende cloudprovider.

We blijven de investeringen doen die nodig zijn om AI-innovatie te bevorderen en state-of-the-art mogelijkheden te bieden.

Het spannendste hoofdstuk voor Zoeken tot nu toe

Ons oorspronkelijke product, Zoeken, is een van de producten waaraan we de meeste investeringen en innovatie hebben gewijd. 25 jaar geleden hebben we Zoeken gecreëerd om mensen te helpen om grip te krijgen op de golven aan online informatie.

Bij elke platformverandering hebben we grenzen verlegd om vragen beter te beantwoorden.

Op mobiel hebben we met behulp van betere context, locatiegegevens en realtime informatie nieuwe soorten vragen en antwoorden mogelijk gemaakt. Door de vooruitgang in het begrip van natuurlijke taal en computerzicht zijn er nu nieuwe manieren om te zoeken. Bijvoorbeeld met je stem, door te neuriën om je favoriete nummer te vinden, of met een foto van een bloem die je tijdens een wandeling hebt gezien. Je kunt nu zelfs beelden omcirkelen om een paar gave nieuwe schoenen te zoeken waar je oog op is gevallen. Koop ze gerust, want je kunt ze altijd terugsturen!

In het Gemini-tijdperk tilt Zoeken dit uiteraard naar een veel hoger niveau. Het combineert de kracht van onze infrastructuur, de nieuwste AI-mogelijkheden, onze hoge standaard voor informatiekwaliteit en onze decennialange ervaring in het beschikbaar maken van de rijkdom van het web. Het resultaat is een product dat het zware werk voor jou doet.

Google Zoeken is generatieve AI op het niveau van menselijke nieuwsgierigheid. Het is voor ons het meest opwindende hoofdstuk van Zoeken tot nu toe. Lees meer over het Gemini-tijdperk van Zoeken van Liz Reid.

Intelligentere Gemini-ervaringen

Gemini is meer dan een chatbot. Het is ontworpen als persoonlijke, behulpzame assistent die namens jou complexe taken uitvoert en actie onderneemt.

Interactie met Gemini moet intuïtief zijn en als een gesprek voelen. Daarom kondigen we Live aan, een nieuwe Gemini-ervaring die deze visie een stapje dichterbij brengt. Via Live kun je met je stem een diep gesprek met Gemini voeren. Later dit jaar geven we Gemini Advanced 2 miljoen tokens, waardoor je zeer zware bestanden zoals video en lange code kunt uploaden en analyseren. Sissie Hsiao vertelt er meer over.

Gemini voor Android

Met miljarden Android-gebruikers wereldwijd zijn we verheugd om een nog meer geïntegreerde Gemini-ervaring op besturingssysteemniveau te introduceren. Als je nieuwe AI-assistent staat Gemini klaar om je altijd en overal te helpen. We hebben Gemini-modellen in Android geïntegreerd, waaronder in ons nieuwste apparaatmodel: Gemini Nano met multimodaliteit. Nano verwerkt tekst, afbeeldingen, audio, spraak, maakt nieuwe ervaringen mogelijk en houdt tegelijkertijd informatie privé op je apparaat. Lees hier al het nieuws over Android.

Onze verantwoorde benadering van AI

We blijven de kansen van AI met beide handen aangrijpen en dat doen we enthousiast. Ook zorgen we ervoor dat we dat op een verantwoorde manier doen. We ontwikkelen een baanbrekende techniek die we door AI-ondersteunde red teaming noemen. Deze techniek borduurt voort op de doorbraken in gaming van Google DeepMind, zoals AlphaGo. Daarnaast hebben we onze technische watermerkinnovaties, zoals SynthID, uitgebreid met twee nieuwe modaliteiten, tekst en video. Dit maakt het makkelijker om door AI gegenereerde content te identificeren. James Manyika vertelt er meer over.

Samen de toekomst creëren

Uit dit alles blijkt de enorme vooruitgang die we hebben geboekt terwijl we op een gedurfde en verantwoorde manier AI voor iedereen nuttig maken.

Voordat we afsluiten, is er volgens mij iemand die telt hoe vaak we vandaag AI noemen. En ik neem aan dat we het nog een paar keer zullen noemen voordat we klaar zijn.

Deze telling is meer dan een uitsmijter. Hij weerspiegelt iets veel diepers. We zetten AI al lange tijd voorop. Met tientallen jaren aan baanbrekend onderzoek hebben we de weg vrijgemaakt voor veel van de moderne doorbraken die vooruitgang op het gebied van AI mogelijk maken, zowel voor ons als voor de hele sector. Daarnaast hebben we:

toonaangevende infrastructuur gebouwd voor het AI-tijdperk,
baanbrekende innovatie gerealiseerd voor Zoeken, nu mogelijk gemaakt door Gemini,
producten die op buitengewone schaal helpen, waaronder 15 producten met een half miljard gebruikers,
platforms waarmee iedereen de toekomst kan uitvinden, van partners tot klanten en van creators tot jullie allemaal.

Deze vooruitgang is alleen mogelijk dankzij onze ongelooflijke community van ontwikkelaars. Jullie maken hem tot werkelijkheid met de ervaringen en applicaties die jullie elke dag ontwikkelen. Dus voor iedereen hier bij Shoreline en de miljoenen mensen die over de hele wereld kijken: op de mogelijkheden die voor ons liggen en die we samen kunnen creëren!

GEPLAATST IN: