Onze visie op het bouwen van een universele AI-assistent

In het afgelopen decennium hebben we veel van de fundamenten gelegd voor het moderne AI-tijdperk, van het pionieren met de Transformer-architectuur waarop alle grote taalmodellen zijn gebaseerd, tot het ontwikkelen van agent-systemen zoals AlphaGo en AlphaZero.
We hebben deze technieken toegepast om doorbraken te realiseren in quantumcomputing, wiskunde, levenswetenschappen en algoritmische ontdekkingen. En we blijven ons volledig inzetten voor de breedte en diepte van ons fundamenteel onderzoek, werkend aan het uitvinden van de volgende grote doorbraken die nodig zijn voor kunstmatige algemene intelligentie (AGI).
Daarom werken we eraan om ons beste multimodale basismodel, Gemini 2.5 Pro, uit te breiden tot een ‘wereldmodel’ dat plannen kan maken en nieuwe ervaringen kan bedenken door aspecten van de wereld te begrijpen en te simuleren, net zoals het brein dat doet.
We zetten al een tijdje stappen in deze richting, van ons baanbrekende werk waarbij we agents trainden om complexe spellen zoals Go en StarCraft te beheersen, tot Genie 2, dat in staat is om vanuit één enkele afbeelding-prompt 3D-gesimuleerde omgevingen te genereren waarmee je kunt interacteren.
We zien nu al bewijs van deze capaciteiten naar voren komen in Gemini's vermogen om wereldkennis en redenering te gebruiken om natuurlijke omgevingen weer te geven en te simuleren, Veo's diepgaande begrip van intuïtieve fysica, en de manier waarop Gemini Robotics robots leert grijpen, instructies op te volgen en zich direct aan te passen.
Van Gemini een wereldmodel maken is een cruciale stap in de ontwikkeling van een nieuw, algemener en nuttiger soort AI — een universele AI-assistent. Dit is een AI die intelligent is, de context waarin je je bevindt begrijpt, en die namens jou kan plannen en actie kan ondernemen, op elk apparaat.
De live-mogelijkheden van Project Astra naar onze producten brengen
Onze uiteindelijke visie is om de Gemini-app te transformeren tot een universele AI-assistent die alledaagse taken voor ons uitvoert, onze alledaagse administratie verzorgt en verrassende nieuwe aanbevelingen naar boven haalt – waardoor we productiever worden en ons leven verrijkt wordt.
Dit begint met de mogelijkheden die we vorig jaar voor het eerst verkenden in ons onderzoeksprototype Project Astra, zoals videobegrip, schermdelen en geheugen.
Het afgelopen jaar hebben we deze mogelijkheden geïntegreerd in Gemini Live zodat iedereen ze kan ervaren. We blijven onophoudelijk verbeteren en nieuwe innovaties aan het front verkennen. Zo hebben we bijvoorbeeld de spraakuitvoer natuurlijker gemaakt met native audio, het geheugen verbeterd en computerbesturing toegevoegd.
We verzamelen nu feedback over deze mogelijkheden van vertrouwde testers en werken eraan om ze beschikbaar te maken in Gemini Live, in nieuwe ervaringen in Zoeken, de Live API voor ontwikkelaars en in nieuwe vormen, zoals een bril.
Bij elke stap van dit proces staan veiligheid en verantwoordelijkheid centraal in ons werk. We hebben onlangs een groot onderzoeksproject uitgevoerd waarin we de ethische kwesties rond geavanceerde AI-assistenten hebben onderzocht, en dit werk blijft ons onderzoek, onze ontwikkeling en onze implementatie informeren.
AI bouwen die voor jou kan multitasken
We hebben ook onderzocht hoe agent-capaciteiten mensen kunnen helpen multitasken, met Project Mariner. Dit is een onderzoeksprototype dat de toekomst van mens-agent interactie verkent, te beginnen met browsers.
Sinds de lancering van Project Mariner afgelopen december werken we nauw samen met een groep vertrouwde testers om feedback te verzamelen en de experimentele mogelijkheden ervan te verbeteren.
Project Mariner omvat nu een systeem van agents dat tot tien verschillende taken tegelijk kan voltooien. Deze agents kunnen je helpen informatie op te zoeken, boekingen te maken, dingen te kopen, onderzoek te doen en meer — allemaal tegelijkertijd.
Het vernieuwde Project Mariner is beschikbaar voor Google AI Ultra-abonnees in de VS. We brengen de computermogelijkheden ervan naar de Gemini API en we zijn van plan om gedurende het jaar meer van zijn mogelijkheden naar andere Google-producten te brengen.
Lees meer over onze agent-capaciteiten in Zoeken en de Gemini-app.
Met dit, en al ons baanbrekende werk, bouwen we aan AI die persoonlijker, proactiever en krachtiger is, ons leven verrijkt, het tempo van wetenschappelijke vooruitgang versnelt en een nieuw gouden tijdperk van ontdekking en verwondering inluidt.