Naše vize univerzálního AI asistenta

20. Kvě 2025

Rozšiřujeme Gemini tak, aby se stal skutečně světovým modelem. Takovým, který dokáže plánovat a představovat si nové zkušenosti simulací reálných aspektů našeho světa.

Demis Hassabis

CEO and Co-Founder, DeepMind

Během poslední dekády jsme položili mnoho základů pro moderní éru AI, od průkopnické architektury Transformer, na níž jsou založeny všechny velké jazykové modely, až po vývoj agentivních systémů, které se dokážou učit a plánovat jako AlphaGo a AlphaZero.

Tyto techniky jsme aplikovali k dosažení průlomů v oblasti kvantových počítačů, matematiky, přírodních věd i algoritmického výzkumu. A nadále znásobujeme šíři a hloubku našeho základního výzkumu a pracujeme na dalších velkých průlomech nezbytných pro AGI.

Součástí tohoto úsilí je i vývoj našeho dosud nejpokročilejšího multimodálního základního modelu Gemini 2.5 Pro. Naším cílem je vytvořit takzvaný „světový model“ – model, který dokáže chápat složité situace, plánovat a představovat si nové zkušenosti tím, že rozumí a dokáže simulovat aspekty našeho reálného světa podobně, jako lidský mozek.

Na této cestě jsme již dosáhli mnoha milníků. Začínali jsme pionýrským tréninkem agentů, kteří si poradili s komplexními hrami jako Go a StarCraft. Pokračovali jsme modelem Genie 2, který dokáže generovat 3D simulovaná prostředí, s nimiž můžete interagovat, na základě jediného obrazového promptu.

Dnešní schopnosti Gemini ukazují, jak lze díky rozsáhlým znalostem o světě a pokročilému uvažování realisticky simulovat přirozené prostředí. Podobné schopnosti má i model Veo, který rozumí intuitivní fyzice, nebo systém Gemini Robotics, který pomáhá robotům uchopovat, sledovat instrukce a přizpůsobovat se v reálném čase.

To, že směřujeme ke světovému modelu, vnímáme jako důležitý krok k nové, ještě užitečnější generaci umělé inteligence – univerzálnímu AI asistentovi. To jest k AI, která je inteligentní, která chápe kontext, v němž se nacházíte, a která na váš pokyn naplánuje a pak provede akci za vás. A to napříč zařízeními.

Projekt Astra a live funkce: Nová kapitola v interakci s AI

Naší vizí je, aby se Gemini aplikace stala vaším každodenním pomocníkem. Takovým, který za vás provede každodenní úkoly, postará se o rutinní admin a poskytne okouzlující nápady a doporučení. Zkrátka pomůže nám být výkonnější a obohatí náš den.

První krok k tomu představují tzv. live funkce, jejichž základy jsme položili v loňském roce v rámci výzkumného prototypu Project Astra. Testovali jsme porozumění videu, sdílení obrazovky a paměť.

Tyto funkce jsme během posledního roku integrovali do Gemini Live – zpřístupnili je uživatelům, průběžně vylepšovali a hledali nové možnosti jejich využití. Výsledkem je přirozenější hlasový výstup díky nativnímu audiu, lepší paměť a nové možnosti ovládání například prostřednictvím počítače.

Na základě zpětné vazby od testerů nyní pracujeme na tom, aby se živé funkce brzy objevily nejen v Gemini Live, ale i v dalších klíčových službách Googlu – jako je Vyhledávání, vývojářské rozhraní Live API nebo zcela nové typy zařízení, například chytré brýle.

Ve všech fázích vývoje přitom klademe důraz na bezpečnost a zodpovědnost. Nedávno jsme provedli velký výzkumný projekt, v jehož rámci jsme se detailně věnovali etickým otázkám, které přináší používání pokročilých AI asistentů – a tato práce i nadále informuje všechna naše rozhodnutí i další vývoj a nasazování.

Budování AI, která zvládne víc věcí najednou

Další důležitou oblastí, kterou rozvíjíme, je schopnost AI zvládat multitasking. Výzkumný prototyp s názvem Projekt Mariner zkoumá budoucnost interakce lidí a agentů počínaje prostředím prohlížeče.

Od prosince loňského roku úzce spolupracujeme s vybranou skupinou testerů, kteří nám pomáhají ladit detaily a přinášejí nám cennou zpětnou vazbu.

Díky tomu dnes Projekt Mariner nabízí systém, v němž může jeden agent vykonávat až deset různých úloh zároveň – ať už jde o vyhledávání informací, rezervace, nákupy, rešerše, nebo jiné úkoly. Vše probíhá paralelně a plynule.

Aktualizovaná verze Marineru je k dispozici uživatelům tarifu Google AI Ultra v USA. Některé možnosti lze využívat v Gemini API a v plánu je v průběhu roku zpřístupnit jeho možnosti i v dalších službách Googlu.

Vývojem nových technologií, testováním funkcí, sběrem zpětné vazby i pečlivým přístupem k etice směřujeme k umělé inteligenci, která bude osobnější, proaktivnější a schopnější než kdy dřív.

Věříme, že právě taková AI může urychlit vědecký pokrok, obohatit každodenní život a otevřít novou éru lidské tvořivosti a objevování.

Zveřejněno v:

Naše vize univerzálního AI asistenta

Projekt Astra a live funkce: Nová kapitola v interakci s AI

Budování AI, která zvládne víc věcí najednou

Související události