Nasza wizja stworzenia uniwersalnego asystenta AI

W ciągu ostatniej dekady wypracowaliśmy solidne podstawy nowoczesnej sztucznej inteligencji, od pionierskiej architektury Transformer, na której opierają się wszystkie duże modele językowe, po rozwijanie systemów agentowych, takich jak AlphaGo i AlphaZero. Dokonaliśmy również przełomowych osiągnięć w obliczeniach kwantowych, matematyce, naukach o życiu i odkryciach algorytmicznych. Nadal inwestujemy w szeroko zakrojone badania, pracując nad rozwinięciem kolejnych przełomowych rozwiązań niezbędnych do osiągnięcia ogólnej sztucznej inteligencji (AGI).
Dlatego, pracujemy nad rozszerzeniem naszego najlepszego multimodalnego modelu bazowego, Gemini 2.5 Pro, aby stał się „modelem świata”, który może tworzyć plany i wyobrażać sobie nowe doświadczenia poprzez rozumienie i symulowanie aspektów rzeczywistości, tak jak robi to ludzki mózg.
Od pewnego czasu podejmujemy kroki w tym kierunku, począwszy od pionierskiego szkolenia agentów w zakresie zaawansowanych gier, takich jak Go i StarCraft, po Genie 2, który potrafi generować symulowane środowiska 3D, z którymi można wchodzić w interakcje, zaczynając od jednego prompta graficznego.
Już teraz widzimy, jak Gemini potrafi wykorzystywać wiedzę o świecie i rozumować w celu przedstawiania i symulowania naturalnego środowiska. Veo intuicyjnie zyskuje głębokie rozumienie praw fizyki, a Gemini Robotics uczy roboty chwytania przedmiotów, wykonywania poleceń i dostosowywania się w czasie rzeczywistym.
Uczynienie z Gemini modelu świata jest kluczowym krokiem w opracowaniu nowego, bardziej ogólnego i użytecznego rodzaju sztucznej inteligencji – uniwersalnego asystenta AI. To rozwiązanie, które jest inteligentne, rozumie kontekst, w którym się znajdujesz, i może podejmować działania w Twoim imieniu na dowolnym urządzeniu.
Do naszych usług wprowadzamy możliwości prototypu Project Astra
Chcemy docelowo przekształcić aplikację Gemini w uniwersalnego asystenta AI, który będzie wykonywał za nas codzienne zadania i prozaiczne czynności oraz będzie źródłem inspirujących pomysłów, dzięki czemu zwiększy naszą produktywność i wzbogaci nasze życie.
Wszystko zaczyna się od praktycznych możliwości, które po raz pierwszy badaliśmy w zeszłym roku w ramach naszego prototypu badawczego Project Astra, takich jak przetwarzanie mowy, rozumienie filmów i pamięć.
W ciągu ostatniego roku integrowaliśmy te wciąż udoskonalane i nowe funkcje z Gemini Live, aby każdy mógł z nich skorzystać. Ulepszyliśmy interakcje głosowe, by były bardziej naturalne dzięki naturalnej modulacji głosu, ulepszonej pamięci i rozwiniętemu sterowaniu komputerowemu.
Zaczęliśmy zbierać opinie o tych funkcjach od zaufanych testerów i pracujemy nad wprowadzeniem ich do Gemini Live i innych usług, takich jak wyszukiwarka Google, interfejs Live API dla deweloperów, a także do nowych produktów, takich jak okulary.
Na każdym etapie tego procesu bezpieczeństwo i odpowiedzialność są kluczowe dla naszej pracy. W naszych największych dotychczas projektach etycznego przewidywania zbadaliśmy kwestie etyczne związane z wykorzystaniem zaawansowanych asystentów AI i na tym wciąż opieramy się w naszych badaniach, pracach rozwojowych i wdrożeniach.
Tworzymy sztuczną inteligencję, która może wykonywać wiele zadań jednocześnie
Badaliśmy również, w jaki sposób funkcje agentów AI mogą pomóc użytkownikom w wykonywaniu wielu zadań jednocześnie, w ramach Project Mariner. Jest to prototyp badawczy, który bada przyszłość interakcji człowiek-agent, zaczynając od przeglądarek.
Od momentu uruchomienia Project Mariner w grudniu ubiegłego roku ściśle współpracujemy z grupą zaufanych testerów, aby zbierać opinie i udoskonalać możliwości eksperymentalne.
Project Mariner obejmuje teraz system agentów, które mogą wykonywać do dziesięciu różnych zadań jednocześnie. Agenci mogą pomóc Ci wyszukiwać informacje, dokonywać rezerwacji, kupować potrzebne rzeczy, robić badania i wiele więcej – wszystko w tym samym czasie.
Zaktualizowana wersja Project Mariner jest dostępna dla subskrybentów Google AI Ultra w Stanach Zjednoczonych. W ciągu roku planujemy udostępnić niektóre z jej funkcji w większej liczbie usług Google.
Dowiedz się więcej o naszych funkcjach agentów AI w wyszukiwarce i aplikacji Gemini.
Dzięki temu i całej naszej pionierskiej pracy tworzymy sztuczną inteligencję, która jest bardziej osobista, proaktywna i zaawansowana, wzbogaca nasze życie, przyspiesza tempo postępu naukowego i zapoczątkowuje nową złotą erę odkryć.
