I/O 2026: Nadchodzi era agentów Gemini
Poniżej znajduje się transkrypcja wypowiedzi prezesa Google, Sundara Pichaia, wygłoszonej podczas konferencji Google I/O 2026, zredagowana i uzupełniona o dodatkowe informacje dotyczące przedstawionych nowości. Wszystkie ogłoszenia znajdują się w naszej kolekcji.
Od czasu ostatniej konferencji I/O minął rok pełen premier, postępów technologicznych i błyskawicznego rozwoju. W obecnej fazie rozwoju sztucznej inteligencji użytkownicy chcą dostrzegać korzyści w usługach, których używają na co dzień. Właśnie na tym aspekcie skupiły się ostatnie działania, co odzwierciedlają nowości oraz funkcje prezentowane podczas tegorocznej edycji wydarzenia.
Dziesięć lat temu zmieniliśmy kierunek działalności firmy, stawiając na pierwszym miejscu sztuczną inteligencję. Nadal uważamy ją za najskuteczniejszy sposób realizacji naszej misji i poprawy jakości życia ludzi na szeroką skalę. Dlatego stosujemy zróżnicowane, kompleksowe podejście do innowacji w zakresie AI – od niestandardowych układów scalonych i bezpiecznych fundamentów, przez światowej klasy badania i modele, aż po usługi i platformy, z których korzystają miliardy ludzi. Takie podejście pozwala nam szybciej wprowadzać zmiany i wdrażać innowacje w sposób, który ożywia każdy obszar działalności firmy.
To fascynujące, jak wszechstronnie ludzie wykorzystują sztuczną inteligencję. Aplikacja Gemini wspiera ich w przygotowaniach do egzaminów. Modele generatywne, takie jak Lyria i Veo, stają się naturalną częścią procesów twórczych. Narzędzia AI pomagają również w pisaniu kodu i szybkim urzeczywistnianiu innowacyjnych pomysłów.
Dynamiczny rozwój sztucznej inteligencji
Indywidualne historie ludzi korzystających ze sztucznej inteligencji to najlepszy miernik postępu. Aby zrozumieć skalę, w jakiej wdrażamy AI, możemy też użyć innego wskaźnika – tokenów, czyli podstawowych jednostek danych przetwarzanych przez nasze modele, z których wiele odpowiada konkretnemu rozwiązywanemu problemowi.
Dwa lata temu na wszystkich platformach przetwarzaliśmy 9,7 biliona tokenów miesięcznie. To imponująca liczba. Do ubiegłorocznej konferencji I/O wynik wzrósł do około 480 bilionów tokenów, a dzisiaj jest on siedmiokrotnie wyższy. Obecnie przetwarzamy w Google ponad 3,2 biliarda tokenów każdego miesiąca.
To ważna historia o usługach Google, która pokazuje, jak korzystają z nich użytkownicy – zwłaszcza programiści i przedsiębiorstwa:
- Każdego miesiąca ponad 8,5 miliona osób tworzy nowe aplikacje oraz rozwiązania przy użyciu modeli Google.
- Interfejsy API modeli Google przetwarzają obecnie około 19 miliardów tokenów na minutę.
- W ciągu ostatnich 12 miesięcy ponad 375 klientów Google Cloud przetworzyło po ponad bilionie tokenów. Świadczy to o ogromnym zapotrzebowaniu na rozwiązania AI w różnych branżach.
Dynamika rozwoju naszych usług
Obecnie 13 usług Google każdego miesiąca przyciąga ponad miliard użytkowników. Pięć z nich przekroczyło już barierę 3 miliardów osób.
Modele Gemini skutecznie popularyzują nasze rozwiązania. Zwiększają również częstotliwość korzystania z nich.
Wszystko zaczyna się od wyszukiwarki, która zapewnia korzyści płynące z generatywnej sztucznej inteligencji większej liczbie osób niż jakakolwiek inna usługa na świecie. Z Przeglądów od AI korzysta obecnie ponad 2,5 miliarda aktywnych użytkowników miesięcznie. Tryb AI okazał się prawdziwym przełomem i największą jak dotąd aktualizacją wyszukiwarki. W ciągu zaledwie roku liczba aktywnych użytkowników miesięcznie przekroczyła już miliard.
Kiedy użytkownicy używają funkcji opartych na AI w wyszukiwarce, częściej z niej korzystają. Wyszukiwarka nie służy już wyłącznie do pojedynczych zapytań. Coraz bardziej przypomina aktywną konwersację oraz dostarcza głębszych spostrzeżeń i daje dostęp do ogromu zasobów z sieci.
Kolejnym obszarem, w którym wprowadzamy szybkie zmiany, jest aplikacja Gemini. W zeszłym roku podczas konferencji I/O aplikacja Gemini miała 400 milionów aktywnych użytkowników miesięcznie. Obecnie liczba ta przekroczyła 900 milionów, co oznacza ponad dwukrotny wzrost w ciągu roku. W tym samym czasie liczba zadawanych każdego dnia pytań wzrosła ponad siedmiokrotnie.
Wprowadziliśmy wiele wyjątkowych funkcji, takich jak Personal Intelligence, dzięki którym odpowiedzi stają się bardziej osobiste i pomocne. Do tej pory za pomocą naszych modeli generowania obrazów Nano Banana wygenerowano ponad 50 miliardów grafik. To prawdziwy hit minionego roku, który pokazuje, jak wiele kreatywności skrywa świat.
Naturalna, konwersacyjna AI w usługach
Na odkrycie czeka również spory potencjał produktywności. W ciągu ostatniego roku wprowadzaliśmy bardziej naturalne rozmowy z Gemini bezpośrednio w naszych usługach. Niedawno aplikacja Mapy otrzymała największą aktualizację od dziesięciu lat, w tym funkcję o Zapytaj Mapy. Użytkownicy korzystają z niej, by zadawać bardziej złożone i znacznie dłuższe pytania.
Teraz bardziej naturalna, konwersacyjna AI pojawia się w kolejnych naszych usługach.
Zapytaj YouTube
Codziennie ludzie zadają YouTube wiele pytań. W serwisie można znaleźć mnóstwo świetnych filmów, ale czasami trudno zdecydować, od czego zacząć.
Funkcja Zapytaj YouTube całkowicie zmienia sposób korzystania z serwisu. Dzięki niej informacje są bardziej przystępne, a ich przeglądanie łatwiejsze. Zobaczysz filmy najlepiej odpowiadające Twoim zainteresowaniom, a co najważniejsze – aplikacja od razu przejdzie do fragmentu filmu, który najbardziej Cię interesuje.
Obecnie rozpoczynamy testy funkcji Zapytaj YouTube, która tego lata zostanie wprowadzona na szeroką skalę w Stanach Zjednoczonych.
Dokumenty Live ze sterowaniem głosowym
Często chcemy realizować zadania w tempie wypowiadanych słów. Dziś jest to znacznie łatwiejsze. Wszystko dzięki ogromnemu postępowi w dziedzinie modeli audio.
Funkcja Dokumenty Live to nowe otwarcie. Wcześniej, aby stworzyć dokument za pomocą Gemini, trzeba było wpisać precyzyjnego prompta. Dzięki Dokumentom Live wystarczy wypowiedzieć na głos wszystko, co przychodzi Ci do głowy, a Gemini zajmie się resztą.
W przyszłości będzie można tworzyć nowe dokumenty i edytować je bezpośrednio przy użyciu głosu. Usługa Dokumenty Live zostanie udostępniona subskrybentom tego lata, a wraz z nią w serwisach Gmail i Keep pojawią się zaawansowane funkcje głosowe.
Infrastruktura wspiera szeroką skalę innowacji
To niesamowite, jak szybko wprowadzamy innowacje we wszystkich naszych usługach. Obsługa użytkowników na taką skalę przy jednoczesnym wspieraniu przedsiębiorstw i programistów na całym świecie wymaga ogromnych inwestycji w infrastrukturę. Inwestujemy zarówno w teraźniejszość, jak i w przyszłość. W 2022 roku wydawaliśmy 31 miliardów dolarów rocznie na nakłady inwestycyjne. W tym roku spodziewamy się, że kwota ta będzie sześciokrotnie wyższa i wyniesie około 190 miliardów dolarów. Kluczową częścią tych inwestycji są nasze niestandardowe układy scalone.
Dziesięć lat temu podczas konferencji I/O zaprezentowaliśmy nasz pierwszy komercyjny procesor tensorowy (TPU). Od tego czasu zrewolucjonizowaliśmy sposób myślenia o tworzeniu infrastruktury AI. Niedawno podczas konferencji Cloud Next przedstawiliśmy TPU 8. generacji. Po raz pierwszy zastosowaliśmy dwa układy scalone o wyspecjalizowanych architekturach przeznaczonych odpowiednio do uczenia i wnioskowania: TPU 8t i 8i.
- TPU 8t jest zoptymalizowany pod kątem wstępnego uczenia na dużą skalę i zapewnia prawie trzykrotnie większą moc obliczeniową niż nasze urządzenia poprzedniej generacji. Przyjęliśmy zupełnie inne podejście do infrastruktury szkoleniowej. Dzięki JAX i Pathways trening nie jest już ograniczony przez pojedyncze, ogromne centrum danych. Zamiast tego możemy teraz płynnie rozdzielać szkolenie na wiele lokalizacji, skalując je na ponad milion TPU na całym świecie. To daje nam możliwość stworzenia największego klastra szkoleniowego na Ziemi. Dla osób tworzących modele oznacza to trenowanie większych, bardziej wydajnych modeli w ciągu tygodni, a nie miesięcy.
- TPU 8i zaprojektowaliśmy z myślą o wnioskowaniu. Znacznie podnieśliśmy szybkość działania na każdym etapie. Ponieważ 27 lat pracy nad wyszukiwarką nauczyło nas, że opóźnienia mają znaczenie.
Oprócz szybkości myślimy również o zrównoważonym skalowaniu. Oba układy są bardziej energooszczędne i zapewniają nawet dwukrotnie wyższą wydajność na wat
Gemini Omni
Rozwój TPU pozwala nam osiągać postępy w zakresie modeli, kodowania i agentów. Sztuczna inteligencja przechodzi od przewidywania tekstu do symulacji rzeczywistości. Pracujemy nad poszerzaniem granic możliwości tych modeli.
Gemini Omni to nowy model, który potrafi generować wyniki w dowolnej postaci wyjściowej na podstawie dowolnych danych wejściowych. Zaczynamy od plików wideo, a z czasem udostępnimy również obsługę obrazów i tekstu. Nowy model łączy inteligencję Gemini z modelami generującymi multimedia – to ogromny krok naprzód w rozumieniu świata. Wprowadzamy na rynek pierwszy model z rodziny Omni: Gemini Omni Flash.
Model Gemini Omni Flash jest dostępny od dzisiaj. Można z niego skorzystać w aplikacji Gemini, usłudze Google Flow oraz na YouTube Shorts. W najbliższych tygodniach udostępnimy go również programistom i klientom korporacyjnym za pośrednictwem interfejsów API.
Aktualizacje i nowi partnerzy SynthID
Wraz z rozwojem generatywnej AI rośnie zapotrzebowanie na większą przejrzystość. Badania pokazują, że ludzie potrafią prawidłowo zidentyfikować wysokiej jakości filmy typu deepfake tylko w około jednej czwartej przypadków. Trzy lata temu wprowadziliśmy SynthID – znak wodny niewidoczny gołym okiem. Od momentu wprowadzenia SynthID znalazł się już na ponad stu miliardach obrazów i filmów, a także na materiałach audio o łącznej długości sześćdziesięciu tysięcy lat.
Miliony osób korzystają z detektora SynthID w aplikacji Gemini, aby weryfikować treści generowane przez sztuczną inteligencję. Teraz idziemy o krok dalej i wprowadzamy narzędzie umożliwiające weryfikację treści we wszystkich naszych usługach. Dzięki temu dowiesz się, czy źródłem treści jest sztuczna inteligencja, czy aparat fotograficzny, a także czy została ona zmodyfikowana za pomocą narzędzi generatywnej AI. Chcemy, aby więcej osób miało łatwy dostęp do tych rozwiązań, dlatego nowe narzędzie oraz SynthID trafią do wyszukiwarki i przeglądarki Chrome.
Oczywiście rozwiązanie to sprawdzi się na szeroką skalę tylko wtedy, gdy więcej partnerów zdecyduje się na umieszczanie znaków wodnych w swoich treściach generowanych przez AI.
W zeszłym roku do inicjatywy SynthID przystąpiła firma Nvidia. Dzisiaj z radością ogłaszamy, że do dołączają do niej również OpenAI, Ka-Kow i Eleven Labs. Cieszy nas ta współpraca między branżami. Z niecierpliwością czekamy na nawiązanie współpracy z kolejnymi partnerami i wyznaczenie standardów przejrzystości w erze sztucznej inteligencji.
Gemini 3.5 Flash
Kilka miesięcy temu wprowadziliśmy całą rodzinę modeli Gemini 3. Jak dotąd jest to nasza najlepiej zintegrowana ich seria. Bardzo cieszyło nas, że programiści stosują Flash w codziennej pracy i projektują niesamowite rozwiązania dzięki głębokiemu rozumowaniu i możliwościom multimodalnym wersji Pro. Ciężko pracowaliśmy nad rozwijaniem tych modeli. Skupiliśmy się zwłaszcza na pisaniu kodu przy pomocy agentów, a także na zadaniach długoterminowych i przepływach pracy, które rzeczywiście są stosowane w firmach.
Teraz przedstawiamy Gemini 3.5 Flash, pierwszy z nowej serii modeli, które łączą przełomową inteligencję z działaniem. Warto podkreślić dwie rzeczy:
- W porównaniu do 3.1 Pro model 3.5 Flash spisuje się lepiej we wszystkich testach. Zrobił olbrzymie postępy w pisaniu kodu. Spójrzcie też na niezwykły skok w wynikach GDPVal – oceny przydatności do wykonywania rzeczywistych, ekonomicznie wartościowych zadań.
- Gemini 3.5 Flash naprawdę dużo potrafi. To przełomowy model, który może się równać z najlepszymi. Jest jednak bardzo szybki, co sprawia, że gdy popatrzymy na parametr inteligencji skorelowanej z szybkością uzyskiwania wyników, gra on w osobnej lidze, to znaczy w prawym górnym kwadrancie. Z kolei liczba tokenów wyjściowych na sekundę mówi nam, że jest on 4 razy szybszy niż inne najnowocześniejsze modele.
Nowy model zmienił też wiele w wewnętrznej pracy Google. Używamy 3.5 Flash z przepisaną na nowo wersją Antigravity, naszej platformy programistycznej, na której główną rolę odgrywają agenty, co zdecydowanie przyspiesza tworzenie kodu. W marcu we wszystkich narzędziach programistycznych opartych na AI przetwarzaliśmy pół biliona tokenów dziennie, i co kilka tygodni podwajamy tę liczbę. Obecnie przetwarzamy ponad 3 biliony tokenów dziennie. Rozwój na taką skalę oznacza mnóstwo informacji zwrotnej, która ulepsza Flash 3.5.
Fascynującą cechą modelu Flash jest to, że umożliwia on uzyskanie innowacyjnych wyników za połowę sumy, którą trzeba wydać na wygenerowanie ich przez porównywalne, również nowatorskie modele. Z tego, co nam wiadomo, wiele firm wydało już swój roczny budżet tokenów, a mamy dopiero maj. Firmom, które oprócz innych najnowocześniejszych modeli wykorzystywałyby również Flash, przyniósłby on oszczędności. Dla porównania największe firmy przetwarzają około biliona tokenów dziennie. Gdyby zdecydowały się przenieść 80% zadań z innych prekursorskich modeli do Gemini 3.5 Flash, oszczędziłyby rocznie ponad miliard dolarów. To rzeczywiste sumy, które można zainwestować w rozwój firmy.
Gemini 3.5 Flash jest już dostępny dla wszystkich użytkowników naszych produktów i usług oraz interfejsów API. Wiążemy też duże nadzieje z Gemini 3.5 Pro. Używamy go w firmie i rozwija się wspaniale. Planujemy wprowadzić go w przyszłym miesiącu.
Antigravity 2.0
Model 3.5 Flash oferujemy także programistom w Antigravity.
Antigravity nie jest już tylko środowiskiem programistycznym. Usługa ta rozrosła się w platformę do tworzenia kohort autonomicznych agentów AI i zarządzania nimi. Dotyczy to też Antigravity 2.0, nowej niezależnej aplikacji na komputery, pełniącej rolę centralnego miejsca interakcji agentów, w którym każdy użytkownik może nimi administrować do realizacji dowolnych zadań. Opracowana przez nas nowa wersja Flash jest naprawdę dobrze zoptymalizowana, już nie 4, ale 12 razy szybsza od innych najbardziej zaawansowanych modeli.
Od dziś użytkownicy Antigravity mogą doświadczyć tej szybkości. Tu przeczytasz więcej na temat Antigravity 2.0
Gemini Spark do usług przez całą dobę
Gemini 3.5 razem z Antigravity otwierają przed użytkownikami nowy świat agentów i ich możliwości. Firmom i programistom dostarczamy agenty nie od dziś, ale teraz skupiliśmy się na bezpiecznym zaoferowaniu ich niezwykłych możliwości konsumentom. Teraz agenty mogą pracować dla każdego i będzie je można spotkać w wielu naszych usługach.
Na szczególną uwagę zasługuje Gemini Spark, osobisty agent AI w aplikacji Gemini, który pomaga w organizacji cyfrowego życia. Działa w imieniu użytkownika i pod jego nadzorem.
- Jego zapleczem są specjalnie dla niego przeznaczone maszyny wirtualne w Google Cloud. Pracuje przez całą dobę, co eliminuje to konieczność stałego utrzymywania włączonego komputera.
- Wykorzystuje Gemini 3.5 oraz technologię Google Antigravity, co pozwala na łatwe wykonywanie długoterminowych zadań w tle.
- Spark bezproblemowo integruje się z różnymi narzędziami, wliczając w to nasze usługi. W nadchodzących tygodniach planujemy wprowadzenie obsługi narzędzi zewnętrznych przez MCP.
- Z agentem Spark możesz współpracować tak, jak Ci wygodnie: w aplikacji Gemini, a wkrótce również w e-mailach i na czacie.
- Jeśli masz Androida, możesz na bieżąco śledzić aktualizacje i postęp zadań wykonywanych przez agenty takie jak Spark w nowej przestrzeni interfejsu zwanej Android Halo, która pojawi się jeszcze w tym roku. Pod koniec lata Spark zacznie działać bezpośrednio w Chrome, jako agent przeglądania internetu.
Zaufani testerzy będą mogli wypróbować Gemini Spark jeszcze w tym tygodniu, a subskrybenci Google AI Ultra w Stanach Zjednoczonych otrzymają wersję Beta tydzień później.
Wyszukiwarka w erze agentów AI
Gemini Spark to pierwsza usługa wykorzystująca modele z serii 3.5 oraz platformę Antigravity. Ich połączenie daje nam nowe sposoby na przyspieszenie naszej misji i przekształcenie naszych usług tak, by były zdecydowanie bardziej przydatne.
W erze agentów AI wyszukiwarka Google zyska mnóstwo nowych możliwości i będzie zapewniała jeszcze większą pomoc. Od dzisiaj wprowadzamy w wyszukiwarce agenty informacyjne. To spersonalizowane agenty AI, które będzie można skonfigurować do pracy w tle przez całą dobę, co pozwoli im wyszukiwać to, co akurat potrzebne, w idealnie dopasowanym momencie. Będą też pomagały użytkownikom w podejmowaniu działań. Agenty informacyjne będą dostępne już latem, na początek dla posiadaczy subskrypcji Google AI Pro oraz Ultra.
Inną funkcją wyszukiwarki opartej na agentach jest włączenie możliwości pisania przez nie kodu. Technologia Gemini 3.5 Flash i Google Antigravity pozwolą wyszukiwarce na dostarczanie spersonalizowanych usług odpowiadania na pytania, wykorzystujących dynamiczną grafikę i interaktywne treści wizualne. Te generatywne możliwości interfejsu użytkownika staną się dostępne bezpłatnie dla wszystkich już tego lata.
W przypadku zadań, które angażują użytkownika na dłużej i do których trzeba wracać, wyszukiwarka również robi krok do przodu, tworząc trwałe, spersonalizowane panele, czy też tabele postępów, do których zawsze można zajrzeć. Można o nich myśleć jako o mini aplikacjach do realizacji zadań określonych przez użytkownika. Za kilka miesięcy w wyszukiwarce będzie można spersonalizować także usługę Antigravity. Najpierw zaoferujemy tę opcję osobom z subskrypcjami Google AI Pro oraz Ultra w Stanach Zjednoczonych.
Więcej o erze agentów Gemini
O czym jeszcze mówiliśmy podczas I/O:
- Podsumowanie planu dnia to kolejny już skonfigurowany agent, który pojawi się w aplikacji Gemini. Zapewni on spersonalizowany przegląd głównych informacji z poczty, kalendarza i listy zadań, dzięki czemu użytkownicy będą dobrze zorientowani w tym, o czym powinni pamiętać. Nie chodzi tylko o proste podsumowania danych – do zadań agenta należą także: ustalanie priorytetów, porządkowanie i proponowanie następnych kroków, które następnie można łatwo wprowadzić w życie. Wystarczy rano przejrzeć to, co przygotuje.
- Nowego agenta wprowadza też dzisiaj Google Flow. Będzie planował według wskazówek oraz pod kontrolą użytkownika, realizował złożone zadania. Jest on oparty na modelach Gemini i oferuje pomoc przy głębszym zrozumieniu projektów, poszukiwaniach fachowej wiedzy, a także przy rozpoczynaniu burzy mózgów i procesów twórczych oraz wprowadzaniu zmian. Bezpośrednio we Flow można też utworzyć metodą vibe coding dowolne twórcze narzędzie do projektowania efektów wideo, rysowania animacji czy nakładania tekstu.
- Google Pics to nowe narzędzie AI do tworzenia i edytowania grafiki, które wykorzystuje model Nano Banana. Możesz w nim stworzyć, co tylko zechcesz i określić potrzebny Ci przy tym poziom kontroli. Niezależnie od tego, czy zaczynasz od czystego ekranu, czy zmieniasz gotowe zdjęcie, Pics traktuje każdy element jako osobny obiekt, a nie statyczny, płaski obraz. Pozwala to użytkownikom na tworzenie, zamianę i dopracowywanie konkretnych detali oraz wprowadzanie w życie swoich twórczych wizji w dokładnie wymarzonym kształcie. Google Pics mogą teraz wypróbowywać zaufani testerzy, a latem udostępnimy tę usługę posiadaczom subskrypcji Google AI Pro oraz Ultra w Workspace.
- Uchyliliśmy też rąbka tajemnicy na temat inteligentnych okularów, o których wspominaliśmy rok temu. Wersja audio będzie mogła podpowiadać Ci rzeczy prosto do ucha, a wersja z wyświetlaniem pokazywać potrzebne informacje w odpowiednim momencie. Obie wersje pozwalają na obsługę bez użycia rąk. Gemini chętnie pomoże, wystarczy zapytać. Okulary audio będą dostępne jako pierwsze, jeszcze tej jesieni.
- Gemini for Science łączy wiele narzędzi AI, które pomagają w przyspieszeniu badań naukowych. Podstawą tej usługi są możliwości analityczne oraz głębokie rozumowanie modeli Gemini, Deep Think i Deep Research, ale włączone zostaną do niej też nowe eksperymenty w Labs, jak również Science Skills, co pozwoli podłączyć platformy takie jak Google Antigravity do ponad 30 najważniejszych narzędzi i baz danych z dziedziny nauk biologicznych. Użytkownicy mogą zgłaszać chęć wypróbowania eksperymentów Gemini for Science w Google Labs, a z Science Skills można korzystać już dziś na Githubie oraz bezpośrednio w Antigravity.
Patrząc na piętrzące się innowacje, od infrastruktury stojącej za TPU 8i po przełomowe możliwości Gemini 3.5 i Antigravity, nie ma wątpliwości, że już wkroczyliśmy w erę agentów Gemini. Z zaciekawieniem patrzę w przyszłość. Wszystkie te innowacje nie tylko przyspieszą realizację naszej misji, ale przede wszystkim zmienią usługi Google tak, aby każdego dnia przynosiły jeszcze więcej korzyści użytkownikom na całym świecie.
Zobacz wszystko, co ogłosiliśmy.