I/O 2026: Bem-vindos à era agêntica do Gemini
Nota do editor: segue abaixo uma transcrição editada do discurso do CEO do Google, Sundar Pichai, no Google I/O 2026, adaptada para incluir outras informações anunciadas no evento. Veja todos os anúncios em nosso acervo.
Tem sido um ano extraordinário desde nosso último I/O. Vivemos um período de lançamentos constantes, avanços tecnológicos e progresso acelerado. Agora, estamos na fase do ciclo de IA em que as pessoas querem ver valor nos produtos que usam diariamente. Estamos muito focados nisso e vocês enxergarão isso nos produtos e recursos anunciados hoje no I/O.
Dez anos após o Google se tornar uma empresa AI-first, nós continuamos vendo a IA como a forma mais profunda de avançarmos em nossa missão e melhorar a vida das pessoas em escala. É por isso que adotamos uma abordagem diferenciada e full-stack para a inovação em IA, desde o nosso silício customizado e base segura, passando por pesquisas e modelos de classe mundial, até produtos e plataformas que tocam bilhões de pessoas. Essa abordagem nos dá a capacidade de aprimorar nossos produtos e inovar com rapidez, de maneiras que estão transformando todas as áreas da empresa.
O mais incrível é como as pessoas estão usando a IA, sejam estudantes se preparando para provas com o app do Gemini, músicos e artistas usando os modelos generativos de IA, como o Lyria e o Veo, em seu processo criativo ou desenvolvedores programando e dando vida às suas ideias.
A IA impulsiona toda a nossa estrutura
As histórias de como as pessoas estão usando a IA são a melhor forma de medir o progresso. Para entender a escala em que as pessoas estão adotando IA, há também outro importante indicador: os tokens, que são as unidades fundamentais de dados processados por nossos modelos. Em muitos casos, eles representam um problema sendo resolvido.
Há dois anos, nossos modelos processavam 9,7 trilhões de tokens por mês em todas as nossas plataformas — um número enorme. No Google I/O do ano passado, esse número cresceu para aproximadamente 480 trilhões de tokens. E, hoje, esse número saltou sete vezes maior, chegando a 3,2 quatrilhões de tokens processados por mês.
Esses dados revelam uma história importante sobre nossos produtos, além de outras criações, especialmente de desenvolvedores e empresas:
- Mais de 8,5 milhões de desenvolvedores estão criando novos apps e experiências com nossos modelos mensalmente.
- Nossas APIs de nossos modelos atualmente processam cerca de 19 bilhões de tokens por minuto.
- Nos últimos 12 meses, mais de 375 clientes do Google Cloud processaram mais de 1 trilhão de tokens cada, o que representa uma demanda incrível pela IA em todos os setores.
A evolução dos nossos produtos
Atualmente, temos 13 produtos com mais de 1 bilhão de usuários. Cinco deles têm mais de 3 bilhões de usuários.
O grande motivo pelo qual mais pessoas estão usando nossos produtos e com mais frequência tem um nome: os modelos do Gemini.
Tudo começa com a Busca, que leva as vantagens da IA generativa para mais pessoas do que qualquer outro produto no mundo. A Visão Geral Criada por IA agora conta com mais de 2,5 bilhões de usuários ativos mensais. E o Modo IA foi uma grande revelação, nossa maior atualização feita na Busca até hoje. E foi aprovado: em apenas um ano, já ultrapassou 1 bilhão de usuários ativos mensais.
Quando as pessoas usam nossos recursos com tecnologia de IA na Busca, passam a usá-la mais vezes. A Busca deixou de ser um recurso para consultas únicas e se transformou em uma conversa contínua, que oferece insights mais profundos e conecta os usuários à imensidão da web.
O app do Gemini é outro produto com alta velocidade de inovação. No Google I/O do ano passado, o app do Gemini tinha 400 milhões de usuários ativos mensais. Hoje, ultrapassamos 900 milhões, ou seja, mais que o dobro em apenas um ano. Nesse mesmo período, o número de comandos diários cresceu mais de sete vezes.
Lançamos recursos exclusivos, como a Inteligência Personalizada, que customiza as respostas para deixá-las mais úteis. E, até o momento, mais de 50 bilhões de imagens já foram criadas com nossos modelos de geração de imagens Nano Banana. Ele é o lançamento de maior sucesso do último ano, o que demonstra quanta criatividade latente existe no mundo.
Produtos com IA de conversação natural
Também tem muita produtividade latente a ser explorada. Ao longo do último ano, levamos aos nossos produtos a opção de conversar diretamente com o Gemini, de forma natural. O Maps recebeu recentemente a maior atualização da década: ganhou o recurso Pergunte ao Maps. As pessoas começaram a usar a novidade para fazer perguntas mais complexas e muito mais longas.
Agora, estamos levando essa IA de conversação mais natural a ainda mais produtos.
Pergunte ao YouTube
Todos os dias, as pessoas acessam o YouTube com todo tipo de pergunta. Lá, tem muitos vídeos excelentes mas, às vezes, é difícil saber por onde começar.
O recurso Pergunte ao YouTube reinventou completamente essa experiência, deixando as informações muito mais fáceis de acessar e assimilar. Com ele, você encontra os vídeos que mais correspondem aos seus interesses e, melhor do que isso, vai direto para o trecho que interessa.
Estamos começando a testar o Pergunte ao YouTube, que será lançado nos EUA em meados deste ano.
Docs Live: ativação por voz
Muitas vezes, queremos dar um comando de voz e receber a tarefa pronta no mesmo instante. Atualmente, isso está se tornando possível graças aos avanços tecnológicos em nossos modelos de áudio.
O novo recurso Docs Live leva essa função a outro patamar. Antes, para criar um documento com o Gemini, era preciso digitar um comando detalhado. Com o Docs Live, você simplesmente dita tudo o que vier à mente e deixa o Gemini fazer o resto. Veja uma demonstração em tempo real:
Em breve, será possível criar e editar documentos na hora, usando comandos de voz. O Docs Live será lançado para assinantes em meados de 2026, e os recursos avançados de voz chegarão também ao Gmail e ao Keep nesse período.
Infraestrutura apoiando inovação em escala
É incrível observar o ritmo em que a inovação se propaga nos nossos produtos. Para manter tudo isso funcionando para nossos usuários, além de empresas e desenvolvedores do mundo todo, são necessários investimentos maciços em infraestrutura. Investimos para o presente e para o futuro. Em 2022, nosso investimento em bens de capital foi de US$ 31 bilhões. Este ano, esperamos algo em torno de seis vezes esse valor, ou seja, cerca de US$ 190 bilhões. Nosso aporte em silício customizado é parte fundamental disso.
Há uma década, anunciamos nossa primeira Unidade de Processamento de Tensor (TPU) comercial no I/O. Desde então, transformamos o desenvolvimento de soluções para IA em todo o setor. Recentemente, anunciamos nossa 8ª geração de TPUs no Cloud Next. Pela primeira vez, adotamos uma linha com chip duplo, com arquiteturas especializadas para treinamento e inferência: a TPU 8t e 8i.
- A TPU 8t foi otimizada para pré-treinamento em larga escala e tem potência computacional bruta quase três vezes maior que a geração anterior. Adotamos uma abordagem fundamentalmente diferente para a infraestrutura de treinamento. Com os novos sistemas JAX e Pathways, o treinamento não se limita a um único e gigantesco data center. Agora, podemos distribuir o treinamento em locais diferentes, com escala global de mais de 1 milhão de TPUs. Com isso, temos o maior cluster de treinamento do mundo. Para os desenvolvedores de modelos, isso significa a capacidade de treinar modelos maiores e mais robustos em semanas, em vez de meses.
- A TPU 8i foi projetada para inferência. A velocidade melhorou drasticamente em todas as etapas porque, se tem algo que aprendemos nesses 27 anos trabalhando com a Busca, é que latência importa.
Além da velocidade, também estamos pensando em escalabilidade sustentável. Esses dois chips são mais eficientes em termos de energia, oferecendo até duas vezes mais desempenho por watt.
Gemini Omni
Esse progresso em nossas TPUs reflete os avanços computacionais em nossos modelos, programação e agentes. Com os modelos do mundo real, a IA passou de previsão de texto para simulação da realidade. Estamos trabalhando para expandir os limites do que eles podem fazer.
O Gemini Omni é o nosso novo modelo capaz de gerar respostas em qualquer modalidade de saída a partir de qualquer modo de entrada. Começamos com respostas em vídeo e, em breve, ele vai incluir imagens e texto. Este novo modelo reúne a inteligência do Gemini e os nossos modelos de mídia generativa — um grande avanço em termos de compreensão do mundo real. Estamos lançando o primeiro modelo da família Omni: o Gemini Omni Flash.
O Gemini Omni Flash está disponível a partir de hoje. Você poderá testá-lo no app do Gemini, no Google Flow e no YouTube Shorts. Nas próximas semanas, ele também vai chegar aos desenvolvedores e clientes corporativos por meio de APIs.
SynthID: atualizações e novos parceiros
À medida que a IA generativa evolui, cresce também a necessidade de maior transparência. Pesquisas mostram que a média de identificação correta de vídeos com deepfake de alta qualidade é de uma em cada quatro vezes. Há três anos, lançamos o SynthID, nossa marca d'água invisível a olho nu. Desde o lançamento, o SynthID já marcou mais de 100 bilhões de imagens e vídeos, além de 60 mil anos de arquivos de áudio.
Milhões de pessoas usam o SynthID no app do Gemini para detectar conteúdo gerado por IA. E, agora, estamos dando um passo além e adicionando a checagem de Content Credentials em todos os produtos. Esse recurso comprova a origem do conteúdo, revelando se ele foi criado por IA ou por uma câmera, e se ele foi editado com ferramentas de IA generativa. Queremos que mais pessoas tenham acesso fácil a essas ferramentas, por isso, estamos lançando os recursos de checagem de Content Credentials e o SynthID na Busca e no Chrome.
É claro que isso só funciona em grande escala se mais parceiros colocarem marcas d'água no seu próprio conteúdo gerado por IA.
A Nvidia aderiu ao SynthID no ano passado. E, hoje, temos o prazer de anunciar que a OpenAI, a Ka-Kow e a Eleven Labs também estão adotando o recurso. É realmente incrível ver essa colaboração entre os players do setor. Nosso objetivo é ampliar a oferta do SynthID para mais parceiros e estabelecer o padrão de transparência para a era da IA.
Gemini 3.5 Flash
O Gemini 3 foi lançado há alguns meses, com uma família completa de modelos. Essa é a série mais adotada pelos desenvolvedores até o momento. É muito legal vê-los usando o Flash como ferramenta principal, criando experiências incríveis com o raciocínio profundo e os recursos multimodais do modelo Pro. Trabalhamos arduamente para aprimorar esses modelos, com foco especial em programação agêntica, tarefas de longo prazo e fluxos de trabalho do mundo real.
Hoje, lançamos o Gemini 3.5 Flash, o primeiro de uma série de modelos que reúnem inteligência de ponta e ação. Há dois pontos que eu quero destacar:
- Em comparação ao Gemini 3.1 Pro, o 3.5 Flash apresenta melhor desempenho em praticamente todos os benchmarks. Ele representa um enorme avanço em programação e mais: observem o salto extraordinário no ranking do GDPVal. O 3.5 Flash inclui atividades valiosas do mundo real, economicamente importantes.
- O Gemini 3.5 Flash é um modelo de última geração, extremamente capaz, que compete com os melhores modelos da categoria, mas ainda assim muito rápido. É por isso que, na comparação da relação inteligência/velocidade de resposta, ele se destaca, posicionado no quadrante superior direito. Ele responde, em termos de tokens por segundo, quatro vezes mais rápido que outros modelos de ponta.
Esse modelo tem sido um divisor de águas para nós internamente no Google. Temos usado o Flash 3.5 com uma versão reinventada da nossa plataforma de desenvolvimento centrada em agentes, o Antigravity, e isso acelerou drasticamente nosso processo de desenvolvimento. Em março, nosso processamento interno atingiu o marco de meio trilhão de tokens por dia, em todas as ferramentas de IA para desenvolvedores e, a cada duas semanas, esse número vem dobrando. Atualmente, processamos mais de 3 trilhões de tokens por dia. Essa escala criou um poderoso ciclo de feedback que foi essencial para a criação do 3.5 Flash.
O que é mais incrível no Flash é que ele oferece recursos de ponta por menos da metade do preço dos modelos da mesma categoria. Ouvimos dizer que muitas companhias já estão estourando o orçamento de tokens do ano, e ainda estamos em maio. As empresas podem economizar muito usando um mix do Flash juntamente a outros modelos de ponta. Para colocar esse cenário em perspectiva: as grandes empresas processam cerca de 1 trilhão de tokens por dia. Se elas migrarem 80% da carga de trabalho de outros modelos de ponta para o Flash 3.5, podem economizar mais de US$ 1 bilhão por ano. Essa é uma economia real que pode ser reinvestida na empresa.
O Gemini 3.5 Flash já está disponível em nossos produtos e APIs para todos os usuários. Também estamos animados com o Gemini 3.5 Pro. Já usamos esse modelo internamente, que chega no mês que vem, com grandes melhorias.
Antigravity 2.0
O Flash 3.5 também está chegando para os desenvolvedores do Antigravity.
O Antigravity quebrou a barreira do ambiente de programação, transformando-se em uma plataforma para criar e gerenciar grupos de agentes de IA autônomos. Isso inclui o Antigravity 2.0, um novo aplicativo independente para computador que centraliza as interações entre agentes, que podem ser orquestrados por qualquer pessoa para todo tipo de tarefa. E a nova versão, ainda mais otimizada do Flash, não é quatro, mas 12 vezes mais rápida do que outros modelos de ponta.
Os usuários do Antigravity podem testar essa novidade a partir de hoje. Saiba mais sobre o Antigravity 2.0.
Gemini Spark: seu agente 24 horas
O Gemini 3.5 e o Antigravity estão criando novos caminhos para agentes e recursos agênticos. Já faz um tempo que oferecemos agentes a desenvolvedores e empresas. Agora, nosso foco é levar a sua potência aos consumidores, de forma segura e protegida, para que todos possam usá-lo. Vocês verão experiências com agentes em muitos dos nossos produtos hoje.
Eu, particularmente, estou bastante animado com o Gemini Spark, o agente pessoal de IA no app do Gemini que vai organizar sua vida digital, tomando decisões e agindo em seu nome e sob o seu comando.
- É executado em máquinas virtuais dedicadas no Google Cloud 24 horas por dia, para você não precisar deixar seu laptop aberto.
- Usa a tecnologia do Gemini 3.5 e aproveita os recursos do Google Antigravity para executar tarefas de longo prazo em segundo plano.
- Será integrado perfeitamente às ferramentas, começando com as nossas. Nas próximas semanas, também será integrado às ferramentas de terceiros, usando o MCP.
- Você vai poder trabalhar com o Spark da maneira mais conveniente: no app Gemini ou, em breve, por e-mail e chat.
- No Android, será possível ver atualizações em tempo real e o progresso das tarefas de agentes como o Spark, em uma nova interface, o Android Halo, que será lançada ainda este ano. Em meados de 2026, o Spark será lançado diretamente no Chrome, atuando como seu navegador agêntico na web.
Esta semana, o Gemini Spark será disponibilizado para trusted testers e, na próxima semana, a versão Beta chegará aos assinantes do Google AI Ultra nos EUA.
A Busca na era agêntica
O Gemini Spark é a primeira experiência que resultou da união dos modelos 3.5 e do Antigravity. Essa combinação oferece novas maneiras de acelerar nossa missão e transformar nossos produtos para que sejam excepcionalmente úteis.
À medida em que avançamos na era agêntica, a Busca se torna mais útil e eficiente do que nunca. Hoje, estamos lançando os agentes de informação na Busca. Trata-se de agentes de IA personalizados, que podem ser configurados para funcionar 24 horas em segundo plano, para encontrar o que você precisa no momento exato e ajudar com a ação necessária. Os agentes de informação serão lançados de forma gradual a partir de meados deste ano, começando pelos assinantes do Google AI Pro e Ultra.
Outro ponto importante que complementa a construção de uma Busca verdadeiramente agêntica é a integração de recursos de programação generativa. Com a potência do Gemini 3.5 Flash e do Google Antigravity, a Busca vai criar experiências personalizadas para cada pergunta, com layouts dinâmicos e recursos visuais interativos. Esses recursos de interface generativa estarão disponíveis para todos na Busca em meados deste ano, sem custo.
E para tarefas de longa duração que exigem monitoramento constante, a Busca pode ir além, criando painéis persistentes ou rastreadores personalizados para você acompanhar o progresso das suas ações. Pense neles como miniaplicativos para suas tarefas específicas. Nos próximos meses, será possível criar experiências personalizadas com o Antigravity diretamente na Busca, inicialmente para assinantes do Google AI Pro e Ultra nos EUA.
Mais da nossa era agêntica do Gemini
Confira outras novidades anunciadas no I/O:
- O app do Gemini ganhou mais um recurso inovador: a Pauta do Dia (Daily Brief). Ele traz um resumo personalizado, sintetizando as informações da sua Caixa de Entrada, Agenda e Tarefas, e destacando os pontos mais importantes do dia. E não se trata apenas de um resumo: ele prioriza e organiza as informações, além de sugerir os próximos passos, facilitando suas ações. Tudo isso em um resumo matinal curto e ideal para uma leitura rápida.
- O Google Flow ganha hoje um novo agente capaz de planejar e analisar tarefas complexas, com base nos seus comandos e sob o seu comando. Desenvolvido com modelos do Gemini, ele oferece expertise e conhecimento aprofundado do seu projeto para auxiliar nas etapas iniciais de brainstorming, criação e edição. Você também pode usar vibe coding com qualquer ferramenta criativa diretamente no Flow, como ferramentas de efeitos especiais, animações desenhadas à mão ou sobreposição de texto.
- O Google Pics é nossa nova ferramenta de IA para criação e edição de imagens, baseada no mais recente modelo do Nano Banana. Com ele, você pode criar praticamente qualquer coisa, com os controles criativos que quiser. Seja para iniciar um design do zero ou editar uma foto, o Pics trata cada elemento como um objeto único, em vez de uma imagem plana e estática. Por isso, você pode criar, mudar ou aperfeiçoar detalhes específicos, e ver suas ideias ganharem vida exatamente como imaginou. O Google Pics já está disponível para trusted testers e será lançado em meados deste ano para assinantes do Google AI Pro e Ultra no Workspace.
- Também divulgamos mais informações sobre nossos óculos inteligentes, apresentados pela primeira vez no ano passado. Os modelos incluem os óculos com áudio, que oferecem ajuda por voz, e os óculos com tela virtual, que mostram as informações que você precisa no momento ideal. Esses dois modelos permitem que você fique com as mãos livres e a cabeça no lugar. Basta pedir ao Gemini, com um comando de voz. Os óculos com áudio serão lançados primeiro, até o final deste ano.
- O Gemini for Science reúne diversas ferramentas de IA para ajudar a acelerar a pesquisa científica. Com base nas capacidades de raciocínio profundo e nos recursos de pesquisa do Gemini, bem como do Deep Think e do Deep Research, ele inclui novos experimentos no Labs e no Science Skills para conectar plataformas agênticas, como o Google Antigravity, a mais de 30 bancos de dados relacionados às ciências da vida e outras ferramentas. Os usuários podem manifestar interesse em testar os experimentos do Gemini for Science no Google Labs, e o Science Skills já está disponível no GitHub e diretamente no Antigravity.
Se observarmos todo esse conjunto de inovações, da infraestrutura por trás da TPU 8i aos recursos de última geração do Gemini 3.5 e do Antigravity, fica evidente que seguimos firmes na era agêntica do Gemini. Estou animado para ver como esses recursos vão desbravar novas oportunidades para acelerar nossa missão e transformar nossos produtos para que eles sejam excepcionalmente úteis para todos, em todos os lugares.
Confira todos os anúncios do I/O aqui: