Avançar para o conteúdo principal

Blog Portugal

I/O 2026: Chegou a era agêntica do Gemini

Últimas notícias

I/O 2026: Chegou a era agêntica do Gemini

[]

I/O 2026: Chegou a era agêntica do Gemini

Veja como estamos ajudando as pessoas a fazerem mais com o Gemini.

Sundar Pichai

CEO of Google and Alphabet

a series of colorful icons representing Google I/O against a black background

Neste artigo

Nota do editor: segue-se uma transcrição editada das declarações de Sundar Pichai, CEO da Google, no Google I/O 2026, adaptada para incluir mais do que foi anunciado em palco. Veja todos os anúncios na nossa coleção.

Foi um ano extraordinário desde o nosso último I/O: um período de lançamentos constantes, avanços tecnológicos e progresso muito acelerado. Agora, estamos na fase do ciclo da IA em que as pessoas querem encontrar valor nos produtos que usam todos os dias. Temos estado muito focados nisso, e será isso que verá nos produtos e funcionalidades que anunciamos hoje no I/O.

Dez anos depois de termos organizado a empresa para ser “AI-first”, continuamos a ver a IA como a forma mais completa de fazer avançar a nossa missão e melhorar a vida das pessoas em larga escala. É por isso que temos seguido uma abordagem diferenciada e “full-stack” na inovação em IA, desde o nosso hardware personalizado e a nossa base segura, à nossa investigação e modelos de classe mundial, até aos nossos produtos e plataformas que chegam a milhares de milhões de pessoas. Esta abordagem permite-nos iterar e inovar mais rapidamente, dinamizando todas as áreas da empresa.

O que é incrível é a forma como as pessoas estão a usar a IA, quer sejam estudantes a prepararem-se para os exames finais com a aplicação Gemini, músicos e artistas a utilizarem modelos de IA generativa como o Lyria e o Veo como parte do seu processo criativo, ou programadores a escrever código e a dar vida às suas ideias.

Forte crescimento da IA em todo o ecossistema

Estas histórias sobre a forma como as pessoas estão a usar a IA são a melhor forma de medirmos o progresso. Para perceber a escala a que as pessoas estão a adotar a IA, há outro excelente indicador: os tokens, as unidades fundamentais de dados que os nossos modelos processam, e que, muitas vezes, representam um problema a ser resolvido.

Há dois anos, processávamos 9,7 biliões de tokens por mês nas nossas experiências: um número considerável. No ano passado, no I/O, esse valor cresceu para cerca de 480 biliões de tokens. Avançando até hoje, esse número aumentou 7 vezes para mais de 3,2 quatriliões por mês.

The image depicts a line chart titled "Monthly Tokens Processed Across our surfaces," showing substantial growth in tokens processed from 9.7T in May '24 to 3.2Q+ in May '26, with a note indicating "7x Y/Y growth.

Isto conta uma história importante sobre os nossos produtos e sobre a forma como outros também estão a criar conteúdo, especialmente programadores e empresas:

Mais de 8,5 milhões de programadores estão agora a criar novas aplicações e experiências com os nossos modelos todos os meses.
As nossas APIs de modelos processam agora cerca de 19 mil milhões de tokens por minuto.
Nos últimos 12 meses, mais de 375 clientes da Google Cloud processaram, cada um, mais de um bilião de tokens, o que representa uma procura incrível por IA em vários setores.

Forte crescimento nos nossos produtos

Hoje, temos 13 produtos com mais de mil milhões de utilizadores cada. Cinco desses produtos têm mais de 3 mil milhões de utilizadores.

Os nossos modelos Gemini são uma grande razão pela qual mais pessoas estão a utilizar os nossos produtos, e também o motivo pelo qual os utilizam mais frequentemente.

Tudo começa com a Busca, que leva os benefícios da IA generativa a mais pessoas do que qualquer outro produto no mundo. A Vista Geral de IA tem agora mais de 2,5 mil milhões de utilizadores ativos mensais. E o Modo IA foi uma revelação: a maior atualização de sempre da Busca. As pessoas adoram-no e, em apenas um ano, já ultrapassou mil milhões de utilizadores ativos mensais.

Quando as pessoas usam as nossas funcionalidades baseadas em IA na Busca, usam mais a Busca. A Busca passou a ser menos sobre as buscas individuais para parecer uma conversa contínua, oferecendo perspetivas mais aprofundadas e ligando os utilizadores à vastidão da web.

Outra área onde temos inovado rapidamente é a aplicação Gemini. No ano passado, no I/O, a aplicação Gemini tinha 400 milhões de utilizadores ativos mensais. Hoje, ultrapassámos os 900 milhões, mais do dobro, apenas num ano. No mesmo período, os pedidos diários cresceram mais de sete vezes.

Temos acrescentado muitas funcionalidades únicas, como a Inteligência Personalizada, que tornam as respostas mais personalizadas e úteis. Até hoje, já foram geradas mais de 50 mil milhões de imagens com os nossos modelos de geração de imagem Nano Banana. Foi uma das grandes revelações do último ano, mostrando quanta criatividade existe no mundo.

IA natural e conversacional nos produtos

Há também muita produtividade por desbloquear. Ao longo do último ano, temos levado a capacidade de ter conversas mais naturais com o Gemini diretamente para os nossos produtos. Recentemente, o Maps recebeu a sua maior atualização da última década, incluindo uma nova funcionalidade chamada Pedir ao Maps. As pessoas estão a usar o Pedir ao Maps para perguntas mais complexas e muito mais longas.

Agora, estamos a levar uma IA conversacional mais natural a ainda mais produtos.

Pedir ao YouTube

As pessoas vêm ao YouTube todos os dias para fazer muitas perguntas. Há muitos vídeos excelentes, mas por vezes é difícil saber por onde começar.

Pedir ao YouTube reinventa completamente a experiência, tornando a informação muito mais fácil de assimilar e de navegar. Verá vídeos que correspondem melhor ao seu interesse e, acima de tudo, saltará diretamente para a parte do vídeo mais relevante para si.

A search results page from "Ask YouTube" answering the question, "How to teach my 3 year old how to ride a pedal bike, they already know how to ride a balance bike?" and showing a video of a child on a bike.

Estamos, agora, a começar a testar o Pedir ao YouTube e será disponibilizado de forma alargada nos EUA já este verão.

Docs Live com comandos de voz

Há muitas ocasiões em que quero tratar de assuntos à velocidade da minha voz. Hoje, isso é possível graças aos avanços técnicos nos nossos modelos de áudio.

Uma nova funcionalidade chamada Docs Live eleva isto a um novo patamar. Antes, para criar um documento com o Gemini, era necessário escrever um comando preciso. Com o Docs Live, pode simplesmente fazer um “despejo mental” por voz sobre o que quer, e deixar o Gemini tratar do resto. Eis uma demonstração em tempo real:

No futuro, poderá criar novos documentos e editá-los diretamente, tudo com a sua voz. O Docs Live será disponibilizado aos subscritores este verão, e funcionalidades de voz poderosas também chegarão ao Gmail e ao Keep nessa altura.

A infraestrutura que apoia a inovação em larga escala

É incrível ver o ritmo da inovação a chegar aos nossos produtos. Apoiar toda esta escala para os nossos utilizadores, ao mesmo tempo que servimos empresas e programadores em todo o mundo, exige grandes investimentos em infraestrutura. Temos investido para o presente e para o futuro. Em 2022, gastávamos $31 mil milhões por ano em despesas de capital. Este ano, prevemos que este número seja cerca de seis vezes superior, aproximadamente $190 mil milhões. Uma parte fundamental deste investimento é o nosso hardware personalizado.

Há uma década, anunciámos o nosso primeiro tensor processing unit comercial, ou TPU, no palco do I/O. Desde então, transformámos a forma como a indústria cria para a IA. Recentemente, anunciámos a nossa 8.ª geração de TPUs no Cloud Next. Pela primeira vez, adotámos uma abordagem de chip duplo, com arquiteturas especializadas para treino e inferência: TPU 8t e 8i.

O TPU 8t está otimizado para pré-treino em grande escala e tem quase três vezes mais capacidade bruta de computação do que a geração anterior. Adotámos uma abordagem fundamentalmente diferente na nossa infraestrutura de treino. Com JAX e Pathways, o nosso treino já não está limitado pelas fronteiras de um único “data center” enorme. Em vez disso, agora, podemos distribuir o treino de forma fluida por vários locais, escalando o treino por mais de 1 milhão de TPUs em todo o mundo. Isto dá-nos a capacidade de criar o maior “cluster” de treino do mundo. Para quem cria modelos, isto significa treinar modelos maiores e mais capazes em semanas, ao invés de meses.
O TPU 8i foi concebido para inferência. Melhorámos drasticamente a velocidade em todas as etapas. Porque, se aprendemos alguma coisa em 27 anos a trabalhar na Busca, é que a latência importa.

Além da velocidade, também estamos a pensar em escalar de forma sustentável. Ambos os chips são mais eficientes em termos energéticos, oferecendo até duas vezes melhor desempenho por watt.

Gemini Omni

Este progresso com TPUs é o que nos permite avançar as capacidades de computação em modelos, programação e agentes. Com os modelos mundiais, a IA está a passar de prever texto para simular a realidade. Temos trabalhado para expandir os limites do que estes modelos conseguem fazer.

O Gemini Omni é o nosso novo modelo capaz de gerar amostras em qualquer modalidade de saída a partir de qualquer entrada. Estamos a começar com saída em vídeo e, ao longo do tempo, iremos disponibilizar imagem e texto. Este novo modelo combina a inteligência do Gemini com os nossos modelos de multimédia generativa - um enorme salto em frente na compreensão do mundo. Estamos a lançar o primeiro modelo da família Omni: o Gemini Omni Flash.

O Gemini Omni Flash está disponível a partir de hoje. Pode experimentá-lo na aplicação Gemini, no Google Flow e no YouTube Shorts. Também o vamos disponibilizar a programadores e clientes empresariais através de APIs ao longo das próximas semanas.

Novas atualizações e parceiros do SynthID

À medida que a IA generativa melhora, aumenta também a necessidade de mais transparência. A investigação mostra que as pessoas conseguem identificar corretamente vídeos “deepfake” de alta qualidade apenas cerca de um quarto das vezes. Há três anos, lançámos o SynthID, a nossa marca de água invisível a olho nu. Desde o lançamento, o SynthID já marcou com marca de água mais de cem mil milhões de imagens e vídeos, bem como o equivalente a sessenta mil anos de recursos de áudio.

Milhões de pessoas estão a usar o nosso detetor SynthID na aplicação Gemini para verificar conteúdos gerados por IA. E, agora, estamos a dar mais um passo, acrescentando a verificação de Credenciais de Conteúdo em vários produtos. Isto mostrará se a origem de um conteúdo é de IA ou uma câmara, e se foi editado com ferramentas de IA generativa. Queremos que mais pessoas tenham acesso fácil a estas ferramentas, por isso estamos a expandir a verificação de Credenciais de Conteúdo e o SynthID à Busca e ao Chrome.

Claro que isto só funciona em grande escala se mais parceiros decidirem aplicar marcas de água aos seus próprios conteúdos gerados por IA.

A Nvidia aderiu ao SynthID no ano passado. E hoje temos o prazer de anunciar que a OpenAI, a Ka-Kow e a Eleven Labs também vão passar a usar o SynthID. É excelente ver esta colaboração entre setores. Esperamos expandir para mais parceiros e definir o padrão de transparência para a era da IA.

Gemini 3.5 Flash

O Gemini 3 foi lançado há alguns meses, com uma família completa de modelos. É a nossa série mais usada até agora. Tem sido muito bom ver programadores a usar o Flash como ferramenta diária e a criar experiências incríveis com o raciocínio profundo e as capacidades multimodais do Pro. Temos trabalhado muito para melhorar estes modelos, com foco especial na programação agêntica, em tarefas de longo horizonte e em fluxos de trabalho do mundo real.

Hoje, apresentamos o Gemini 3.5 Flash, o primeiro de uma série de modelos que combina inteligência avançada com ação. Gostaria de destacar dois pontos:

Quando comparado com o 3.1 Pro, o 3.5 Flash é melhor em quase todos os benchmarks. Fez progressos enormes em programação: e veja-se o avanço extraordinário no GDPVal. Isto capta muitas tarefas economicamente valiosas do mundo real.
O Gemini 3.5 Flash é um modelo muito capaz e avançado, comparável aos melhores modelos, mas continua a ser muito rápido. É por isso que, quando se analisa inteligência versus velocidade de saída, está no seu próprio campeonato. Em tokens de saída por segundo, é quatro vezes mais rápido do que outros modelos avançados.

The image shows a scatter plot titled "Artificial Analysis Intelligence Index vs Output Speed," where the y-axis represents the Artificial Analysis Intelligence Index and the x-axis represents the Output Speed (tokens/S), with data points plotted for several models like GPT-5.5 (xhigh), Claude Opus 4.7 (max), and 3.5 Flash, the latter of which is highlighted in a blue shaded box for high intelligence and speed.

O novo modelo tem sido um divisor de águas para nós, internamente, na Google. Temos vindo a utilizar o 3.5 Flash com uma versão reimaginada da nossa plataforma de desenvolvimento focada em agentes - Antigravity - e isso acelerou drasticamente a nossa forma de construir. Em março, processávamos meio bilião de tokens por dia internamente em todas as nossas ferramentas de desenvolvimento de IA, e temos vindo a duplicar esse valor a cada poucas semanas. Agora, estamos a processar mais de três biliões de tokens por dia. Esta escala criou um ciclo de feedback poderoso que nos ajudou a melhorar o 3.5.

O que é extraordinário no Flash é a forma como oferece capacidades de nível muito avançado por menos de metade do preço de modelos comparáveis. Sabemos que muitas empresas já estão a esgotar os seus orçamentos anuais de tokens, e ainda só estamos em maio. Se as empresas usassem uma combinação de Flash e outros modelos avançados, poderiam poupar muito dinheiro. Para contextualizar, as maiores empresas processam cerca de 1 bilião de tokens por dia. Se transferissem 80% dos seus volumes de trabalho de outros modelos de fronteira para o 3.5 Flash, poupariam mais de $1 mil milhões de dólares por ano. São poupanças reais que se podem reinvestir na empresa.

O Gemini 3.5 Flash já está disponível para todos os nossos produtos e APIs. Também estamos entusiasmados com o Gemini 3.5 Pro. Estamos a usá-lo internamente: mostra grandes melhorias e chega já no próximo mês.

Antigravity 2.0

Também estamos a disponibilizar o 3.5 Flash aos programadores no Antigravity.

O Antigravity está a expandir-se para além do ambiente de programação, tornando-se uma plataforma para desenvolver e gerir grupos de agentes de IA autónomos. Isto inclui o Antigravity 2.0, uma nova aplicação autónoma para desktop que funciona como uma “casa” central para interação com agentes, onde qualquer pessoa pode organizar agentes para todo o tipo de tarefas. E desenvolvemos uma versão ainda mais otimizada do Flash: não apenas 4 vezes, mas 12 vezes mais rápida do que outros modelos avançados.

Os utilizadores do Antigravity podem começar já hoje a experimentar esta experiência. Leia mais sobre o Antigravity 2.0 aqui.

O Gemini Spark é o seu agente 24 horas por dia, 7 dias por semana

O Gemini 3.5 e o Antigravity estão a desbloquear um novo mundo de agentes e funcionalidades agênticas. Temos vindo a disponibilizar agentes para programadores e empresas há algum tempo. Agora, estamos muito focados em levar o poder dos agentes, de forma segura e protegida, aos consumidores, para que funcione para todos. Hoje, encontrará experiências agênticas em muitos dos nossos produtos.

Estou particularmente entusiasmado com o Gemini Spark, o seu agente pessoal de IA na aplicação Gemini, que ajuda a navegar pela sua vida digital, tomando medidas em seu nome e sob a sua orientação.

Funciona em máquinas virtuais dedicadas na Google Cloud. E está disponível 24 horas por dia, 7 dias por semana, por isso não precisa de manter o portátil aberto.
É alimentado pelo Gemini 3.5 e pelo Google Antigravity harness, o que permite executar facilmente tarefas de longo horizonte em segundo plano.
O Spark integrará ferramentas de forma fluida, a começar pelas nossas e, nas próximas semanas, por ferramentas de terceiros através de MCP.
E poderá trabalhar com o Spark da forma que lhe for mais conveniente: na aplicação Gemini ou, em breve, por e-mail e chat.
No Android, poderá ver atualizações em direto e o progresso das tarefas de agentes como o Spark através de um novo espaço de interface chamado Android Halo, que chegará ainda este ano. Depois, durante o verão, o Spark funcionará diretamente no Chrome, atuando como o seu navegador agêntico em toda a web.

Estamos a começar a disponibilizar o Gemini Spark a testadores fidedignos esta semana, e a versão beta chegará aos subscritores do Google AI Ultra nos EUA já na próxima semana.

A Busca na era agêntica

O Gemini Spark é a primeira experiência tornada possível pelos modelos 3.5 e pelo Antigravity. Esta combinação dá-nos novas formas de acelerar a nossa missão e de transformar os nossos produtos para serem radicalmente mais úteis.

Ao entrarmos nesta era agêntica, a Pesquisa será mais útil e poderosa do que nunca. Hoje, apresentamos agentes de informação na Pesquisa. São agentes de IA personalizados que pode configurar para trabalhar em segundo plano, 24 horas por dia e 7 dias por semana, para encontrar aquilo de que precisa no momento certo, e para ajudar a realizar tarefas. Os agentes de informação serão disponibilizados já este verão, a começar pelos subscritores do Google AI Pro e Ultra.

Também estamos a desenvolver uma Pesquisa verdadeiramente agêntica ao integrar a mesma capacidade de programação agêntica. Com o poder do Gemini 3.5 Flash e do Google Antigravity, a Pesquisa criará experiências personalizadas para as suas perguntas, como layouts dinâmicos e elementos visuais interativos. Estas capacidades de interface generativa estarão disponíveis para todos na Pesquisa este verão, sem custos.

E, para tarefas mais longas que precisa de retomar mais tarde, a Pesquisa pode ir mais longe: cria paineis de controlo ou acompanhamento personalizado aos quais pode regressar para continuar a trabalhar. Pode pensar neles como mini aplicações para as suas tarefas específicas. Poderá criar experiências personalizadas com o Antigravity diretamente na Pesquisa, nos próximos meses, a começar primeiro pelos subscritores do Google AI Pro e Ultra nos EUA.

Mais da nossa era agêntica do Gemini

Aqui está tudo o que revelamos no I/O:

O Resumo Diário é outro agente pronto a usar que chegará em breve à aplicação Gemini. Oferece-lhe um resumo personalizado e sintetiza informação da sua caixa de entrada, calendário e tarefas para encontrar os pontos mais importantes a ter em conta. E não se limita a resumir dados: prioriza, organiza e sugere próximos passos, para que seja fácil agir. Tudo isto num resumo matinal muito conciso, criado para uma leitura rápida.
O Google Flow disponibiliza hoje um novo agente para todos, capaz de planear e raciocinar sobre tarefas complexas com os seus comandos, sob o seu controlo. Criado com modelos Gemini, traz conhecimento especializado e uma compreensão profunda do seu projeto para ajudar nas fases iniciais de brainstorming, criação e edição. Também pode fazer “vibe coding” de qualquer ferramenta criativa, diretamente no Flow: por exemplo, ferramentas para criar efeitos de vídeo, animações desenhadas à mão ou sobreposição de texto.

O Google Pics é a nossa nova ferramenta de criação e edição de imagens com IA, criada com base no nosso mais recente modelo Nano Banana, que ajuda a criar praticamente tudo com recurso a controlos criativos. Quer esteja a criar um design a partir de uma tela em branco ou a editar uma foto existente, o Pics trata cada elemento como um objeto individual, em vez de uma imagem plana e estática. Isto permite-lhe criar, trocar ou aperfeiçoar detalhes específicos, para concretizar exatamente a sua visão. O Google Pics está disponível agora para testadores fidedignos e será disponibilizado mais tarde, ainda este verão, aos subscritores do Google AI Pro e Ultra no Workspace.
Também partilhámos mais informação sobre os nossos óculos inteligentes, que revelámos pela primeira vez no ano passado, incluindo óculos com áudio que oferecem ajuda diretamente no seu ouvido e óculos com ecrã que mostram a informação de que precisa, exatamente quando precisa dela. Ambas as opções permitem-lhe manter as mãos livres e a cabeça erguida, com ajuda do Gemini sempre que pedir. Os óculos com áudio serão lançados primeiro, ainda este outono.

O Gemini for Science reúne várias ferramentas de IA para ajudar a acelerar a investigação científica. Partindo das capacidades de raciocínio profundo e investigação do Gemini, bem como do Deep Think e do Deep Research, inclui novas experiências no Labs e Science Skills para associar plataformas agênticas como o Google Antigravity a mais de 30 grandes bases de dados e ferramentas da área da biologia. Os utilizadores podem manifestar interesse em experimentar experiências do Gemini for Science no Google Labs, e o Science Skills que está disponível hoje no Github e diretamente no Antigravity.

Considerando todo o stack de inovação, desde a infraestrutura por trás do TPU 8i até às capacidades avançadas do Gemini 3.5 e do Antigravity, é evidente que nos situamos firmemente na era agêntica do Gemini. Estou entusiasmado por ver como tudo isto irá desbloquear novas formas de acelerar a nossa missão e transformar os nossos produtos para serem muito mais úteis: para todos, em todo o lado.

Publicado em:

Inteligência Artificial

Reconstruindo o golo "perdido" de Pelé

De Gabe Ferreira e Anita Lucchesi

Inteligência Artificial

3 formas de equilibrar o tempo de ecrã e manter as crianças entretidas este verão

De Mindy Brooks

Inteligência Artificial

Ajudar os estudantes e os pais a prepararem-se para o período de exames finais

De Colin Marson

Novas oportunidades, controlo e insights para proprietários de websites

De Mrinalini Loew

Apresentamos o Gemini Omni

De Koray Kavukcuoglu

Uma nova era para a Pesquisa de IA

De Elizabeth Reid