Acesse o menu principal

Blog do Google Brasil

Gemini 3 Flash: inteligência de ponta e com mais velocidade

[]

Gemini 3 Flash: inteligência de ponta e com mais velocidade

17 Dez, 2025

O Gemini 3 Flash é o nosso modelo mais recente com inteligência de ponta que ajuda todos a aprender, construir e planejar qualquer coisa — de forma mais rápida

tulsee-doshi-square

Tulsee Doshi

Senior Director, Product Management, on behalf of the Gemini team

Gemini 3 Flash text

Ouvir o artigo

[[duration]] minutes

Hoje, estamos expandindo a família de modelos Gemini 3 com o lançamento do Gemini 3 Flash, que oferece inteligência de ponta projetada para ser mais rápida a uma fração do custo. Com este lançamento, estamos tornando a inteligência de última geração do Gemini 3 acessível a todos nos produtos do Google.

No mês passado, lançamos o Gemini 3 com o Gemini 3 Pro e o modo Gemini 3 Deep Think , e a resposta tem sido incrível. Desde então, processamos mais de 1T de tokens por dia em nossa API. Vimos você usar o Gemini 3 para simulações de código interativas, aprender sobre tópicos complexos, construir e projetar jogos interativos e compreender todos os tipos de conteúdo multimodal.

Com o Gemini 3, introduzimos desempenho de ponta em tarefas de raciocínio complexo, compreensão multimodal e visual , além de codificação de agentes e tarefas de vibe coding. O Gemini 3 Flash mantém essa base, combinando o raciocínio de nível profissional do Gemini 3 com a latência, eficiência e custo do Flash. Ele não apenas possibilita tarefas cotidianas com raciocínio aprimorado, como também é o nosso modelo mais impressionante para fluxos de trabalho com agentes.

A partir de hoje, o Gemini 3 Flash está sendo disponibilizado para milhões de pessoas em todo o mundo:

Para desenvolvedores da API Gemini no Google AI Studio , da CLI Gemini e da nossa nova plataforma de desenvolvimento de agentes, o Google Antigravity.
Para todos, a partir do aplicativo Gemini e no Modo IA na Busca.
Para empresas no Vertex AI e Gemini Enterprise

Gemini 3 Flash: inteligência de ponta em grande escala

Gemini 3 Flash demonstra que velocidade e escala não precisam vir à custa da inteligência. Ele oferece desempenho de ponta em testes de raciocínio e conhecimento de nível de doutorado, como o GPQA Diamond (90,4%) e o Humanity's Last Exam (33,7% sem ferramentas), rivalizando com modelos de ponta maiores e superando significativamente até mesmo o melhor modelo 2.5, o Gemini 2.5 Pro, em diversos testes. Além disso, atinge um desempenho de última geração com uma pontuação impressionante de 81,2% no MMMU Pro, comparável ao Gemini 3 Pro.

Tabela de benchmark

A benchmark comparison table showing performance scores and prices for several language models including Gemini 3 Flash, Gemini 3 Pro Thinking, Gemini 2.5 Flash Thinking, Gemini 2.5 Pro Thinking, Claude Sonnet 4.5, GPT-5.2 Extra high, and Grok 4.1 Fast, across various tasks like academic reasoning, scientific knowledge, math, multi-modal understanding, coding, and long context performance.

Além de seu raciocínio de ponta e capacidades multimodais, o Gemini 3 Flash foi projetado para ser altamente eficiente, ampliando a fronteira de Pareto entre qualidade, custo e velocidade. Ao processar informações com um nível de raciocínio superior, o modelo consegue modular o quanto 'pensa': ele pode dedicar mais tempo a casos complexos, mas utiliza, em média, 30% menos tokens que o 2.5 Pro em tarefas cotidianas. Isso resulta em maior precisão e desempenho superior no tráfego.

O Gemini 3 Flash estabelece um novo patamar na relação entre desempenho, custo e velocidade.

A scatter plot showing LMArena Elo Score versus Price per million tokens for various language models, with a line highlighting the Pareto frontier through 'gemini-3-pro', 'gemini-3-flash', and 'gemini-3-flash-lite'.

A força do Gemini 3 Flash reside em sua velocidade, aprimorando a série Flash que os desenvolvedores e usuários já admiram. Ele supera o 2.5 Pro ao ser 3 vezes mais rápido (com base no benchmarking da Artificial Analysis) por uma fração do custo. O Gemini 3 Flash chega com o preço de US$ 0,50 por 1 milhão de tokens de entrada e US$ 3 por 1 milhão de tokens de saída (a entrada de áudio permanece em US$ 1 por 1 milhão de tokens).

O Gemini 3 Flash supera o 2.5 Pro em velocidade e qualidade.

Para desenvolvedores: inteligência que acompanha o ritmo

O Gemini 3 Flash foi criado para o desenvolvimento iterativo, oferecendo o desempenho de codificação de nível profissional do Gemini 3 com baixa latência, o que permite raciocinar e resolver tarefas rapidamente em fluxos de trabalho de alta frequência. No SWE-bench Verified, um benchmark para avaliar as capacidades de agentes de codificação, o Gemini 3 Flash alcança uma pontuação de 78%, superando não apenas a série 2.5, mas também o Gemini 3 Pro. Ele oferece um equilíbrio ideal para codificação orientada a agentes, sistemas prontos para produção e aplicações interativas responsivas.

O excelente desempenho do Gemini 3 Flash em raciocínio, uso de ferramentas e recursos multimodais é ideal para desenvolvedores que buscam realizar análises de vídeo mais complexas, extração de dados e perguntas e respostas visuais. Isso significa que ele pode viabilizar aplicações mais inteligentes — como agentes de suporte ao cliente ao vivo ou assistentes em jogos — que exigem tanto respostas rápidas quanto raciocínio profundo.

O Gemini 3 Flash permite o raciocínio multimodal, com assistência quase em tempo real.

Gemini 3 Flash cria e testa A/B novos designs de indicadores de carregamento em tempo quase real, simplificando o processo de design para código.

O Gemini 3 Flash usa o raciocínio multimodal para analisar e legendar uma imagem com sobreposições contextuais de interface (UI) em tempo quase real, transformando, em última análise, uma imagem estática em uma experiência interativa.

O Gemini 3 Flash utiliza um único prompt de instrução e codifica três variações de design exclusivas.

Temos recebido um ótimo retorno das empresas que utilizam o Gemini 3 Flash. Empresas como JetBrains, Bridgewater Associates e Figma já estão usando essa tecnologia para transformar seus negócios, destacando como sua velocidade de inferência, eficiência e capacidade de raciocínio se equiparam às de modelos maiores. O Gemini 3 Flash já está disponível para empresas via Vertex AI e Gemini Enterprise.

Para todos: o Gemini 3 Flash está sendo lançado globalmente

O Gemini 3 Flash agora é o modelo padrão no aplicativo Gemini, substituindo o 2.5 Flash. Isso significa que todos os nossos usuários do Gemini no mundo todo terão acesso à experiência do Gemini 3 sem custo algum, o que proporcionará uma grande melhoria em suas tarefas diárias.

Graças às incríveis capacidades de raciocínio multimodal do Gemini 3 Flash, você pode usá-lo para ver, ouvir e entender qualquer tipo de informação de forma mais rápida. Por exemplo, você pode pedir ao Gemini para entender seus vídeos e imagens e transformar esse conteúdo em um plano útil e prático em apenas alguns segundos.

O Gemini 3 Flash no aplicativo Gemini pode analisar conteúdo de vídeo curto e oferecer um plano, como, por exemplo, como melhorar sua tacada de golfe.

Como o Gemini 3 Flash é otimizado para velocidade, ele consegue ver e adivinhar o que você está desenhando enquanto você ainda está esboçando.

Você pode fazer o upload de uma gravação de áudio, e o Gemini 3 Flash pode criar um questionário personalizado e fornecer explicações detalhadas sobre as respostas.

Ou você pode criar aplicativos divertidos e úteis do zero em instantes, usando apenas a voz e sem qualquer conhecimento de programação. Basta pedir ao Gemini em qualquer lugar, e ele transforma seus pensamentos em um aplicativo funcional em questão de minutos.

O Gemini 3 Flash também está começando a ser implementado como o modelo padrão para o Modo IA na Busca, com acesso para todos ao redor do mundo.

Aprimorando os recursos de raciocínio do Gemini 3 Pro, o Modo IA com Gemini 3 Flash se destaca na compreensão das nuances da sua pergunta para fornecer respostas ponderadas e abrangentes, visualmente fáceis de assimilar, buscando informações locais em tempo real e links úteis em toda a internet. O resultado combina de forma eficaz pesquisa com ação imediata: você obtém uma análise organizada de forma inteligente, juntamente com recomendações específicas – na velocidade da Busca.

Isso se destaca ao lidar com objetivos complexos que envolvem múltiplas considerações, como planejar uma viagem de última hora ou aprender conceitos educacionais complexos rapidamente.

Experimente o Gemini 3 Flash

O Gemini 3 Flash já está disponível em versão prévia através da API Gemini no Google AI Studio, no Google Antigravity, Vertex AI e Gemini Enterprise . Você também pode acessá-lo por meio de outras ferramentas de desenvolvedor, como o Gemini CLI e o Android Studio . A novidade também está começando a ser disponibilizada para todos os usuários do aplicativo Gemini e do Modo IA na Busca, oferecendo acesso rápido e gratuito à inteligência de última geração.

Estamos ansiosos para ver o que você criará com esta família expandida de modelos: Gemini 3 Pro, Gemini 3 Deep Think e agora, Gemini 3 Flash.

Publicado em: