Gemini 3 Flash: inteligência de ponta e com mais velocidade
Hoje, estamos expandindo a família de modelos Gemini 3 com o lançamento do Gemini 3 Flash, que oferece inteligência de ponta projetada para ser mais rápida a uma fração do custo. Com este lançamento, estamos tornando a inteligência de última geração do Gemini 3 acessível a todos nos produtos do Google.
No mês passado, lançamos o Gemini 3 com o Gemini 3 Pro e o modo Gemini 3 Deep Think , e a resposta tem sido incrível. Desde então, processamos mais de 1T de tokens por dia em nossa API. Vimos você usar o Gemini 3 para simulações de código interativas, aprender sobre tópicos complexos, construir e projetar jogos interativos e compreender todos os tipos de conteúdo multimodal.
Com o Gemini 3, introduzimos desempenho de ponta em tarefas de raciocínio complexo, compreensão multimodal e visual , além de codificação de agentes e tarefas de vibe coding. O Gemini 3 Flash mantém essa base, combinando o raciocínio de nível profissional do Gemini 3 com a latência, eficiência e custo do Flash. Ele não apenas possibilita tarefas cotidianas com raciocínio aprimorado, como também é o nosso modelo mais impressionante para fluxos de trabalho com agentes.
A partir de hoje, o Gemini 3 Flash está sendo disponibilizado para milhões de pessoas em todo o mundo:
- Para desenvolvedores da API Gemini no Google AI Studio , da CLI Gemini e da nossa nova plataforma de desenvolvimento de agentes, o Google Antigravity.
- Para todos, a partir do aplicativo Gemini e no Modo IA na Busca.
- Para empresas no Vertex AI e Gemini Enterprise
Gemini 3 Flash: inteligência de ponta em grande escala
Gemini 3 Flash demonstra que velocidade e escala não precisam vir à custa da inteligência. Ele oferece desempenho de ponta em testes de raciocínio e conhecimento de nível de doutorado, como o GPQA Diamond (90,4%) e o Humanity's Last Exam (33,7% sem ferramentas), rivalizando com modelos de ponta maiores e superando significativamente até mesmo o melhor modelo 2.5, o Gemini 2.5 Pro, em diversos testes. Além disso, atinge um desempenho de última geração com uma pontuação impressionante de 81,2% no MMMU Pro, comparável ao Gemini 3 Pro.
Tabela de benchmark
Além de seu raciocínio de ponta e capacidades multimodais, o Gemini 3 Flash foi projetado para ser altamente eficiente, ampliando a fronteira de Pareto entre qualidade, custo e velocidade. Ao processar informações com um nível de raciocínio superior, o modelo consegue modular o quanto 'pensa': ele pode dedicar mais tempo a casos complexos, mas utiliza, em média, 30% menos tokens que o 2.5 Pro em tarefas cotidianas. Isso resulta em maior precisão e desempenho superior no tráfego.
O Gemini 3 Flash estabelece um novo patamar na relação entre desempenho, custo e velocidade.
A força do Gemini 3 Flash reside em sua velocidade, aprimorando a série Flash que os desenvolvedores e usuários já admiram. Ele supera o 2.5 Pro ao ser 3 vezes mais rápido (com base no benchmarking da Artificial Analysis) por uma fração do custo. O Gemini 3 Flash chega com o preço de US$ 0,50 por 1 milhão de tokens de entrada e US$ 3 por 1 milhão de tokens de saída (a entrada de áudio permanece em US$ 1 por 1 milhão de tokens).
O Gemini 3 Flash supera o 2.5 Pro em velocidade e qualidade.
Para desenvolvedores: inteligência que acompanha o ritmo
O Gemini 3 Flash foi criado para o desenvolvimento iterativo, oferecendo o desempenho de codificação de nível profissional do Gemini 3 com baixa latência, o que permite raciocinar e resolver tarefas rapidamente em fluxos de trabalho de alta frequência. No SWE-bench Verified, um benchmark para avaliar as capacidades de agentes de codificação, o Gemini 3 Flash alcança uma pontuação de 78%, superando não apenas a série 2.5, mas também o Gemini 3 Pro. Ele oferece um equilíbrio ideal para codificação orientada a agentes, sistemas prontos para produção e aplicações interativas responsivas.
O excelente desempenho do Gemini 3 Flash em raciocínio, uso de ferramentas e recursos multimodais é ideal para desenvolvedores que buscam realizar análises de vídeo mais complexas, extração de dados e perguntas e respostas visuais. Isso significa que ele pode viabilizar aplicações mais inteligentes — como agentes de suporte ao cliente ao vivo ou assistentes em jogos — que exigem tanto respostas rápidas quanto raciocínio profundo.
O Gemini 3 Flash permite o raciocínio multimodal, com assistência quase em tempo real.
Gemini 3 Flash cria e testa A/B novos designs de indicadores de carregamento em tempo quase real, simplificando o processo de design para código.
O Gemini 3 Flash usa o raciocínio multimodal para analisar e legendar uma imagem com sobreposições contextuais de interface (UI) em tempo quase real, transformando, em última análise, uma imagem estática em uma experiência interativa.
O Gemini 3 Flash utiliza um único prompt de instrução e codifica três variações de design exclusivas.
Temos recebido um ótimo retorno das empresas que utilizam o Gemini 3 Flash. Empresas como JetBrains, Bridgewater Associates e Figma já estão usando essa tecnologia para transformar seus negócios, destacando como sua velocidade de inferência, eficiência e capacidade de raciocínio se equiparam às de modelos maiores. O Gemini 3 Flash já está disponível para empresas via Vertex AI e Gemini Enterprise.
Para todos: o Gemini 3 Flash está sendo lançado globalmente
O Gemini 3 Flash agora é o modelo padrão no aplicativo Gemini, substituindo o 2.5 Flash. Isso significa que todos os nossos usuários do Gemini no mundo todo terão acesso à experiência do Gemini 3 sem custo algum, o que proporcionará uma grande melhoria em suas tarefas diárias.
Graças às incríveis capacidades de raciocínio multimodal do Gemini 3 Flash, você pode usá-lo para ver, ouvir e entender qualquer tipo de informação de forma mais rápida. Por exemplo, você pode pedir ao Gemini para entender seus vídeos e imagens e transformar esse conteúdo em um plano útil e prático em apenas alguns segundos.
O Gemini 3 Flash no aplicativo Gemini pode analisar conteúdo de vídeo curto e oferecer um plano, como, por exemplo, como melhorar sua tacada de golfe.
Como o Gemini 3 Flash é otimizado para velocidade, ele consegue ver e adivinhar o que você está desenhando enquanto você ainda está esboçando.
Você pode fazer o upload de uma gravação de áudio, e o Gemini 3 Flash pode criar um questionário personalizado e fornecer explicações detalhadas sobre as respostas.
Ou você pode criar aplicativos divertidos e úteis do zero em instantes, usando apenas a voz e sem qualquer conhecimento de programação. Basta pedir ao Gemini em qualquer lugar, e ele transforma seus pensamentos em um aplicativo funcional em questão de minutos.
O Gemini 3 Flash também está começando a ser implementado como o modelo padrão para o Modo IA na Busca, com acesso para todos ao redor do mundo.
Aprimorando os recursos de raciocínio do Gemini 3 Pro, o Modo IA com Gemini 3 Flash se destaca na compreensão das nuances da sua pergunta para fornecer respostas ponderadas e abrangentes, visualmente fáceis de assimilar, buscando informações locais em tempo real e links úteis em toda a internet. O resultado combina de forma eficaz pesquisa com ação imediata: você obtém uma análise organizada de forma inteligente, juntamente com recomendações específicas – na velocidade da Busca.
Isso se destaca ao lidar com objetivos complexos que envolvem múltiplas considerações, como planejar uma viagem de última hora ou aprender conceitos educacionais complexos rapidamente.
Experimente o Gemini 3 Flash
O Gemini 3 Flash já está disponível em versão prévia através da API Gemini no Google AI Studio, no Google Antigravity, Vertex AI e Gemini Enterprise . Você também pode acessá-lo por meio de outras ferramentas de desenvolvedor, como o Gemini CLI e o Android Studio . A novidade também está começando a ser disponibilizada para todos os usuários do aplicativo Gemini e do Modo IA na Busca, oferecendo acesso rápido e gratuito à inteligência de última geração.
Estamos ansiosos para ver o que você criará com esta família expandida de modelos: Gemini 3 Pro, Gemini 3 Deep Think e agora, Gemini 3 Flash.