Gemini 2.5: nossos modelos mais inteligentes estão ficando ainda melhores

20 Mai, 2025

Tulsee Doshi

Em março, anunciamos o Gemini 2.5 Pro, nosso modelo mais inteligente até o momento, e há duas semanas, apresentamos no I/O novidades para que os desenvolvedores criem apps incríveis. Hoje, estamos trazendo ainda mais atualizações para nossa série de modelos Gemini 2.5:

Além do incrível desempenho do 2.5 Pro em parâmetros acadêmicos, ele agora é o modelo líder mundial na classificação do WebDev Arena e LMArena, e para ajudar as pessoas a aprenderem..
Estamos trazendo novos recursos para as versões 2.5 Pro e 2.5 Flash: saída de áudio nativa para uma experiência de conversação mais natural, segurança avançada e os recursos de uso em computador do Project Mariner. A versão 2.5 Pro ficará ainda melhor com o Deep Think, um modo de raciocínio experimental e aprimorado para matemática e programação altamente complexas.
Continuamos investindo na experiência do desenvolvedor: introduzimos resumos na API do Gemini e Vertex AI para aumentar a transparência, ampliamos os os limites de processamento cognitivo para a versão 2.5 Pro para aumentar o controle e adicionamos suporte para ferramentas MCP no SDK do Gemini para acesso a mais ferramentas de código aberto.
O Flash 2.5 já está disponível para todos os usuários no app Gemini, e disponibilizaremos nossa versão atualizada para o público em geral no Google AI Studio para desenvolvedores e no Vertex AI para empresas no início de junho. O 2.5 Pro será disponibilizado logo em seguida.

Este progresso é resultado do esforço incansável de nossas equipes no Google para aprimorar nossas tecnologias, desenvolvê-las e lançá-las com segurança e responsabilidade.

2.5 Pro: desempenho melhor do que nunca

Recentemente, atualizamos o 2.5 Pro para ajudar os desenvolvedores a criar apps mais completos e interativos. É ótimo ver a reação positiva de usuários e desenvolvedorese continuamos a fazer melhorias com base no feedback deles.

Além de excelente desempenho em parâmetros acadêmicos, o novo 2.5 Pro agora lidera o popular ranking de codificação, WebDev Arena, com uma pontuação ELO de 1420. Ele também lidera em todas as categorias do ranking LMArena, que avalia a preferência dos usuários em diversas dimensões. E, com uma janela de contexto de um milhão de tokens, o 2.5 Pro entrega desempenho de ponta em contexto longo e compreensão de vídeo.

Desde a incorporação do LearnLM, nossa família de modelos desenvolvida com especialistas em educação, o 2.5 Pro também se tornou o modelo líder em aprendizagem. Em comparações diretas que avaliaram pedagogia e eficácia, educadores e especialistas preferiram o Gemini 2.5 Pro a outros modelos em diversos cenários. Ele superou os principais modelos em todos os cinco princípios da ciência da aprendizagem usados para construir sistemas de IA para aprendizagem.

Saiba mais no card de modelo do Gemini 2.5 Pro atualizado e na página de tecnologia do Gemini.

Deep Think

Explorando as fronteiras das capacidades de raciocínio do Gemini, estamos começando a testar um modo de raciocínio aprimorado chamado Deep Think, que utiliza novas técnicas de pesquisa que permitem ao modelo considerar múltiplas hipóteses antes de responder.

O 2.5 Pro Deep Think atingiu uma pontuação impressionante no USAMO 2025, atualmente um dos parâmetros matemáticos mais rigorosos. Ele também lidera no LiveCodeBench, um benchmark de codificação em nível de competição, apresenta um desempenho sólido em parâmetros de raciocínio e pontua84% no MMMU, que testa raciocínio multimodal.

E, porque estamos definindo a fronteira com o 2.5 Pro DeepThink, estamos incluindo um tempo extra para conduzir mais avaliações de segurança e obter feedbacks de especialistas. Como parte disso, estamos tornando o produto disponível para trusted testers por meio da API de Gemini para conseguir mais feedbacks antes de torná-lo amplamente disponível.

Um 2.5 Flash ainda melhor

O 2.5 Flash é nosso modelo de trabalho mais eficiente, projetado para velocidade e baixo custo, e agora está melhor em várias dimensões. Ele foi aprimorado a partir de parâmetros importantes para raciocínio, multimodalidade, programação e contexto longo, além de se tornar ainda mais eficiente, usando de 20% a 30% menos tokens em nossas avaliações.

O novo Flash 2.5 já está disponível para pré-visualização no Google AI Studio para desenvolvedores, no Vertex AI para empresas e no app Gemini para os demais usuários. No início de junho, estará disponível para todos.

Saiba mais no card de modelo do Gemini 2.5 Flash atualizado e na página de tecnologia do Gemini.

Novos recursos do Gemini 2.5

Saída de áudio nativa e melhorias na Live API

Hoje, a Live API apresenta uma versão de prévia do diálogo com entrada audiovisual e saída de áudio nativa, para que você possa criar diretamente experiências de conversação com um Gemini mais natural e expressiva. Ela também permite que o usuário controle o tom, o sotaque e o estilo de fala. Por exemplo, você pode instruir o modelo a usar uma voz dramática ao contar uma história. O modelo agora também aceita o uso de ferramentas para pesquisa em seu nome.

Você também pode experimentar um conjunto de recursos iniciais, incluindo:

Diálogo Afetivo, no qual o modelo detecta emoções na voz do usuário e responde adequadamente.
Áudio Proativo, no qual o modelo ignora conversas em segundo plano e sabe quando responder.
Pensamento, na API Live, no qual o modelo utiliza os recursos de pensamento do Gemini para realizar tarefas mais complexas.

Publicado em: