Google atualiza Gemini 2.5 Pro e corrige defeitos anteriores

Tudo sobre Google

O Google anunciou grande atualização para o Gemini 2.5 Pro. Ela vai atualizar certos problemas da versão anterior, chamada de I/O Edition, ou 05-06, que era focada em atualizar codificação.

O upgrade, segundo o Google, gera códigos de maneira melhor que a versão antiga, atingindo pontuação alta de 82,2% no teste de benchmark Aider Polyglot. Se os valores estiverem certos, o Gemini 2.5 Pro supera o que OpenAI, Anthropic e DeepSeek têm de melhor — e com tranquilidade.

Dados de benchmark do Gemini 2.5.
Pro — Testes de benchmark atestam que o Google aumentou sua vantagem a briga com outras IAs (Imagem: Reprodução)

Reclamações sobre o Gemini 2.5 Pro

Enquanto o Gemini 2.5 Flash foi rapidamente liberado para todos, o 2.5 Pro parece que não seguirá o mesmo caminho;
As últimas atualizações realizadas sobre o sistema de inteligência artificial (IA) foram criticadas por não deixarem o sistema com bom desempenho;
Logan Kilpatrick, do Google, disse, no X, que eles levaram os feedbacks a sério e que o novo update “fecha lacuna da atualização 03-25“, o que indica que teremos uma IA mais criativa e com melhor formatação de respostas, aponta o ArsTechnica;
Ainda de acordo com Kilpatrick, a versão 06-05 suporta orçamentos de pensamento que podem ser configurados para desenvolvedores, sendo que eles esperam que a atualização se torne um “lançamento estável de longo prazo“, podendo ser liberada para todos em algumas semanas.

Leia mais:

Resposta do Claude, em 2023, à pergunta sobre a cor magenta — Em 2023, Claude não sabia responder a uma pergunta teste (Imagem: Reprodução/ArsTechnica)

Google se baseia em testes externos

Os testes realizados com o Gemini pelos usuários do LMArena e WebDevArena são muito apreciados pelo Google. Neles, é possível avaliar as saídas de cada modelo de linguagem grande (LLM, na sigla em inglês) lado a lado antes de mostrarem quem é quem, numa espécie de teste cego.

No LMArena, o Gemini experimentou salto de 24 pontos, ante 35 no WebDevArena. Contudo, o Gemini Pro já deixava a big tech na liderança, portanto, a vantagem só aumentou.

O ArsTechnica testou o Gemini 2.5 Pro e concluiu que a nova versão se esforça mais para usar a formatação coerente na saída. Após testes com usuários, o Google entendeu que recursos, como cabeçalhos e textos em negrito, são muito importantes.

Outra coisa que a IA fez durante o teste foi responder a uma pergunta de teste de longa duração — e o fez com precisão e autoridade. A pergunta foi: “Será que a cor seria chamada de ‘magenta’ se a cidade de Magenta não existisse?“; já a resposta foi um enfático “não“. Detalhe: o Claude, em 2023, não se sentia seguro para responder esta pergunta.

O Gemini 2.5 Pro já está disponível no Vertex AI e no AI Studio e como prévia no app do Gemini.