Google atualiza Gemini 2.5 Pro e corrige defeitos anteriores

Upgrade gera códigos de maneira melhor que a versão antiga, atingindo pontuação alta de 82,2% no teste de benchmark Aider Polyglot, diz big tech

IA do Google vem sofrendo com críticas (Imagem: Reprodução)

Compartilhe esta matéria

O Google anunciou grande atualização para o Gemini 2.5 Pro. Ela vai atualizar certos problemas da versão anterior, chamada de I/O Edition, ou 05-06, que era focada em atualizar codificação.

O upgrade, segundo o Google, gera códigos de maneira melhor que a versão antiga, atingindo pontuação alta de 82,2% no teste de benchmark Aider Polyglot. Se os valores estiverem certos, o Gemini 2.5 Pro supera o que OpenAI, Anthropic e DeepSeek têm de melhor — e com tranquilidade.

Dados de benchmark do Gemini 2.5.
 Pro
Testes de benchmark atestam que o Google aumentou sua vantagem a briga com outras IAs (Imagem: Reprodução)

Reclamações sobre o Gemini 2.5 Pro

  • Enquanto o Gemini 2.5 Flash foi rapidamente liberado para todos, o 2.5 Pro parece que não seguirá o mesmo caminho;
  • As últimas atualizações realizadas sobre o sistema de inteligência artificial (IA) foram criticadas por não deixarem o sistema com bom desempenho;
  • Logan Kilpatrick, do Google, disse, no X, que eles levaram os feedbacks a sério e que o novo update “fecha lacuna da atualização 03-25“, o que indica que teremos uma IA mais criativa e com melhor formatação de respostas, aponta o ArsTechnica;
  • Ainda de acordo com Kilpatrick, a versão 06-05 suporta orçamentos de pensamento que podem ser configurados para desenvolvedores, sendo que eles esperam que a atualização se torne um “lançamento estável de longo prazo“, podendo ser liberada para todos em algumas semanas.

Leia mais:

Resposta do Claude, em 2023, à pergunta sobre a cor magenta
Em 2023, Claude não sabia responder a uma pergunta teste (Imagem: Reprodução/ArsTechnica)

Google se baseia em testes externos

Os testes realizados com o Gemini pelos usuários do LMArena e WebDevArena são muito apreciados pelo Google. Neles, é possível avaliar as saídas de cada modelo de linguagem grande (LLM, na sigla em inglês) lado a lado antes de mostrarem quem é quem, numa espécie de teste cego.

No LMArena, o Gemini experimentou salto de 24 pontos, ante 35 no WebDevArena. Contudo, o Gemini Pro já deixava a big tech na liderança, portanto, a vantagem só aumentou.

O ArsTechnica testou o Gemini 2.5 Pro e concluiu que a nova versão se esforça mais para usar a formatação coerente na saída. Após testes com usuários, o Google entendeu que recursos, como cabeçalhos e textos em negrito, são muito importantes.

Outra coisa que a IA fez durante o teste foi responder a uma pergunta de teste de longa duração — e o fez com precisão e autoridade. A pergunta foi: “Será que a cor seria chamada de ‘magenta’ se a cidade de Magenta não existisse?“; já a resposta foi um enfático “não“. Detalhe: o Claude, em 2023, não se sentia seguro para responder esta pergunta.

O Gemini 2.5 Pro já está disponível no Vertex AI e no AI Studio e como prévia no app do Gemini.

Resposta do Gemini à pergunta sobre a cor magenta
Já o novo Gemini 2.5 Pro responde com autoridade (Imagem: Reprodução/ArsTechnica)


Rodrigo Mozelli

Rodrigo Mozelli é jornalista formado pela Universidade Metodista de São Paulo (UMESP) e, atualmente, é redator do Olhar Digital.


Postagem Relacionada

Copyright © 2024 Jornal Vertente

Jornal Vertente
Visão geral da privacidade

Este site utiliza cookies para que possamos fornecer a melhor experiência possível ao usuário. As informações dos cookies são armazenadas em seu navegador e desempenham funções como reconhecer você quando retorna ao nosso site e ajudar nossa equipe a entender quais seções do site você considera mais interessantes e úteis.