DeepSeek R2 pode ser até 97,3% mais barato do que GPT-4o e roda em chips Huawei [RUMOR]

Créditos: Programmatic Portugal

Começam a circular os primeiros rumores para o R2, próxima geração do modelo de IA da DeepSeek. Se as informações estiverem corretas, é provável que a empresa chinesa vai abalar novamente o mercado e a bolsa de valores das big techs ocidentais.

Como sempre, rumores devem ser vistos com uma dose segura de ceticismo. Neste caso temos boatos circulando na mídia da China que começaram a ser traduzidos para os nossos lados. Aparentemente, o DeepSeek R2 consegue entregar uma performance semelhante ao GPT-4 Turbo da OpenAI, ou ao Gemini 2.0 Pro, da Google.

Captura de post falando de rumores da ChinaCaptura de post falando de rumores da China
Fonte: deedydas

A parte realmente disruptiva da nova tecnologia seriam seus baixos custos. Segundo o post acima, o modelo R2 pode custar até 97,3% menos por token do que o GPT-4o para ser usado. Ainda de acordo com boatos vindos da China, a DeepSeek teria implementado uma versão avançada do MoE (Mixture of Experts), com programação avançada para conseguir o dobro de parâmetros no R2 em relação ao que o R1 oferecia, alcançando 1,2 trilhão.

Outra parte bem importante dos rumores é que o novo modelo teria alcançado 82% de utilização em aceleradores Ascend 910B. A DeepSeek já havia mostrado interesse nos aceleradores da Huawei desde o modelo R1, então faz sentido que a empresa avançaria na otimização de seus modelos para componentes de sua conterrânea. Principalmente para avançar a autonomia tecnológica da China.

Rumores sobre o DeepSeek R2Rumores sobre o DeepSeek R2
Fonte: deedydas

DeepSeek poderá aproveitar chips Ascend 920 AI em breve

Vale lembrar novamente que ainda estamos na fase dos rumores, e somente depois do anúncio oficial e um uso na prática do modelo veremos quantas informações se confirmam. O fator principal aqui é o possível baixíssimo custo do R2 para operar, o que deve torná-lo muito atrativo para clientes no mundo todo.

Notícias relacionadas:

Enquanto isso, a Huawei avança no desenvolvimento de seus aceleradores também, tendo anunciado recentemente os Ascend 920 AI. A empresa aproveitou o bloqueio de envios de GPUs H20 da NVIDIA para a China para promover seu novo produto.

Se a companhia entregar em suas promessas para seus novos chips, a DeepSeek provavelmente conseguirá rodar seus modelos apenas usando hardware nacional sem dificuldade. Isso deve reduzir ainda mais seus custos.

Via: WCCFTech

Participe do grupo de ofertas do AdrenalineParticipe do grupo de ofertas do Adrenaline

Participe do grupo de ofertas do Adrenaline

Confira as principais ofertas de hardware, componentes e outros eletrônicos que encontramos pela internet. Placa de vídeo, placa-mãe, memória RAM e tudo que você precisa para montar o seu PC. Ao participar do nosso grupo, você recebe promoções diariamente e tem acesso antecipado a cupons de desconto.

Entre no grupo e aproveite as promoções

Postagem Relacionada

Copyright © 2024 Jornal Vertente

Jornal Vertente
Visão geral da privacidade

Este site utiliza cookies para que possamos fornecer a melhor experiência possível ao usuário. As informações dos cookies são armazenadas em seu navegador e desempenham funções como reconhecer você quando retorna ao nosso site e ajudar nossa equipe a entender quais seções do site você considera mais interessantes e úteis.