Começam a circular os primeiros rumores para o R2, próxima geração do modelo de IA da DeepSeek. Se as informações estiverem corretas, é provável que a empresa chinesa vai abalar novamente o mercado e a bolsa de valores das big techs ocidentais.
Como sempre, rumores devem ser vistos com uma dose segura de ceticismo. Neste caso temos boatos circulando na mídia da China que começaram a ser traduzidos para os nossos lados. Aparentemente, o DeepSeek R2 consegue entregar uma performance semelhante ao GPT-4 Turbo da OpenAI, ou ao Gemini 2.0 Pro, da Google.


A parte realmente disruptiva da nova tecnologia seriam seus baixos custos. Segundo o post acima, o modelo R2 pode custar até 97,3% menos por token do que o GPT-4o para ser usado. Ainda de acordo com boatos vindos da China, a DeepSeek teria implementado uma versão avançada do MoE (Mixture of Experts), com programação avançada para conseguir o dobro de parâmetros no R2 em relação ao que o R1 oferecia, alcançando 1,2 trilhão.
Outra parte bem importante dos rumores é que o novo modelo teria alcançado 82% de utilização em aceleradores Ascend 910B. A DeepSeek já havia mostrado interesse nos aceleradores da Huawei desde o modelo R1, então faz sentido que a empresa avançaria na otimização de seus modelos para componentes de sua conterrânea. Principalmente para avançar a autonomia tecnológica da China.


DeepSeek poderá aproveitar chips Ascend 920 AI em breve
Vale lembrar novamente que ainda estamos na fase dos rumores, e somente depois do anúncio oficial e um uso na prática do modelo veremos quantas informações se confirmam. O fator principal aqui é o possível baixíssimo custo do R2 para operar, o que deve torná-lo muito atrativo para clientes no mundo todo.
Notícias relacionadas:
Enquanto isso, a Huawei avança no desenvolvimento de seus aceleradores também, tendo anunciado recentemente os Ascend 920 AI. A empresa aproveitou o bloqueio de envios de GPUs H20 da NVIDIA para a China para promover seu novo produto.
Se a companhia entregar em suas promessas para seus novos chips, a DeepSeek provavelmente conseguirá rodar seus modelos apenas usando hardware nacional sem dificuldade. Isso deve reduzir ainda mais seus custos.
Via: WCCFTech


Participe do grupo de ofertas do Adrenaline
Confira as principais ofertas de hardware, componentes e outros eletrônicos que encontramos pela internet. Placa de vídeo, placa-mãe, memória RAM e tudo que você precisa para montar o seu PC. Ao participar do nosso grupo, você recebe promoções diariamente e tem acesso antecipado a cupons de desconto.
Entre no grupo e aproveite as promoções