DeepSeek: IA chinesa recebe nova atualização

O R1-0528 é um modelo de IA que teria uma capacidade de raciocínio semelhante ao o4 mini e o3, da OpenAI

(Imagem: Rokas Tenys/Shutterstock)

Compartilhe esta matéria

O lançamento do DeepSeek, modelo de inteligência artificial desenvolvido na China, impactou o mercado de tecnologia. A ferramenta rapidamente derrubou ações de gigantes do setor, provocando prejuízos bilionários.

Aos poucos, os investidores foram se acalmando. Mas agora as incertezas estão de volta graças ao lançamento de uma atualização pela empresa chinesa que promete intensificar a competição com rivais como a OpenAI, dona do ChatGPT.

Modelo R1-0528

A novidade do DeepSeek é o R1-0528. O modelo teria uma capacidade de raciocínio semelhante ao o4 mini e o3 da OpenAI e ficaria à frente de rivais do setor como o Grok 3 mini, da xAI, e do Qwen 3, do Alibaba.

Tela inicial do DeepSeek em um smartphone
Empresa chinesa não forneceu maiores detalhes sobre a novidade (Imagem: Poetra.RH/Shutterstock)

A empresa chinesa não divulgou maiores informações sobre o novo lançamento. Ela se resumiu a dizer que fez uma “pequena atualização de teste” e que os usuários poderiam começar a testar a nova ferramenta em breve, sem fornecer uma data.

Independentemente do poder desta nova atualização, o DeepSeek acelerou a corrida pela IA, forçando as empresas do mundo todo a fornecerem descontos para o acesso das ferramentas, bem como apressando o lançamento de novos produtos. Ainda há expectativa que o modelo R2, um sucessor do R1, seja lançado nos próximos meses.

Leia mais

Ícones dos aplicativos do ChatGPT e do DeepSeek na tela inicial de iPhone
DeepSeek virou um dos principais concorrentes do ChatGPT, financiado pela Microsoft (Imagem: Poetra.RH/Shutterstock)

Lançamento do DeepSeek foi um marco

  • A IA do DeepSeek foi projetada para lidar com tarefas complexas de raciocínio e tem apresentado resultados surpreendentes.
  • O grande diferencial é o baixo custo da tecnologia, o que pode ameaçar a posição dominante dos principais players.
  • Para se ter uma ideia, o modelo chinês foi treinado ao custo de aproximadamente US$ 6 milhões, enquanto ferramentas como o Llama 3.1, da Meta, custaram mais de US$ 60 milhões para serem desenvolvidos.
  • A empresa chinesa adota estratégias como o chamado aprendizado por reforço, que permite que os modelos aprendam por tentativa e erro.
  • Além disso, ativa apenas uma fração dos parâmetros do modelo para tarefas específicas, economizando recursos computacionais.
  • E melhora a capacidade dos modelos de processar dados e identificar padrões complexos.
  • A startup ainda adota um modelo parcialmente aberto, permitindo que pesquisadores acessem seus algoritmos.
  • Isso democratiza o acesso à IA avançada e promove maior colaboração na comunidade global de pesquisa.


Alessandro Di Lorenzo

Colaboração para o Olhar Digital

Alessandro Di Lorenzo é formado em Jornalismo pela Universidade Federal do Rio Grande do Sul (UFRGS) e atua na área desde 2014. Trabalhou nas redações da BandNews FM em Porto Alegre e em São Paulo.

Bruno Capozzi

Bruno Capozzi é jornalista formado pela Faculdade Cásper Líbero e mestre em Ciências Sociais pela PUC-SP, tendo como foco a pesquisa de redes sociais e tecnologia.


Postagem Relacionada

Copyright © 2024 Jornal Vertente

Jornal Vertente
Visão geral da privacidade

Este site utiliza cookies para que possamos fornecer a melhor experiência possível ao usuário. As informações dos cookies são armazenadas em seu navegador e desempenham funções como reconhecer você quando retorna ao nosso site e ajudar nossa equipe a entender quais seções do site você considera mais interessantes e úteis.