Uma empresa chinesa de inteligência artificial adicionou reconhecimento de imagem e vídeo ao seu chatbot principal.
Ao mesmo tempo, fabricantes locais de chips mostraram que agora podem igualar o suporte rápido ao lançamento que antes era uma vantagem dos EUA.
A DeepSeek, empresa com sede em Hangzhou, adicionou discretamente um novo recurso chamado “modo de reconhecimento de imagem” à sua plataforma de chat. Esse novo modo se junta a dois outros lançados no início deste mês: “expert” e “flash”.
O novo recurso permite que o chatbot compreenda fotos e vídeos, não apenas texto.
Isso o coloca no mesmo nível de outros grandes chatbots de IA que já oferecem habilidades semelhantes há algum tempo.
Chen Xiaokang, chefe da equipe multimodal da DeepSeek, disse que a ferramenta foi testada inicialmente com um pequeno grupo de usuários tanto no site quanto no aplicativo móvel.
Chen Deli, pesquisador sênior da empresa, celebrou o lançamento com um breve post que fazia referência ao logotipo da empresa: “A pequena baleia agora pode ver”.
O recurso de imagem e vídeo foi lançado poucos dias depois de a DeepSeek divulgar uma prévia de seu mais novo modelo‑estrela, o DeepSeek-V4, e disponibilizar os pesos do modelo para download e uso por qualquer pessoa.
O V4 não é um modelo único, mas dois. O primeiro, DeepSeek-V4-Pro, possui 1,6 trilhão de parâmetros e foi projetado para tarefas difíceis que exigem raciocínio complexo e fluxos de trabalho automatizados de múltiplas etapas.
O segundo, DeepSeek-V4-Flash, foi criado para lidar com um grande número de solicitações a um custo menor. Ambos os modelos suportam uma janela de contexto de um milhão de tokens.
Eles também utilizam um design híbrido de atenção que, segundo a empresa, reduz a potência de computação e a memória necessárias durante a inferência.
Fabricantes chineses de chips atingem novo marco O que chamou a atenção de muitos observadores da indústria não foi apenas o modelo em si, mas o que aconteceu no dia do seu lançamento.
Quatro empresas chinesas de chips — Huawei Ascend, Cambricon, Hygon Information e Moore Threads — confirmaram que seu hardware funcionou perfeitamente com o V4 já no primeiro dia em que foi lançado.
Esse tipo de suporte no mesmo dia, em que um novo modelo roda sem problemas em chips que não são da Nvidia já no lançamento, em vez de semanas ou meses depois, antes era quase impossível fora do ecossistema da Nvidia.
Os chips Ascend da Huawei, incluindo os A2, A3 e 950, suportam tanto o V4-Pro quanto o V4-Flash.
A empresa afirmou que seu chip Ascend 950 usa processos de computação fundidos e fluxos de processamento paralelos para tornar a inferência mais rápida.
A Cambricon finalizou sua adaptação usando a estrutura de inferência de código aberto vLLM e compartilhou seu código no GitHub.
A Hygon disse que realizou otimização profunda do modelo em sua plataforma DCU para criar um caminho fluido da liberação do modelo ao uso real.
A Moore Threads trabalhou com a Academia de Inteligência Artificial de Pequim para rodar o V4 em sua placa MTT S5000 usando a pilha de software FlagOS.
Observadores da indústria dizem que esse lançamento coordenado representa uma mudança real.
Por anos, chips fabricados fora do ecossistema da Nvidia levavam meses para suportar um modelo novo e importante. Conseguir que oito diferentes conjuntos de chips domésticos funcionem no dia zero é um marco significativo.
O panorama maior: custo e independência para a DeepSeek Analistas acreditam que o significado maior desse lançamento é que a DeepSeek demonstrou que pode oferecer IA de alto nível sem depender de hardware ocidental.
Ao fazer seus modelos funcionarem nativamente em múltiplos chips chineses simultaneamente, a empresa reduz o risco de restrições de exportação que impediram companhias chinesas de acessar os processadores americanos mais poderosos.
O custo também é importante. A DeepSeek trabalhou duro para manter o preço de execução de seus modelos baixo. Isso facilita que empresas construam sistemas automatizados sem enfrentar custos computacionais muito altos.
Dessa forma, as atualizações e o lançamento da DeepSeek não se tratam apenas de um avanço técnico. Eles são mais sobre toda uma cadeia de suprimentos que se uniu.
A partir desse lançamento, a questão de quem lidera em IA parece estar se afastando de quem cria o modelo mais inteligente e se aproximando de quem consegue manter todo o sistema funcionando de forma barata e independente a longo prazo.
Não apenas leia notícias sobre cripto. Entenda-as. Inscreva‑se em nossa newsletter. É grátis.
