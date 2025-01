Startup chinesa desenvolveu tecnologia de IA com baixo custo

Os desenvolvedores das principais empresas de inteligência artificial dos Estados Unidos estão elogiando os modelos da DeepSeek que ganharam destaque nesta semana, ao mesmo tempo em que tentam abrir brechas para a noção de que sua tecnologia multibilionária foi superada por uma alternativa de baixo custo de uma novata chinesa.

Na segunda-feira (27), a startup chinesa DeepSeek provocou uma queda nas ações de tecnologia depois que seu assistente de IA gratuito ultrapassou o ChatGPT, da OpenAI, no topo da App Store nos EUA, aproveitando um modelo que ela disse ter treinado nos chips de processamento H800 de menor capacidade da Nvidia, usando menos de US$ 6 milhões.

Como as preocupações com a concorrência repercutiram em Wall Street, alguns especialistas em IA exaltaram a equipe e a pesquisa da DeepSeek, mas não se intimidaram, disseram pessoas familiarizadas com o pensamento de quatro dos principais laboratórios de IA, que não quiseram ser identificadas porque não estavam autorizadas a falar oficialmente.

O presidente-executivo da OpenAI, Sam Altman, escreveu no X que o R1, um dos vários modelos que a DeepSeek lançou nas últimas semanas, "é um modelo impressionante, particularmente em relação ao que eles são capazes de oferecer pelo preço".

A Nvidia disse em um comunicado que a conquista da DeepSeek provou a necessidade de produzir mais de seus chips.

O fabricante de software Snowflake decidiu ontem adicionar os modelos da DeepSeek ao seu mercado de modelos de IA após receber uma série de consultas de clientes.

Com os funcionários chamando os modelos da DeepSeek de "incríveis", a empresa ponderou os riscos potenciais de hospedar a tecnologia de IA desenvolvida na China antes de decidir oferecê-la aos clientes, disse Christian Kleinerman, vice-presidente executivo de produtos da Snowflake.

"Decidimos que, desde que sejamos claros com os clientes, não vemos problemas em oferecer suporte", disse ele.

Enquanto isso, os desenvolvedores de IA dos EUA estão buscando analisar o modelo V3, da DeepSeek. Em dezembro, a startup publicou um documento de pesquisa que acompanha o modelo, a base de seu aplicativo, mas muitas perguntas, como os custos totais de desenvolvimento, não foram respondidas.

A China passou de 18 meses para seis meses atrás dos modelos de IA de última geração desenvolvidos nos EUA, disse uma pessoa. No entanto, com a estratégia de lançamento gratuito do DeepSeek gerando tanta empolgação, a empresa poderá em breve ficar sem chips suficientes para atender à demanda, previu.

Os avanços da DeepSeek não decorreram apenas de um orçamento apertado de milhões de dólares, uma quantia minúscula em comparação com os US$ 250 bilhões que os analistas estimam que as grandes empresas dos EUA gastarão este ano em infraestrutura de IA.

O documento observou que esse custo se referia especificamente ao uso do chip em sua execução final de treinamento, e não ao custo total do desenvolvimento.

A execução do treinamento é a ponta do iceberg em termos de custo total, disseram à Reuters os executivos de dois dos principais laboratórios. O custo para determinar como projetar essa execução pode custar muito mais dinheiro, disseram eles.

Fontes de dois laboratórios de IA disseram que esperavam que os estágios anteriores de desenvolvimento dependessem de uma quantidade muito maior de chips. Uma das pessoas disse que esse investimento poderia ter custado mais de US$ 1 bilhão.

Alguns líderes norte-americanos de IA elogiaram a decisão da DeepSeek de lançar seus modelos como código aberto, o que significa que outras empresas ou indivíduos estão livres para usá-los ou alterá-los.

"O DeepSeek R1 é uma das descobertas mais incríveis e impressionantes que já vi - e como código aberto, um presente profundo para o mundo", disse o investidor Marc Andreessen em uma publicação no X no domingo.

A aclamação obtida pelos modelos da DeepSeek ressalta a viabilidade da tecnologia de IA de código aberto como uma alternativa à tecnologia cara e rigidamente controlada, como o ChatGPT, disseram observadores do setor.

As ações das empresas mais valiosas de Wall Street subiram nos últimos anos com base nas expectativas de que somente elas teriam acesso ao vasto capital e ao poder de computação necessários para desenvolver e dimensionar a tecnologia de IA emergente.

Essas suposições serão submetidas a um exame mais minucioso nesta semana e na próxima, quando essas empresas divulgarão seus resultados trimestrais.