DeepSeek, a IA chinesa que desafia os gigantes tecnológicos e agita Wall Street
DeepSeek, a startup chinesa fundada em 2023 em Hangzhou, emergiu como uma ameaça séria para os gigantes da tecnologia graças ao seu modelo de inteligência artificial generativa, o DeepSeek-V3. Este sistema não só superou o ChatGPT como a aplicação gratuita mais descarregada na App Store dos Estados Unidos, mas também desafia as normas estabelecidas no setor ao demonstrar que é possível obter resultados de alto desempenho sem recorrer a infraestruturas extremamente caras.
Ao contrário de modelos como o GPT-4 da OpenAI ou o Claude 3.5 Sonnet da Anthropic, que exigem investimentos entre centenas de milhões e mil milhões de dólares, a DeepSeek conseguiu treinar o seu modelo com um orçamento inferior a 6 milhões. Esta abordagem económica e eficiente, combinada com o uso de hardware menos avançado, permitiu à DeepSeek democratizar o acesso à IA, oferecendo o seu assistente gratuitamente a milhões de utilizadores em todo o mundo.
Um impacto sísmico nos mercados financeiros
O lançamento da DeepSeek teve repercussões imediatas e profundas nos mercados tecnológicos. As ações da Nvidia, líder na produção de chips avançados para IA, caíram ontem 17% num único dia, representando uma perda de capitalização bolsista de quase 560 mil milhões de euros. Segundo analistas da BCG, esta queda é a maior já registada na história da bolsa para uma única empresa num único dia.
O modelo da DeepSeek gerou incerteza sobre o futuro da procura por chips de alto desempenho, um segmento crucial para empresas como Nvidia, Microsoft, Alphabet e Meta. Até agora, a narrativa predominante indicava que a IA impulsionaria uma procura massiva por hardware avançado. No entanto, a DeepSeek demonstrou que é possível alcançar resultados competitivos com uma infraestrutura mais económica, desafiando essa suposição e desestabilizando as principais empresas do setor.
A tecnologia por trás do sucesso
O modelo DeepSeek-V3, com 671 mil milhões de parâmetros, destaca-se em diversas áreas de avaliação. Superou os seus concorrentes na resolução de problemas matemáticos (90,2 pontos no MATH 500) e programação (51,6 pontos no Codeforces). Além disso, posiciona-se como um modelo de código aberto, o que não só permite a outros contribuírem para a sua melhoria, mas também reduz custos ao eliminar o pagamento de direitos a gigantes como a OpenAI ou a Google.
A DeepSeek não só oferece capacidades conversacionais avançadas, como também pode navegar na web em tempo real, resolver problemas complexos e resumir documentos de texto com precisão. Estas funcionalidades tornam-na numa ferramenta versátil que está a atrair tanto utilizadores individuais como empresas.
Para além do impacto tecnológico e financeiro, a DeepSeek reacendeu o debate sobre a supremacia tecnológica global. Apesar das restrições impostas pelos Estados Unidos para limitar a exportação de chips avançados para a China, a DeepSeek demonstrou que as empresas chinesas podem inovar mesmo em condições restritivas.
No entanto, a polémica não demorou a surgir. Alguns críticos apontaram uma possível violação dos controlos norte-americanos, sugerindo que a DeepSeek poderá ter acedido a chips avançados da Nvidia de forma não autorizada. Além disso, a censura sobre temas sensíveis, como os protestos de Tiananmen, e a falta de transparência sobre a estrutura da empresa levantaram dúvidas sobre as intenções e o modelo ético da DeepSeek.