A DeepSeek é uma startup chinesa que tem ganhado destaque no cenário global de inteligência artificial (IA) devido ao desenvolvimento de modelos de linguagem avançados e acessíveis. Fundada em Hangzhou, cidade conhecida por seu ecossistema tecnológico vibrante, a empresa rapidamente se posicionou como uma concorrente de peso para gigantes como OpenAI.
Origem e Crescimento
Hangzhou, lar de empresas como Alibaba e NetEase, emergiu como um centro de inovação tecnológica na China. A DeepSeek, fundada por Liang Wenfeng, ex-aluno da Universidade de Zhejiang, é um exemplo desse ambiente fértil para startups. A empresa tem atraído atenção nacional e internacional, simbolizando o potencial da China em IA, mesmo diante de restrições geopolíticas.
Modelos de Linguagem Lançados
Em novembro de 2023, a DeepSeek lançou seu primeiro modelo, o DeepSeek-Coder, disponível gratuitamente para pesquisadores e usuários comerciais. Este modelo de código aberto, sob a licença MIT, permitiu ampla adoção e adaptação pela comunidade.
Em maio de 2024, a empresa apresentou o DeepSeek-V2, que se destacou por seu custo-benefício, oferecendo desempenho competitivo a um preço de 2 RMB por milhão de tokens gerados. Este modelo foi classificado em sétimo lugar pelo Tiger Lab da Universidade de Waterloo.
Em dezembro de 2024, a DeepSeek lançou o DeepSeek-V3, com 671 bilhões de parâmetros. Este modelo foi treinado em 55 dias, com um custo de aproximadamente 5,58 milhões de dólares, significativamente menor que os investimentos de concorrentes. Testes mostraram que o DeepSeek-V3 superou modelos como LLaMA 3.1 e Qwen 2.5, equiparando-se ao GPT-4o e Claude 3.5 Sonnet.
Modelo de Raciocínio R1
Em novembro de 2024, a DeepSeek introduziu o DeepSeek-R1-Lite-Preview, treinado para tarefas de inferência lógica, raciocínio matemático e resolução de problemas em tempo real. A empresa afirmou que este modelo superou o OpenAI o1 em benchmarks como o American Invitational Mathematics Examination (AIME) e MATH.
Em janeiro de 2025, foram lançados o DeepSeek-R1 e o DeepSeek-R1-Zero, baseados no V3-Base. Esses modelos avançados geram respostas passo a passo, imitando o raciocínio humano. Testes iniciais mostraram desempenho comparável ao OpenAI o1 em tarefas de matemática, química e programação.
Impacto no Mercado e Geopolítica
A ascensão da DeepSeek teve repercussões significativas no mercado financeiro e na geopolítica. Investidores globais começaram a redirecionar recursos para ações chinesas, impulsionados pelos avanços da DeepSeek em IA. No entanto, há ceticismo sobre a sustentabilidade desse movimento, devido a tendências conservadoras de investimento na China e possíveis restrições do Partido Comunista Chinês.
Além disso, a DeepSeek tem sido alvo de investigações internacionais. Procuradores de Singapura revelaram um caso de fraude envolvendo o fornecimento de servidores dos EUA para a Malásia, relacionado à transferência de chips de IA da Nvidia para a DeepSeek, que está sob investigação dos EUA por possível uso de chips proibidos.
Integração e Adoção
Empresas chinesas de diversos setores têm integrado rapidamente o modelo DeepSeek-R1 em seus produtos e estratégias. De automotivo a financeiro, a IA da DeepSeek tem sido adotada amplamente. Enquanto algumas empresas encontram aplicações práticas, outras utilizam a tecnologia para publicidade ou como símbolo de orgulho nacional.
Técnicas de Distilação e Acessibilidade
A DeepSeek tem se beneficiado da técnica de “distilação” para criar modelos de linguagem grandes a custos mais baixos. Essa técnica envolve o uso de um modelo “professor” grande para treinar um modelo “aluno” menor, reduzindo significativamente os custos computacionais. Isso torna o desenvolvimento de IA mais acessível e desafia empresas que dependem de modelos proprietários caros.
A DeepSeek exemplifica a capacidade da China de inovar em IA, mesmo diante de desafios geopolíticos e restrições tecnológicas. Com modelos de linguagem avançados e estratégias de código aberto, a empresa não apenas elevou o padrão para concorrentes globais, mas também democratizou o acesso a tecnologias de ponta. À medida que continua a evoluir, a DeepSeek provavelmente desempenhará um papel central na definição do futuro da inteligência artificial.
Para continuar explorando histórias de inovação e liderança no mundo da tecnologia, confira nosso próximo artigo: A História da NVIDIA: Inovação e Liderança no Mundo da Tecnologia.
Descubra mais sobre Dicionário News
Assine para receber nossas notícias mais recentes por e-mail.