gdeac.comLar NavegaçãoNavegação
Lar >  Notícias >  A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

Autor : Nora Atualizar:Apr 12,2025

O novo chatbot da Deepseek, que afirmou com ousadia: "Oi, fui criado para que você possa perguntar qualquer coisa e obter uma resposta que possa até surpreendê -lo", fez ondas significativas na indústria da IA. Esta introdução não apenas chamou a atenção, mas também contribuiu para uma das maiores quedas de preços das ações da Nvidia, mostrando o impacto da Deepseek no mercado.

Teste Deepseek Imagem: Ensigame.com

O modelo de AI da Deepseek se destaca devido à sua arquitetura inovadora e métodos de treinamento. Vamos nos aprofundar nas principais tecnologias que o diferenciam:

Previsão com vários toques (MTP) : Este método permite que o modelo preveja várias palavras de uma só vez, analisando diferentes segmentos de uma frase. Isso não apenas aumenta a precisão, mas também a eficiência do modelo, tornando -o uma ferramenta poderosa para entender e gerar texto.

Mistura de especialistas (MOE) : Deepseek V3 utiliza uma arquitetura sofisticada com 256 redes neurais, ativando oito para cada tarefa de processamento de token. Essa abordagem acelera significativamente o treinamento de IA e melhora o desempenho geral, tornando -o um recurso de destaque de sua tecnologia.

Atenção latente de várias cabeças (MLA) : Esse mecanismo se concentra nas partes mais cruciais de uma frase, extraindo detalhes importantes repetidamente. Ao fazer isso, o MLA reduz o risco de perder informações importantes, permitindo que a IA captura detalhes diferenciados nos dados de entrada.

A Deepseek, uma proeminente startup chinesa, afirma ter desenvolvido esse modelo de IA competitivo a um custo relativamente baixo. Eles afirmam que o treinamento da poderosa rede neural Deepseek V3 custou apenas US $ 6 milhões e usou apenas 2048 processadores gráficos.

Deepseek v3 Imagem: Ensigame.com

No entanto, analistas da semiânica descobriram que as operações da Deepseek envolvem uma infraestrutura computacional muito maior. Eles estimam que o DeepSeek usa aproximadamente 50.000 GPUs da NVIDIA Hopper, incluindo 10.000 unidades H800, 10.000 H100s e GPUs H20 adicionais, espalhados por vários data centers. Esses recursos são usados ​​para treinamento, pesquisa e modelagem financeira de IA, com o investimento total da empresa em servidores atingindo cerca de US $ 1,6 bilhão e despesas operacionais em US $ 944 milhões.

A Deepseek é uma subsidiária do fundo de hedge chinês High-Flyer, que o estabeleceu como uma divisão separada de IA em 2023. Ao contrário de muitas startups que dependem da computação em nuvem, a DeepSeek possui seus data centers, oferecendo controle completo sobre a otimização de modelos de IA e uma implantação mais rápida da inovação. O status autofinanciado da empresa aumenta sua agilidade e velocidade de tomada de decisão.

Deepseek Imagem: Ensigame.com

Além disso, a Deepseek atrai os principais talentos das principais universidades chinesas, com alguns pesquisadores ganhando mais de US $ 1,3 milhão anualmente. Apesar desses investimentos significativos, a reivindicação da empresa de treinar seu modelo mais recente por apenas US $ 6 milhões parece irrealista, pois esse número é responsável apenas pelo uso da GPU durante o pré-treinamento e exclui outros custos substanciais, como pesquisa, refinamento de modelos, processamento de dados e infraestrutura.

Desde a sua fundação, a Deepseek investiu mais de US $ 500 milhões em desenvolvimento de IA. Sua estrutura compacta permite implementar inovações de IA de maneira rápida e eficaz, diferentemente de empresas maiores e mais burocráticas.

Deepseek Imagem: Ensigame.com

O exemplo da Deepseek ilustra que uma empresa de IA independente e bem financiada pode competir com gigantes do setor. Embora o sucesso da empresa seja impulsionado por investimentos substanciais, avanços técnicos e uma equipe forte, a noção de um "orçamento revolucionário" para o desenvolvimento do modelo de IA pode ser exagerado. No entanto, os custos da Deepseek permanecem significativamente menores do que os de seus concorrentes, como os US $ 100 milhões gastos no treinamento de ChatGPT4O em comparação com os US $ 5 milhões da Deepseek em R1.

No entanto, ainda é mais barato que seus concorrentes.

Artigos Mais Recentes
  • Nintendo Switch 2 Câmera: 1080p vs. Modelo de Planta de Piranha 480p de Hori

    ​ O Nintendo Switch 2 da Hori Câmera Plant Plant possui uma resolução modesta de apenas 480p, significativamente menor que a resolução de 1080p oferecida pela câmera Official Switch 2 da Nintendo. Isso foi confirmado pelo Reino Unido, minha loja Nintendo, que forneceu os seguintes detalhes: Nintendo Switch 2 Câmera - Vídeo C

    Autor : Nathan Ver tudo

  • Lost Mastery: Card Battler encontra o jogo de memória - inteligência como sua arma

    ​ Ontem, exploramos jogos que misturam gêneros e hoje, mergulhamos em outro exemplo fascinante: o domínio perdido. Este jogo exclusivo combina a profundidade estratégica de um batedor de cartas com o desafio mental de um quebra -cabeça de memória, transformando sua inteligência em sua arma mais poderosa. Em domínio perdido, você é passo para

    Autor : Elijah Ver tudo

  • PGA Tour 2K25 revela as estrelas da capa

    ​ Summarypga Tour 2K25 apresenta Tiger Woods, Max Homa e Matt Fitzpatrick na capa Art.Fans Apreciado ao ver a icônica pose de comemoração do US Open da Woods na capa padrão, também é apresentada em um acordo em aquarela.

    Autor : Audrey Ver tudo

Tópicos
Ferramentas de comunicação essenciais para negócios
Ferramentas de comunicação essenciais para negóciosTOP

Simplifique sua comunicação comercial com nossas ferramentas essenciais! Esta coleção com curadoria apresenta aplicativos populares como Hello Yo - salas de bate -papo em grupo para colaboração de equipes perfeitas, além do Messenger e X Plus Messenger para mensagens aprimoradas e opções seguras, como Tutanota, para e -mail privado. Mantenha -se conectado com as meninas conversas grátis - vídeo ao vivo e bate -papo de texto para interações rápidas, explore a experiência modificada do telegrama com Hazi, também conhecido como mod de telegrama, desfrute de chamadas gratuitas com chamada gratuita e aproveite a interface familiar do Watsap Messenger. Encontre o aplicativo de comunicação perfeito para aumentar sua eficiência comercial hoje!