Bengaluru -Deepseek, uma start-up de IA chinesa que tem pouco mais de um ano, provocou admiração e consternação no Vale do Silício depois de demonstrar modelos inovadores de inteligência artificial (AI) que oferecem desempenho comparável aos melhores chatbots do mundo por uma fração aparentemente uma fração do custo .

O surgimento de Deepseek pode oferecer um contraponto à crença generalizada de que o futuro da IA ​​exigirá quantidades cada vez maiores de energia e energia para se desenvolver.

Os estoques de tecnologia global caíram como hype em torno da inovação da Deepseek, e os investidores começaram a digerir as implicações para seus rivais baseados nos EUA e seus fornecedores de hardware.

O que exatamente é Deepseek?

O Deepseek foi fundado em 2023 por Liang Wenfeng, o chefe do fundo de hedge de quantidades de IA. A empresa desenvolve modelos de IA com código aberto, o que significa que a comunidade de desenvolvedores em geral pode inspecionar e melhorar o software. Isso é O aplicativo móvel subiu para o topo das paradas de download do iPhone nos Estados Unidos após seu lançamento no início de janeiro.

O aplicativo se distingue de outros chatbots, como o Chatgpt, da Openai, articulando seu raciocínio antes de fornecer uma resposta a um prompt. A empresa afirma que seu novo modelo de IA – R1 – oferece desempenho em pé de igualdade com o mais recente do OpenAI e concedeu licença para indivíduos interessados ​​em desenvolver chatbots usando a tecnologia para desenvolver nela.

Como o DeepSeek R1 se compara a Openai ou Meta AI?

Embora não seja totalmente detalhado pela empresa, o custo do treinamento e o desenvolvimento dos modelos da Deepseek parece ser apenas uma fração do que é necessário para os melhores produtos da OpenAI ou Meta Platform. A eficiência muito melhor do modelo questiona a necessidade de grandes despesas de capital para adquirir os mais recentes e mais poderosos aceleradores de IA de artistas como a NVIDIA. Isso também amplifica a atenção nos freios de exportação dos EUA desses semicondutores avançados para a China – que se destinavam a impedir um avanço do tipo que o Deepseek parece representar.

Deepseek diz que o R1 está próximo ou melhor do que os modelos rivais em vários benchmarks líderes, como o Aime 2024 para tarefas matemáticas, MMLU para conhecimento geral e Alpacaeeval 2.0 para desempenho de perguntas e respostas. Ele também está entre os melhores desempenhos em uma tabela de classificação afiliada à UC Berkeley chamada Chatbot Arena.

O que está sofrendo alarme nos EUA?

Washington proibiu a exportação de tecnologias de ponta como os semicondutores de GPU para a China, em uma tentativa de impedir os avanços do país na IA, a principal fronteira do concurso americano-China para a supremacia tecnológica. Mas o progresso de Deepseek sugere que os engenheiros da IA ​​chineses se aproximaram das restrições, concentrando -se em maior eficiência com recursos limitados. Embora ainda não esteja claro o quanto o hardware de treinamento avançado da IA ​​Deepseek teve acesso, a empresa demonstrou o suficiente para sugerir que as restrições comerciais não foram totalmente eficazes em impedir o progresso da China.

Quando Deepseek despertou interesse global?

O desenvolvedor da IA ​​tem sido observado de perto desde o lançamento de seu modelo mais antigo em 2023. Então, em novembro, deu ao mundo um vislumbre de seu modelo de raciocínio Deepseek R1, projetado para imitar o pensamento humano. Esse modelo sustenta seu aplicativo móvel de chatbot, que, juntamente com a interface da web, em janeiro, disparou para a Global Renome como uma alternativa muito mais barata do Openai, com o investidor Marc Andreessen chamando de “momento do Sputnik da IA”.

O aplicativo Mobile Deepseek foi baixado 1,6 milhão de vezes em 25 de janeiro e ficou em primeiro lugar nas lojas de aplicativos para iPhone na Austrália, Canadá, China, Cingapura, EUA e Reino Unido, de acordo com dados de figuras de aplicativos de rastreamento de mercado.

Quem é o fundador da Deepseek?

Nascido em Guangdong em 1985, Liang recebeu diplomas de bacharel e mestrado em engenharia eletrônica e de informação pela Universidade de Zhejiang. Ele fundou a Deepseek em 2023 com 10 milhões de yuans (US $ 1,9 milhão) em capital registrado, de acordo com o banco de dados da empresa Tianyancha.

O gargalo para avanços adicionais não é mais angariação de fundos, disse Liang em entrevista à loja chinesa 36kr, mas restrições nos EUA ao acesso às melhores fichas. A maioria de seus principais pesquisadores foram recém -formados das principais universidades chinesas, disse ele, enfatizando a necessidade de a China desenvolver seu próprio ecossistema doméstico semelhante ao construído em torno da Nvidia e seus chips de IA.

“Mais investimentos não levam necessariamente a mais inovação. Caso contrário, as grandes empresas assumiriam toda a inovação ”, disse Liang.

Onde está o Deepseek na paisagem da IA ​​da China?

Os líderes de tecnologia da China, do Alibaba Group Holding e Baidu a Tencent Holdings, investiram dinheiro e recursos significativos na corrida para adquirir hardware e clientes para seus empreendimentos de IA. Juntamente com a start-up 01.ai da Kai-Fu Lee, a Deepseek se destaca com sua abordagem de código aberto-projetado para recrutar o maior número de usuários rapidamente antes de desenvolver estratégias de monetização em cima desse grande público.

Como os modelos da Deepseek são mais acessíveis, ele já desempenhou um papel em ajudar a reduzir os custos para os desenvolvedores de IA na China, onde os jogadores maiores se envolveram em uma guerra de preços que viram ondas sucessivas de cortes de preços no ano passado e meio.

Quais são as implicações para o mercado global de IA?

O sucesso da Deepseek pode empurrar o OpenAI e outros provedores dos EUA para reduzir seus preços para manter sua liderança estabelecida. Também questiona os vastos gastos de empresas como a Meta e a Microsoft – cada uma das quais se comprometeu com o CAPEX de US $ 65 bilhões ou mais este ano, em grande parte na infraestrutura de IA – se modelos mais eficientes puderem competir com um gasto muito menor.

O fato de os mercados globais de ações globais venderam empresas como NVIDIA e ASML Holding, que se beneficiaram da demanda em expansão por serviços de IA. As ações dos nomes chineses vinculados à Deepseek, como Iflytek, subiram.

Os desenvolvedores de todo o mundo já estão experimentando o software da Deepseek e procurando criar ferramentas com ele. Isso pode acelerar a adoção de modelos avançados de raciocínio de IA – ao mesmo tempo em que potencialmente tocaram a preocupação adicional com a necessidade de guardares em torno de seu uso. Os avanços da Deepseek podem acelerar a regulamentação para controlar como a IA é desenvolvida.

Quais são as deficiências de Deepseek?

Como todos os outros modelos de IA chineses, os autocensores profundos sobre tópicos considerados sensíveis na China. Ele desvia as consultas sobre os protestos da Praça Tiananmen de 1989 ou perguntas geopoliticamente difíceis, como a possibilidade de a China invadir Taiwan. Nos testes, o Bot Deepseek é capaz de dar respostas detalhadas sobre figuras políticas como o primeiro -ministro indiano Narendra Modi, mas se recusa a fazê -lo sobre o presidente chinês Xi Jinping.

É provável que a infraestrutura em nuvem da Deepseek seja testada por sua súbita popularidade. A empresa experimentou brevemente uma grande interrupção em 27 de janeiro e terá que gerenciar ainda mais tráfego, à medida que os usuários novos e que retornam despejam mais consultas em seu chatbot. Bloomberg

Juntar Canal de telegrama da ST E receba as últimas notícias de última hora.

Source link