深度求索改携手华为芯片 AI模型下载量领跑全球

18SZ图片处理

路透引述消息人士报导，中国人工智能初创企业深度求索（DeepSeek）并未依照重大模型更新前的业界惯例，向美国芯片商展示其即将发布的旗舰模型以进行性能最佳化，而是向包括华为在内的中国供应商开放了提前使用权。

报导指，DeepSeek预计将推出下一次重大更新版本V4，而AI开发商通常会向英伟达和AMD等领先芯片制造商分享重大模型的预发布版本，以确保其软件在广泛使用的硬件上高效运行。DeepSeek以往曾与英伟达的技术人员密切合作。

18SZ图片处理

研究公司Creative Strategies执行长巴赫林（Ben Bajarin）表示：「对英伟达和AMD在通用数据加速器方面的影响微乎其微，大多数企业并未运行DeepSeek，它更像是一个基准测试模型。」他补充说，新的AI程序编写工具正将软件在硬件上高效运行所需的时间，「从数月缩短至数周。」巴赫林认为，此举可能是中国政府更广泛战略的一部分，试图让美国硬件与模型在中国处于不利地位。

路透社日前引述美国政府高级官员报导，DeepSeek即将发布的新一代AI模型，使用了英伟达最先进的Blackwell芯片进行训练，此举可能违反美国的出口管制规定。

18SZ图片处理

根据该名美国官员说法，DeepSeek可能会试图移除显示其使用美国AI芯片的技术指标，并计划对外声称其模型是使用华为的芯片训练。他补充说，这些Blackwell芯片很可能集中部署于其位于中国内蒙古的数据中心。

该官员还指出，DeepSeek用于训练最新模型的过程，很可能采用了来自美国先进AI公司的「蒸馏」技术，包括利用Anthropic、Google、OpenAI等的AI模型。

18SZ图片处理

报导提到，自DeepSeek于2025年1月横空出世以来，其模型在开源平台Hugging Face上的下载量已超过7500万次，推动了中国开源模型浪潮，并与美国AI实验室展开竞争。在过去一年发布的模型中，中国模型的下载量超过了该平台上其他任何国家的模型。