
路透引述消息人士报导,中国人工智能初创企业深度求索(DeepSeek)并未依照重大模型更新前的业界惯例,向美国芯片商展示其即将发布的旗舰模型以进行性能最佳化,而是向包括华为在内的中国供应商开放了提前使用权。
报导指,DeepSeek预计将推出下一次重大更新版本V4,而AI开发商通常会向英伟达和AMD等领先芯片制造商分享重大模型的预发布版本,以确保其软件在广泛使用的硬件上高效运行。DeepSeek以往曾与英伟达的技术人员密切合作。

研究公司Creative Strategies执行长巴赫林(Ben Bajarin)表示:「对英伟达和AMD在通用数据加速器方面的影响微乎其微,大多数企业并未运行DeepSeek,它更像是一个基准测试模型。」他补充说,新的AI程序编写工具正将软件在硬件上高效运行所需的时间,「从数月缩短至数周。」巴赫林认为,此举可能是中国政府更广泛战略的一部分,试图让美国硬件与模型在中国处于不利地位。
路透社日前引述美国政府高级官员报导,DeepSeek即将发布的新一代AI模型,使用了英伟达最先进的Blackwell芯片进行训练,此举可能违反美国的出口管制规定。

根据该名美国官员说法,DeepSeek可能会试图移除显示其使用美国AI芯片的技术指标,并计划对外声称其模型是使用华为的芯片训练。他补充说,这些Blackwell芯片很可能集中部署于其位于中国内蒙古的数据中心。
该官员还指出,DeepSeek用于训练最新模型的过程,很可能采用了来自美国先进AI公司的「蒸馏」技术,包括利用Anthropic、Google、OpenAI等的AI模型。

报导提到,自DeepSeek于2025年1月横空出世以来,其模型在开源平台Hugging Face上的下载量已超过7500万次,推动了中国开源模型浪潮,并与美国AI实验室展开竞争。在过去一年发布的模型中,中国模型的下载量超过了该平台上其他任何国家的模型。








