返回
人工智能

深度求索改携手华为芯片 AI模型下载量领跑全球

来源:路透社2026-03-04 12:1940

18SZ图片处理

路透引述消息人士报导,中国人工智能初创企业深度求索(DeepSeek)并未依照重大模型更新前的业界惯例,向美国芯片商展示其即将发布的旗舰模型以进行性能最佳化,而是向包括华为在内的中国供应商开放了提前使用权。

报导指,DeepSeek预计将推出下一次重大更新版本V4,而AI开发商通常会向英伟达和AMD等领先芯片制造商分享重大模型的预发布版本,以确保其软件在广泛使用的硬件上高效运行。DeepSeek以往曾与英伟达的技术人员密切合作。

18SZ图片处理

研究公司Creative Strategies执行长巴赫林(Ben Bajarin)表示:「对英伟达和AMD在通用数据加速器方面的影响微乎其微,大多数企业并未运行DeepSeek,它更像是一个基准测试模型。」他补充说,新的AI程序编写工具正将软件在硬件上高效运行所需的时间,「从数月缩短至数周。」巴赫林认为,此举可能是中国政府更广泛战略的一部分,试图让美国硬件与模型在中国处于不利地位。

路透社日前引述美国政府高级官员报导,DeepSeek即将发布的新一代AI模型,使用了英伟达最先进的Blackwell芯片进行训练,此举可能违反美国的出口管制规定。

18SZ图片处理

根据该名美国官员说法,DeepSeek可能会试图移除显示其使用美国AI芯片的技术指标,并计划对外声称其模型是使用华为的芯片训练。他补充说,这些Blackwell芯片很可能集中部署于其位于中国内蒙古的数据中心。

该官员还指出,DeepSeek用于训练最新模型的过程,很可能采用了来自美国先进AI公司的「蒸馏」技术,包括利用Anthropic、Google、OpenAI等的AI模型。

18SZ图片处理

报导提到,自DeepSeek于2025年1月横空出世以来,其模型在开源平台Hugging Face上的下载量已超过7500万次,推动了中国开源模型浪潮,并与美国AI实验室展开竞争。在过去一年发布的模型中,中国模型的下载量超过了该平台上其他任何国家的模型。

打赏

上一条:今年MWC首次设立中国展馆 逾350家中企参展位居第三

下一条:中东至国内航线超级油轮运费飙升至纪录新高

  • 0人打赏
    纠错
关闭
同类资讯
热门评论
加载更多……
00