中国大芯片赛道,又跑出一个赢家

2026-01-04 18:32:24 来源: 编辑部
在近年这波人工智能热潮背后,英伟达成为当之无愧的大赢家。能获得这样的表现,一方面固然得益于大家熟知的GPU。除此以外,英伟达早几年斥资69亿美元收购Mellanox所获得的网络技术和产品加持,也是他们能走到今天的另一个可靠保障。财务数据显示,2025年第三季度,英伟达的网络收入同比增长162%至 82 亿美元,远超收购Mellanox所付出的代价。

由此可见,除了熟悉的算力和存力以外,网络也在人工智能时代扮演越来越重要的角色。正因如此,过去几年不少传统巨头和新贵都围绕着AI数据中心的上述领域展开了激烈角逐。也有不少“大芯片”企业在激烈的竞争中纷纷折戟。
然而,总有些企业凭借其优秀的团队和拔尖的技术成功突围,半导体行业观察在四年前关注过的云豹智能,就是其中一个典型。
 
AI时代,DPU的变与不变
 
如果将时钟拔回2020年前后,我们发现,当时除了GPU和CPU以外,新兴的芯片赛道DPU也非常热门。从当时的产业现状看来,这是发展的必然。
 
虽然当时大模型还没有大红大紫,但正如半导体行业观察在当时的文章《二十年磨一剑,中国半导体迎来又一颗超新星》中所说,云计算的高速发展,人工智能模型训练参数越来越大,让数据中心的系统规模越来越大且越来越复杂,各种芯片处理的任务越来越繁重,这时候就需要一个DPU分担原本由CPU承担的网络、卸载、安全、存储等任务。
 
英伟达创始人黄仁勋在2020年的GTC大会演讲中也表示:“数据中心已成为新的计算单元。DPU 是现代化、安全且加速的数据中心的关键组成部分,它将 CPU、GPU 和 DPU 集成到一个完全可编程、支持 AI 的单一计算单元中,能够提供前所未有的安全性和计算能力。”
 
现在回头看,当时2021年的文章中写的很多东西都一一应验了。但对DPU而言,随着ChatGPT在一年后横空出世进而引爆全球“军备竞赛”后,DPU被赋予了更多的含义。
 
还是以英伟达为例。如上所述,在2021年的时候,AI还没正式上牌桌,云计算还是当时的主流。但随后几年,人工智能推动系统急速扩张。于是,在摩尔定律放缓,Scaling Law大行其道的当下,所有人都在大力砸钱搞芯片、搞超节点、搞集群。这就引出一个问题,如何让分布在不同机架、节点间的硬件系统表现得更像一个整体。
 
这时候,DPU又能扮演一个重要的角色。
 
资料显示,在打造基于H100的AI Infra的时候,英伟达就曾经使用其BlueField-3 DPU去做网络支撑。在发布BlueField-4 的时候,英伟达也直言,凭借软件定义加速技术,该产品在 AI 数据存储、网络和安全领域实现全面赋能,将数据中心转型为安全、智能的 AI 基础设施,旨在加速每个 AI 工厂中的每项工作负载。
 
本土大模型新贵DeepSeek在新近一篇名为《Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures》的论文中页对DPU的发展分享了他们的看法。
 
通读全文,DeepSeek是希望从硬件架构和模型设计的双重角度出发,探讨如何实现大规模训练和推理的成本效益。文中,他们还特别强调了DPU在AI基础设施中的关键作用。他们在文中明确提出,集成通信协处理器的DPU有望成为下一代AI硬件的重要构想。
 
“为了最大限度地提高在线推理的吞吐量,我们完全通过 NIC RDMA 执行 EP all-to-all通信,从而避免 SM 资源争用并提高计算效率。这凸显了 RDMA 异步通信模型在计算和通信重叠方面的优势。”DeepSeek研究人员在论文中写道。
 
换而言之,DPU正在通过卸载GPU的计算负担、优化数据预处理、加速通信和存储任务,逐渐成为大模型训练和推理的重要助力。这正如DPU之前需要卸载CPU的功能一样。
 
可以肯定是,DPU在AI Infra中会越来越重要。但有一点我们需要注意的是,和GPU一样,国内这个市场依然是英伟达主导,国内互联网厂商及运营商大多采用英伟达的网卡,其在国内中高端网卡市场的份额更是超过80%。在通算CPU服务器市场,目前国内大部分用的DPU网卡也都是用美商的FPGA芯片。
 
在全球这种竞争态势下,打造本土的DPU,就显得尤为重要,我们看到,过去几年云豹智能也正在朝这个目标奋斗。
 
云豹智能,成功突围
 
笔者曾与云豹智能创始人兼CEO萧启阳博士做过深入交流,在公司成立之初,萧博士就信心十足,之所以有这样的底气,与他丰富且成功的过往经历有着莫大的关系。
 
无论是从24岁获取美国斯坦福博士学位、出任MIT教授,还是创立芯片公司,或是被巨头博通以37亿美元收购从而转任职业经理人,萧启阳博士在大芯片、人工智能、网络与分布式计算领域都有着深厚的造诣和显著的成就,成为国内为数不多涉足过DPU的创始人。在招募行业各领域专家二度创业以后,萧启阳博士领导的云豹智能也获得了腾讯、中芯聚源、深创投、同创伟业、东方富海、基石资本、IDG资本等产业资本和头部投资机构的认可,这使得他们在发展中如虎添翼。
 
在腾讯和中移动等客户的应用场景支持下,云豹智能一直在打磨升级产品,在这条赛道一骑绝尘。据了解,云豹智能在成立两年多后便一次性流片成功这种架构复杂的大芯片,不用修改一个晶体管就能让客户量产。作为一家初创企业能获得这样的成绩,足以见证他们的实力。在发展期间,云豹智能在DPU的可编程高性能网络处理技术、可编程低时延RDMA技术、DDP(Data Direct Path)数据直通技术和安全计算体系等多个关键领域掌握并引领着多项核心技术。
 
得益于这些积累,云豹智能已成功量产国内首颗400Gbps 吞吐量的DPU芯片, 达到全球顶尖水平。该芯片拥有每秒处理几百万个数据包的存储能力,远程直接存取数据(RDMA)的时延低至5微秒。与其他传统DPU方案相比,性能效率可提升4倍,同时,该芯片还具有低功耗、低成本特性。

 
伴随着这颗芯片的面世,云豹智能让中国有了可以与英伟达掰手腕的DPU,也让公司成为国内唯一能替代英伟达网卡的企业。
 
正因为表现如此出色,云豹智能系列芯片产品获得工信部的推荐,入选国家博物馆在12月29日举办的中国制造“十四五”成就展。值得一提的是,云豹智能是本次三大获邀的芯片企业之一,也是唯一获得这个殊荣的DPU厂商,这足以证明云豹智能的影响力和在国产大芯片中的地位。

云豹智能创始人兼CEO萧启阳参加中国制造“十四五”成就展
 
据我们获悉,云豹智能明年还会推出一款800Gbps的网卡产品,对标英伟达的CX8网卡。
 
写在最后
 
如文章开头所说,除了DPU以外,GPU、NPU和CPU等大芯片也是过去几年国内芯片产业的工作重点。虽然屡经波折,但无论哪个赛道,都终于迎来了收获季。无论是此前以海光、龙芯为代表的CPU,还是以寒武纪、摩尔线程、沐曦、天数智芯和壁仞为代表的GPU或AI算力芯片,都纷纷IPO,这除了证明国内在这些领域取得了突破性进展外,还为本土大芯片进一步增加了更多的筹码。
 
正如四年前所关注,半导体行业观察正在见证一颗超新星的崛起,云豹智能,有望成为“中国DPU第一股”。
责任编辑:Ace

相关文章

半导体行业观察
摩尔芯闻

热门评论