自研AI推理芯片：云天励飞的另一条主线

2025-07-27 21:14:28 来源: 李寿鹏

点击

自2014年成立以来，云天励飞最为人熟知的标签就是“AI”，但却忽略了它的另一重身份“AI芯片公司”

诚然，在过去11年里，云天励飞推动的AI大规模落地应用，也已在消费级、企业级和行业级三大领域取得多项创新成果，公司也因为这些成绩而被人广泛熟知。以公司率先出圈的产品——用于智慧警务领域的“深目”系统为例，在上线之后，立马帮助深圳某区警情下降50%，还创下15小时跨省找回被拐儿童的神话。

但其实隐藏在这背后，是公司对芯片能力的持续耕耘。

云天励飞公司董事长兼CEO陈宁在介绍公司说道：“云天励飞是我在2014年带领一支海归技术团队回到深圳创立的一家中国AI推理芯片企业”。他解析说，在创业这11年里，云天励飞其实有两条主线：一条主线是大家熟悉的基于AI推理芯片的应用场景落地；另一条主线则是以NPU为核心的AI推理芯片的技术演进。

云天励飞CTO李爱军告诉半导体行业观察，从成立伊始，云天励飞就投入到神经网络处理器的自主研发中去。之所以做出这样的考量，是因为公司团队看到，无论是原来的小模型算法还是后来大模型算法，要进行高效的推理，背后的关键就是神经网络处理器。此外自研NPU还能降低 AI 算法计算成本。

于是，这就催生了公司的自研NPU——Nova系列。伴随着这系列NPU的产生，搭载其的SoC也同步亮相。

被忽视的芯片老兵

翻看2014年前后的资料，云天励飞当时还用 NPU 课题申报了政府的人才引进项目，并且获得了第一名，得到了研发资金的支持。由此可见，芯片技术是云天励飞初期获得投资的关键。值得一提的是，在前文谈到的“深目”系统背后，就用了云天励飞基于FPGA实现的首款自主知识产权的神经网络处理器Nova 100，这款处理器应用在云天励飞DeepEye200 PCIe FPGA加速卡及IF BOX边缘计算盒子中，主要用于目标识别与特征提取。

据介绍，当时后台迅速用两台内置云天励飞 NPU 的服务器替代了大量传统的 CPU 服务器。相比于原本需要几十台 CPU 服务器且成本高昂的方案，采用云天励飞基于 FPGA 的两台 Nova100 指令集服务器即可完成后台的人脸检测、人脸抓拍和比对等运行卷积神经网络（CNN）的任务，不仅高效运行，还显著降低了成本。

2018年，搭载云天励飞第二代具有自主知识产权的神经网络处理器Nova 200的芯片正式投片。该芯片为嵌入式前端和边缘计算应用设计，广泛应用于智能相机、警务终端、机器人及工业智能检测等领域，并通过产品销售和IP授权等方式实现市场化应用。

2020年，云天励飞带来了公司的第三代NPU Nova 300。在这一年，公司还做了一个重要的决定，那就是全面转向国产工艺，并成为首家采用国产Chiplet工艺的AI芯片公司。

李爱军表示，在2020年国际局势风云变幻之际，云天励飞有两个选择：一是选择海外晶圆厂的成熟工艺；二是选择国内晶圆厂的先进工艺。从提升芯片性能的角度看，选择先进工艺无疑是最好的选择。但正如李爱军所说，在2020年的这个时间点，国产先进工艺还不太成熟，这带给芯片公司的风险是可想而知的。但云天励飞在权衡了一番之后，决定投身国产先进工艺，与国产先进制造共同成长。

“针对国产工艺相对落后的现状，云天励飞首创用算力积木的架构来克服当时的国产工艺限制和密度限制。”李爱军说。正是因为采用了这种方式，让云天励飞可以在国产工艺上实现单颗128T算力的AI推理芯片。也正是得益于云天励飞对国产制造的支持，本土的先进制程工艺过去几年取得了巨大的进步。

经过几年的投入，2023年，云天励飞终于发布了其使用算力积木架构和本土先进制造工艺的第三代芯片产品DeepEdge10。在这颗芯片中，则集成了云天励飞第四代NPU——Nova 400。

据介绍，该芯片在研发初期便针对大模型时代的推理计算需求进行布局，采用创新的“算力积木”AI芯片架构。通过支持多芯粒扩展的Chiplet 技术以及 C2C Mesh Torus 互连技术，可以将多个 DeepEdge10 标准计算单元像搭积木一样，封装成不同算力的芯片和多芯片互连的可扩展计算系统。

从云天励飞的介绍我们得知，公司已基于Edge10芯片平台开发出Edge10C、Edge10标准版、Edge10Max、Edge200四款芯片。Edge10C和Edge10可应用于智慧安防、智慧城市和智能制造等边缘计算推理领域。Edge10Max能高效支持Transformer模型中的矩阵乘法运算，主要应用于边缘大模型推理领域。

如上所述，这些芯片覆盖了 8T-256T 算力需求，可实现7B、14B、130B、671B 等不同参数量大模型的高效推理，赋能各类智算推理硬件产品。其中，DeepEdge10芯片平台也已成功适配DeepSeek R1系列模型、国产鸿蒙操作系统以及QwQ-32B模型。

未来，云天励飞即将带来了公司第五代NPU——Nova 500。而搭载该NPU的SoC也即将亮相。

聚焦推理，推陈出新

从前面的介绍可以看到。云天励飞是芯片行业当之无愧的老兵。瞄着当前的人工智能发展趋势，公司也在全力以赴。

如陈宁所说，从2012年AlexNet横空出世到2024年间，可以称之为AI的训练时代。在这个阶段，无论是传统云巨头，还是新兴的大模型新贵，都是围绕着数据展开激烈竞争，英伟达GPU毫无疑问是这个阶段的亮点。但到了2025年上半年，DeepSeek一炮而红，一个名为“Agent”的词也频频见诸报端。

以此为标志，陈宁认为，人工智能行业开始跨入AI推理的时代。

“2025年是成为人工智能发展的重要转折点——大模型技术达到新的成熟高度，模型调用成本显著降低，使得AI从‘专家工具’逐步演变为‘全民基础设施’。这不仅标志着AI从训练时代迈入推理时代，也预示着推理算力需求将迎来爆发式增长。”陈宁说。

以此为契机，云天励飞将加大在推理芯片的投入。据介绍，云天励飞未来将会持续通过更新自研指令集架构，使AI芯片能够深入匹配特定应用场景，在指令层面实现更高效的优化。这种深度定制使芯片在性能、功耗与面积之间实现更优权衡，从而以合理成本推动AI芯片广泛落地，真正发挥出场景中的最优效能。

李爱军透露，在下一代芯片，云天励飞将研发第二代“算力积木”，聚焦在新型计算、近存计算、NB Mesh互联、新型封装和NB Link通用扩展性五个方面持续进行创新，目的是为了打造一个新型的大模型推理计算，为从嵌入式到边缘等应用提供推理计算服务。李爱军表示，借助新型计算和近存计算，公司在提升计算效率之余，进一步提升了内存访问。

“来到互联方面，在原来的平面两维的互联架构C2CMesh之上，我们将进一步实现三维互联NBMesh，从而实现更大规模的算力拓展。”李爱军接着说。

具体而言，云天励飞将聚焦边缘计算、云端大模型推理加速，以及具身智能这三个关键场景，全面构建国产高性价比 AI 推理芯片的技术与产品体系。

在边缘计算领域，云天励飞历经十余年产品实践，已积累大量技术Know-how。目前公司在高密度视频智能分析、小规模边缘大模型推理等典型场景，已实现多个示范项目落地，并获得行业头部客户的高度认可。凭借在低功耗、高性能、模块化部署方面的优势，云天励飞的边缘芯片产品正持续拓展其在城市治理、智慧交通等场景的市场应用。

在云端推理加速领域，云天励飞已经推出基于国产工艺打造的推理加速卡，采用“算力积木”架构：通过Chiplet封装多颗中小算力芯粒，实现模块化扩展与任务并行，配合自研软件栈和工具链，在算力调度、成本控制和封装灵活性方面实现突破。该架构不仅支持一次设计、多种封装，也显著提升了芯片的适配效率与产品迭代速度。

在具身智能领域，云天励飞已与十余家机器人厂商建立合作关系，边缘芯片产品应用于服务型机器人已进入实际部署阶段。随着VLA（视觉-语言-动作）大模型的不断演进，3-5年内具身智能将成为机器人产业新的增长引擎。为此，公司也在这一领域进行了战略部署。

“云天励飞致力于成为中国 AI 推理芯片的领军企业，打造面向 AI 大模型时代的关键“加速器”，通过高性价比国产算力，推动人工智能在各类场景中的规模落地与快速发展。”陈宁博士最后强调。

责任编辑：Ace

申请专栏作者

: 半导体行业观察

: 摩尔芯闻

自研AI推理芯片：云天励飞的另一条主线

相关文章

最新新闻

热门文章本日 七天 本月

热门评论

热门搜索

自研AI推理芯片：云天励飞的另一条主线

相关文章

最新新闻

热门文章 本日 七天 本月

热门评论

热门搜索

热门文章本日七天本月