海光的下一仗:把国产算力变成Token生产力
2026-06-11
18:00:34
来源: 杜芹
点击
步入智能体(Agent)时代,AI算力的竞争,正在从谁的芯片参数更高,走向谁能把算力更高效地转化为Token生产力。这也让国产算力产业进入了一个新的评价周期。
5月28日,2026世界智能产业博览会(简称“智博会”)在天津隆重开幕。作为国内高端芯片领域的领军企业,海光信息携全系高端通用处理器(CPU)与协处理器(DCU)产品重磅亮相。在本届盛会上,海光信息全面展示了其从通用计算到AI加速的国产算力底座能力,并与光合组织(先进计算产业创新共同体)的多家生态伙伴一同,深度探讨了在大模型、智能体爆发背景下,国产算力如何从“物理算力指标”向“Token效益”演进的产业新趋势。
Token焦虑背后,是国产算力生态走向成熟的信号
AI时代下,大模型高歌猛进,Agent与端侧应用迎来爆发,行业在享受技术红利的同时,也普遍陷入了“Token焦虑”。
对此,海光信息总裁助理杜夏威给出了理性的判断:
“Token焦虑未必是一件坏事。它的本质是把算力和模型算法之间的度量衡统一了。今天我们能围绕Token去探讨整个人工智能产业的发展,说明产业正在快速流动。要解决这种焦虑,前半程靠拼芯片的基础物理算力,后半程则必须要看‘Token效率’,即如何快捷、高效地将算力转化成用户业务侧可感知的Token吞吐。”
在外界普遍将目光聚焦于高端GPU时,数据中心的基石正在悄然发生变化,CPU正在重回智能化舞台的中心。
杜夏威指出,伴随大模型参数量持续攀升,混合专家模型(MoE)已成为主流架构。在这种场景下,系统不得不将部分键值缓存(KV Cache)、算力或模型“卸载”(Offload)到主机的CPU端。因此,CPU的价值正在从传统通用计算,延展到AI时代的系统调度、数据承载、业务整合和端侧智能入口。它不仅保障数据中心中昂贵AI算力的高效发挥,也在支撑AI能力向更广泛场景扩散。在数据中心端,围绕CPU和GPU(DCU)构建紧密耦合的系统化设计,已成为必然趋势。
除了数据中心调度,AI终端、AI工作站等端侧设备正在快速放量。高端用户与个人开发者出于对私域数据安全和深度的业务集成的需求,需要私有化落地的算力方案。基于海光CPU的终端设备,能让用户在确保数据资产安全的前提下,快捷地将原有历史数据沉淀为自身的知识库(Skill)。
筑牢国产供应链:从高端服务器到边端嵌入式
如果说数据中心主导的训练是AI大戏的开场,那么边缘端则是决定AI能走多深、影响多广的下半场。面对不同体量企业的集群与算力需求,海光信息通过“开放计算架构推动私有化落地”与“依托光合组织算力网络提供云上算力”两种模式,实现了对市场的全面覆盖。
光合组织嵌入式产品专家张考华表示,面对突飞猛进的边端算力需求,海光信息及时的将技术下移,推出了面向工控与半嵌入式领域的X86(C86)自主芯片:
“过去国产工控芯片常被贴上‘可用不好用’的思维惯性标签。海光这款芯片继承了成熟的X86技术路线,不仅具备内生安全,更在设计上做了宽温、耐恶劣环境等工业特性的深度安排。我们有信心让它在市场上打破传统印象,实现就地计算,解决‘算力上天’或边缘侧Token引流的实时性痛点。”
目前,海光该系列芯片已在多个国内实际案例中成功应用,获得了极高的市场反响,用真正的市场检验打破了传统偏见。同时,在边缘侧引入海光CPU与DCU的成熟算力分配方案,能够实现Token引流与就地计算,大幅缓解向云端传输的数据通道压力,满足边缘AI高实时性的需求。
生态共赢:光合组织搭建算力“中央厨房”
算力生态的建设不是单打独斗。在杜夏威看来,算力到Token的转化并不是单颗芯片可以独立完成的事情。它需要芯片、系统、软件平台、模型厂商、ISV、行业应用伙伴共同完成。海光一方面持续提升CPU与DCU产品能力,另一方面也通过开放算力底座和光合组织推动生态协同,使国产算力从能跑模型进一步走向能支撑业务。
在海光开放算力底座的支撑下,光合组织的生态伙伴们在实际业务中感受到了翻天覆地的变化。展会现场,多家核心伙伴分享了基于海光双芯部署的实际体验:
旷视科技常豪鑫表示,加入光合组织后,最大的变化是研发状态更加“聚焦”。以往旷视需要全链条适配,花费大量精力做底层算法适配、算子调优和工具链开发。如今,海光DCU具备强大的硬件兼容性,让企业可以把全部带宽放在智能体、智能助手等核心场景上。常豪鑫打了个生动的比喻:“以前每一个环节都是处理‘原材料’,现在光合组织就像一个‘中央厨房’,上下游模块化拉通,直接量产出‘预制菜’,帮助我们面向2B行业客户做快速落地。”
麒麟信安孙玉峰用“无感、高效、增值”三个词形容与海光的协同感。他透露,以前做方案适配和调试通常需要2至3周,而光合组织的开放算力Token谱系将中心调度、操作系统、项目应用全线拉通,使芯片到业务线上的周期大幅压缩到1周以内,显著提升了Token的交付效益。
云宏信息葛玉龙指出,如果底层芯片存在技术壁垒,多芯调度间的Token损耗可能高达30%。而光合组织的开放算力图谱打通了多芯调度的底层,云宏的虚拟化平台可在不同芯片间无缝切换,将损耗降到最低。葛玉龙强调:“未来国产算力生态不需要再用‘国产替代’这个词,因为国产化本身就是最好的选择。”
南大通用陈明智表示,依托海光芯片的性能优化,南大通用数据库在金融等重点行业的项目POC(概念验证)阶段胜出率显著提升。在光合组织谱系内,上下游接口统一,使得方案设计、安装测试到交付的国产化链条顺畅无阻。
展望未来:从国产替代走向高质量发展
面对未来,中国智能产业广阔的应用市场和深度的行业需求,正是国产算力向前迭代的最初始原动力。
杜夏威表示,海光最大的优势在于始终紧跟市场需求,软件栈与硬件产品双向迭代。下一步,海光将继续健全算力生态覆盖面,释放更多正面信号,帮助千行百业原有的业务实现“Token化”转型。
正如云宏信息葛玉龙在展望中所言:“我们期待未来的国产算力生态不需要再用‘国产替代’这个词。不是因为需求消失了,而是因为国产化本身就是最好的选择。从好用到高效,从高效到划算,这才是Token经济下算力的真正主赛道。”
通过本次智博会,海光信息不仅亮出了全系算力底座的肌肉,更通过开放的胸怀与协同的生态,联合光合组织伙伴共同绘制了一幅从中心到边缘、从可用到好用的中国智能产业新蓝图。
5月28日,2026世界智能产业博览会(简称“智博会”)在天津隆重开幕。作为国内高端芯片领域的领军企业,海光信息携全系高端通用处理器(CPU)与协处理器(DCU)产品重磅亮相。在本届盛会上,海光信息全面展示了其从通用计算到AI加速的国产算力底座能力,并与光合组织(先进计算产业创新共同体)的多家生态伙伴一同,深度探讨了在大模型、智能体爆发背景下,国产算力如何从“物理算力指标”向“Token效益”演进的产业新趋势。
Token焦虑背后,是国产算力生态走向成熟的信号
AI时代下,大模型高歌猛进,Agent与端侧应用迎来爆发,行业在享受技术红利的同时,也普遍陷入了“Token焦虑”。
对此,海光信息总裁助理杜夏威给出了理性的判断:
“Token焦虑未必是一件坏事。它的本质是把算力和模型算法之间的度量衡统一了。今天我们能围绕Token去探讨整个人工智能产业的发展,说明产业正在快速流动。要解决这种焦虑,前半程靠拼芯片的基础物理算力,后半程则必须要看‘Token效率’,即如何快捷、高效地将算力转化成用户业务侧可感知的Token吞吐。”
在外界普遍将目光聚焦于高端GPU时,数据中心的基石正在悄然发生变化,CPU正在重回智能化舞台的中心。
杜夏威指出,伴随大模型参数量持续攀升,混合专家模型(MoE)已成为主流架构。在这种场景下,系统不得不将部分键值缓存(KV Cache)、算力或模型“卸载”(Offload)到主机的CPU端。因此,CPU的价值正在从传统通用计算,延展到AI时代的系统调度、数据承载、业务整合和端侧智能入口。它不仅保障数据中心中昂贵AI算力的高效发挥,也在支撑AI能力向更广泛场景扩散。在数据中心端,围绕CPU和GPU(DCU)构建紧密耦合的系统化设计,已成为必然趋势。
除了数据中心调度,AI终端、AI工作站等端侧设备正在快速放量。高端用户与个人开发者出于对私域数据安全和深度的业务集成的需求,需要私有化落地的算力方案。基于海光CPU的终端设备,能让用户在确保数据资产安全的前提下,快捷地将原有历史数据沉淀为自身的知识库(Skill)。
筑牢国产供应链:从高端服务器到边端嵌入式
如果说数据中心主导的训练是AI大戏的开场,那么边缘端则是决定AI能走多深、影响多广的下半场。面对不同体量企业的集群与算力需求,海光信息通过“开放计算架构推动私有化落地”与“依托光合组织算力网络提供云上算力”两种模式,实现了对市场的全面覆盖。
光合组织嵌入式产品专家张考华表示,面对突飞猛进的边端算力需求,海光信息及时的将技术下移,推出了面向工控与半嵌入式领域的X86(C86)自主芯片:
“过去国产工控芯片常被贴上‘可用不好用’的思维惯性标签。海光这款芯片继承了成熟的X86技术路线,不仅具备内生安全,更在设计上做了宽温、耐恶劣环境等工业特性的深度安排。我们有信心让它在市场上打破传统印象,实现就地计算,解决‘算力上天’或边缘侧Token引流的实时性痛点。”
目前,海光该系列芯片已在多个国内实际案例中成功应用,获得了极高的市场反响,用真正的市场检验打破了传统偏见。同时,在边缘侧引入海光CPU与DCU的成熟算力分配方案,能够实现Token引流与就地计算,大幅缓解向云端传输的数据通道压力,满足边缘AI高实时性的需求。
生态共赢:光合组织搭建算力“中央厨房”
算力生态的建设不是单打独斗。在杜夏威看来,算力到Token的转化并不是单颗芯片可以独立完成的事情。它需要芯片、系统、软件平台、模型厂商、ISV、行业应用伙伴共同完成。海光一方面持续提升CPU与DCU产品能力,另一方面也通过开放算力底座和光合组织推动生态协同,使国产算力从能跑模型进一步走向能支撑业务。
在海光开放算力底座的支撑下,光合组织的生态伙伴们在实际业务中感受到了翻天覆地的变化。展会现场,多家核心伙伴分享了基于海光双芯部署的实际体验:
旷视科技常豪鑫表示,加入光合组织后,最大的变化是研发状态更加“聚焦”。以往旷视需要全链条适配,花费大量精力做底层算法适配、算子调优和工具链开发。如今,海光DCU具备强大的硬件兼容性,让企业可以把全部带宽放在智能体、智能助手等核心场景上。常豪鑫打了个生动的比喻:“以前每一个环节都是处理‘原材料’,现在光合组织就像一个‘中央厨房’,上下游模块化拉通,直接量产出‘预制菜’,帮助我们面向2B行业客户做快速落地。”
麒麟信安孙玉峰用“无感、高效、增值”三个词形容与海光的协同感。他透露,以前做方案适配和调试通常需要2至3周,而光合组织的开放算力Token谱系将中心调度、操作系统、项目应用全线拉通,使芯片到业务线上的周期大幅压缩到1周以内,显著提升了Token的交付效益。
云宏信息葛玉龙指出,如果底层芯片存在技术壁垒,多芯调度间的Token损耗可能高达30%。而光合组织的开放算力图谱打通了多芯调度的底层,云宏的虚拟化平台可在不同芯片间无缝切换,将损耗降到最低。葛玉龙强调:“未来国产算力生态不需要再用‘国产替代’这个词,因为国产化本身就是最好的选择。”
南大通用陈明智表示,依托海光芯片的性能优化,南大通用数据库在金融等重点行业的项目POC(概念验证)阶段胜出率显著提升。在光合组织谱系内,上下游接口统一,使得方案设计、安装测试到交付的国产化链条顺畅无阻。
展望未来:从国产替代走向高质量发展
面对未来,中国智能产业广阔的应用市场和深度的行业需求,正是国产算力向前迭代的最初始原动力。
杜夏威表示,海光最大的优势在于始终紧跟市场需求,软件栈与硬件产品双向迭代。下一步,海光将继续健全算力生态覆盖面,释放更多正面信号,帮助千行百业原有的业务实现“Token化”转型。
正如云宏信息葛玉龙在展望中所言:“我们期待未来的国产算力生态不需要再用‘国产替代’这个词。不是因为需求消失了,而是因为国产化本身就是最好的选择。从好用到高效,从高效到划算,这才是Token经济下算力的真正主赛道。”
通过本次智博会,海光信息不仅亮出了全系算力底座的肌肉,更通过开放的胸怀与协同的生态,联合光合组织伙伴共同绘制了一幅从中心到边缘、从可用到好用的中国智能产业新蓝图。
责任编辑:duqin
相关文章
-
- 半导体行业观察
-
- 摩尔芯闻