AI Agent爆发前夜:“内生安全”迎来奇点时刻!

2026-04-07 18:17:03 来源: 杜芹
点击
如果你最近安装了龙虾,可能会有一种越来越明显的感觉——它们不只是跟你简单的回答,而是在开始替你做事。写代码、跑流程、调接口、甚至帮你管理项目,一个“AI员工”的雏形,已经逐渐清晰。
 
然而,当 AI 拥有了“行动力”,信任危机也随之而来。
 
“在人工智能算力需求呈指数级增长的今天,安全不再是锦上添花,而是决定AI能否落地、能否可信的生命线。”海光信息副总裁应志伟指出,海光正以CPU与AI芯片双赛道的饱和投入,试图在未来两三年内构建起一个完全自主、安全可信的数字底座。


 
AI时代,安全愈发重要
 
过去三十年,信息安全的演进史几乎是一部血泪史。从海湾战争中瘫痪指挥系统的打印机芯片病毒,到微软的“黑屏”事件,再到近年来频繁爆发的硬件管理引擎漏洞。历史反复证明:安全如果不是生长在骨子里,就永远是别人的“后门”。
 
进入2026年,AI安全形势发生了根本性变化。随着大模型训练规模不断扩大,算力需求呈指数级增长,内存价格在短时间内大幅攀升,背后是AI对硬件资源的极致消耗;与此同时,传统基于边界的安全模型正在快速失效,系统的攻击面被无限放大。
 
以近期备受瞩目的智能体(Agent)“小龙虾”为例,它不同于功能固定的传统软件,而是能够自主调用工具、动态进化。这种“自我意识”的萌芽,使得传统的防火墙和权限管控在它面前如同虚设。应志伟指出,这种新型威胁远超木马——木马的能力是设计者预设的,而智能体的能力是动态扩展的。
 
此外,供应链后门、模型投毒、算力劫持、数据泄露、提示词注入攻击等新型风险层出不穷。借助AI,安全研究人员一夜间可发现数十个漏洞,攻击效率被放大到前所未有的程度。
 
“在AI时代,安全是入场券,更是生命线。”应志伟表示。
 
为什么安全必须“下沉到芯片”?
 
传统的软件加密运行在操作系统之上,而操作系统是可以被重装、篡改的。在云计算环境中,管理员或黑客一旦获得权限,内存中的明文数据便一览无余。
 
在海光看来,唯有“芯片内生安全”——将安全机制固化在硅片之上,才能实现真正的不可篡改。海光作为国内最早大规模投入底层安全技术的芯片厂商,旗下双芯产品(CPU+DCU)全系原生支持密码技术、机密计算、可信计算、漏洞防御等高端安全技术,已在金融、政企、互联网等多家头部客户实现规模化落地。
 
海光的路径,是将安全能力直接嵌入CPU和AI芯片内部,形成所谓的“内生安全体系”,其核心逻辑是:将信任从软件迁移到不可篡改的硬件层。
 
它主要包括几个关键能力:
 
l 安全启动:从CPU启动的第一条指令开始固化,不可篡改,并逐级度量BIOS、操作系统等任何环节,一旦发现被篡改即停止运行。
 
l 可信密钥管理:密钥存放在CPU硬件内部,永不暴露给内存或软件。海光芯片内嵌式密码模块已通过国家商用密码产品二级认证,相当于在CPU中集成了一张国家认证的密码卡。
 
l 机密计算:解决“运行时加密”难题。即使在云环境中,数据在内存中也是加密的,云厂商、管理员、恶意租户都无法看到明文。海光的CSV机密计算技术已发展至3.0版本,增加了完整性保护,防止攻击者破坏虚拟机。
 
其中,机密计算尤为关键。海光CSV3.0不仅实现数据加密,还引入完整性保护机制,能够防止虚拟机层面的篡改攻击。
 
如果说传统安全是“在房子上加锁”,那么这种内生安全体系,更接近于将核心资产直接封存在一个外界无法触达的安全空间之中。
 
目前,海光CPU在全球范围内对可信计算的支持最为完善,涵盖TPCM(可信计算3.0)、TCM 2.0、TPM 2.0等国际和国内标准,并实现安全启动和动态度量。
 
机密计算方面,海光经过多代CPU持续增强,提供了完整的解决方案:计算隔离、启动度量、远程认证、磁盘加密、密钥封印等。特别针对AI场景,海光推出了AI机密计算解决方案,通过CPU与DCU的高速互联,将两者融合为同一个安全域,确保大模型从静态存储、加载、训练到推理的全过程加密,模型权重和推理数据均不暴露明文。
 
面向未来的密码体系:从国密到抗量子
 
在硬件安全之上,密码体系成为第二层关键支撑。海光CPU已全面支持国密算法(如SM2、SM3和SM4),并集成高性能密码协处理器,使加密与解密过程在硬件层完成,从而在保障安全性的同时兼顾性能。
 
更具前瞻性的是其在抗量子密码方向的布局。
 
随着量子计算的发展,现有基于RSA、ECC等算法的非对称加密体系,可能在未来被快速破解,这意味着今天产生的数据,可能在未来被“回溯解密”。也正因此,行业提出“先存密文、后解密”的威胁模型。
 
海光已提前两年布局抗量子密码算法,并规划多套标准体系,目标是在量子计算真正到来之前,完成密码体系的升级,为金融、外交等高安全需求场景提供保障。
 
算力进化:在有限资源下追求极致效率
 
在外部环境依然严峻的背景下,光合组织人工智能专委会副主任胡辰分享了关于国产算力栈的“深水区”突破。
 
面对万亿参数模型和MoE(混合专家模型)架构的挑战,刚刚发布的海光DCU软件栈年度版本在三个维度实现了跃迁:
 
l 全栈生态,支持更快迁移:依托海光DCU通用架构与全精度优势,DTK 26.04(异构计算平台)以完整成熟的计算库覆盖训练、推理、AI4S等全场景,为下一代万亿大模型提供完整的软件生态支撑。

l 多重优化,实现更高性能:DAS 1.8(人工智能基础软件系统)集成超2000个算子,支持Pytorch、TensorFlow、vLLM、SGLang等100+主流AI框架组件。在数万张海光DCU组成的算力集群上,海光团队通过算子调优、编译优化、通算融合等多重技术,已初步完成10万亿模型参数的稳定运行,MLPerf等多项测试达到国际领先水平。

l 应用落地,激发创新潜力:DAP(人工智能应用平台)内置知识库引擎、智能体编排引擎等高阶模块,搭配OpenDAS开源拓展套件与光源模型仓库,面向OEM、伙伴、客户深度开放,可便捷集成到主流AI平台,推动OpenClaw等各类AI应用落地。
 
胡辰指出,国外算力充裕往往导致其忽视优化,而国内在有限算力下的“饱和式研发”,反而催生了在算法效率和软硬耦合上的独特优势。DeepSeek等本土模型的崛起,正是这一路径可行性的最佳佐证。
 
结语
 
2026年,AI员工正从辅助角色走向办公协作的核心,Token的消耗量呈现爆发式增长。应志伟表示:“希望未来,我们不仅拥有海量的Token,而且是机密Token。用户可以放心地使用AI,不必担心隐私被获取。只有那时,人工智能才会真正被信任。”
 
当人工智能不仅拥有强大的灵魂(算法),更拥有坚实的盔甲(硬件内生安全),一个真正让人放心的AI时代才算真正开启。
责任编辑:duqin

相关文章

半导体行业观察
摩尔芯闻

热门评论