“中国版CoreWeave”崛起
2026-06-03
10:23:08
来源: 互联网
点击
2026年,AI原生应用与Agent智能体的全面爆发,将 AI 产业推向了“Token 吞吐量”的军备竞赛。据国家数据局统计,截至2026年3月,中国日均Token调用量已突破140万亿,两年间增长超千倍。当Token成为衡量AI产业价值的核心指标,一场围绕“如何高效、稳定地生产Token”的产业变革正在全球范围内展开。

Token,正在成为AI时代的新产能指标
今年3月,在英伟达年度GTC大会上,黄仁勋提出了“token工厂”概念,他将Token比作数字经济时代的“硬通货”——在既定的电力和空间约束下,算力中心产出Token的速度和质量,将直接决定科技企业的竞争力。
这一判断正在得到产业数据的验证。
智谱华章CEO张鹏在2026中关村论坛上坦言:“由于任务复杂度的提升,完成一个任务的调用量可能是简单问答的十倍甚至百倍,这让算力成为制约行业发展的瓶颈。”他还用更直白的话说:“当模型足够强,API本身就是最好的商业模式。”大模型时代,随着智能体等新技术爆发,Token用量将迎来十倍甚至百倍增长,这对算力基础设施提出了全新的考验。张鹏作为中国头部大模型企业的掌舵人,其表态更能体现行业一线对AI基础设施即将爆发的紧迫感。
与此同时,中美两国之间的差距也在快速收窄。粤开证券首席经济学家、研究院院长罗志恒指出,尽管美国在尖端AI大模型性能上仍保持领先,但这一优势正在被中国迅速追赶。据人工智能研究公司Epoch AI测试,截至2026年1月,美国先进大语言模型的性能仅领先中国约7个月;而美国白宫AI负责人更是预估,这一差距可能仅有3至6个月,“是一场非常接近的竞赛”。
当模型能力差距逐渐缩小,AI产业竞争的焦点将越来越多地转向基础设施层面。谁能在同样的电力、同样的机柜空间、同样的芯片资源下,更快、更便宜、更稳定地生产出更多高质量Token,谁就有可能掌握智能经济时代的主动权。
正如黄仁勋所言,AI工厂正在生成一种前所未有的新商品——Token。而围绕Token产能、Token成本和Token效率展开的基础设施竞争,正在成为全球AI产业的新战场。
国产算力破局,关键在“芯模共进”
随着Token调用量的爆炸式增长,加速暴露出了国内传统算力供给模式的深层矛盾:一方面,高端GPU受出口管制影响供给持续紧张;另一方面,国产AI芯片虽在加速补位,却因底层生态不完善、框架适配差、工程优化经验匮乏,让众多企业陷入了“买得到”却“用不好”的尴尬。
业内人士指出,当Token调用量呈千倍增长时,单纯堆砌GPU数量已无法满足成本和效率要求。必须用系统级思维重构推理基础设施,从每瓦特Token吞吐量、单位Token成本等更精细的维度重新定义竞争力。
在此背景下,“芯模共进”成为2026年国产算力破局的关键词。
长江证券分析师宗建树指出:“国产算力已从单纯追求算力规模,转向‘芯片—模型—系统’协同优化阶段。芯片与模型的深度适配已成为2026年国产算力破局的关键,‘芯模共进’的新周期已经开启。”
所谓“芯模共进”,本质是是以应用层的模型训练与推理需求反向驱动芯片迭代,在摊薄研发成本的同时持续提升性能,形成需求牵引技术、技术释放需求的正向循环。这意味着,破局的核心不再局限于芯片制程的单点追赶,而在于“芯-云-模型-推理”全栈协同效率的系统级比拼,这直接决定了AI商业化落地的速度。
政策层面也在加码。国家发改委政策研究室副主任、新闻发言人李超此前在新闻发布会上宣布,发改委正在指导国产大模型加大力度适配国产算力芯片,并指出将加快“人工智能+”落地配套文件、推动央国企开放高价值应用场景等多重增量政策信号。业内人士指出,此次表态将“模型层与芯片层的深度适配”提升至国家级战略高度,为国产算力产业链打开了明确的政策确定性空间。
打造中国版CoreWeave:“超智融合”的技术突围
在全球AI云基础设施赛道,美国CoreWeave以其GPU云服务商的定位异军突起,成为独立第三方算力巨头的标杆。它的价值并不只是提供GPU资源,而是围绕大模型训练与推理需求,构建了一套面向AI时代的新型云基础设施能力。
而在中国,源自清华系、依托有国家级算力中心工程经验的科研团队组建的是石科技(Meta-Stone),正以独特的“HPC+AI”超智融合技术路径,加速构建中国自主可控的国产GPU云生态。
但中国版CoreWeave不能只是对海外GPU云模式的简单复制。
在国产AI芯片路线更加多元、软件生态尚未完全成熟、大模型应用加速落地的背景下,中国市场真正需要的,不只是一个提供算力资源的平台,而是一个能够把分散、异构、复杂的国产算力,转化为企业可用、好用、稳定可控Token产能的新型AI基础设施。
从这个意义上看,是石科技真正要补上的并不是一朵国产GPU云,而是国产算力从芯片供给走向规模化AI推理落地之间最关键的工程化中间层。
与传统的通用公有云不同,是石科技专注于垂直领域的AI基础设施(AI Infra),核心使命在于解决大模型应用与底层国产芯片之间的适配难题。通过算子级优化、内存管理、Continuous Batching等HPC级推理优化技术,结合对华为昇腾、昆仑芯、天数智芯、太初、瀚博等主流国产芯片的深度适配,是石科技将“好用的异构算力”转化为企业可用的标准化Token生产能力。
根据Gartner则预测,到2028年,超过60%的企业AI推理工作负载将运行在标准化的Token生产平台上,而非直接采购裸算力。这意味着,未来企业购买的将不再只是“卡”或“裸算力”,而是更接近工业化生产逻辑的Token产能。
行业专家评价称,是石科技的核心价值在于填补了国产AI推理产业的生态空白。作为独立第三方国产GPU云,其不绑定单一硬件、不局限单一生态的中立属性,能够最大化兼容各类国产模型与国产芯片;而HPC级优化能力与全链路合规保障,则有效解决了国产算力“落地难、效能低、不稳定”的行业痛点。
结语
面对日均 140 万亿次且还在暴增的Token调用海啸,国产算力的突围,绝无法寄希望于某一颗孤立的芯片,或某一家垄断的公有云。它需要的是一个更加开放、中立、兼容、可持续优化的基础设施层。
这正是独立第三方国产 GPU 云平台的战略价值所在。在这场全球AI基础设施的重构浪潮中,类似是石科技这样以“芯模共进”为引擎、以“超智融合”为路径的中国力量,正加速凿通国产芯片与原生应用之间的天堑,实现国产算力体系从追赶到并跑的跨越。
责任编辑:SemiInsights
相关文章
-
- 半导体行业观察
-
- 摩尔芯闻