首页 > 半导体 > 正文

“中国版CoreWeave”崛起

2026-06-03 10:23:08 来源: 互联网

点击

2026年，AI原生应用与Agent智能体的全面爆发，将 AI 产业推向了“Token 吞吐量”的军备竞赛。据国家数据局统计，截至2026年3月，中国日均Token调用量已突破140万亿，两年间增长超千倍。当Token成为衡量AI产业价值的核心指标，一场围绕“如何高效、稳定地生产Token”的产业变革正在全球范围内展开。

Token，正在成为AI时代的新产能指标

今年3月，在英伟达年度GTC大会上，黄仁勋提出了“token工厂”概念，他将Token比作数字经济时代的“硬通货”——在既定的电力和空间约束下，算力中心产出Token的速度和质量，将直接决定科技企业的竞争力。

这一判断正在得到产业数据的验证。

智谱华章CEO张鹏在2026中关村论坛上坦言：“由于任务复杂度的提升，完成一个任务的调用量可能是简单问答的十倍甚至百倍，这让算力成为制约行业发展的瓶颈。”他还用更直白的话说：“当模型足够强，API本身就是最好的商业模式。”大模型时代，随着智能体等新技术爆发，Token用量将迎来十倍甚至百倍增长，这对算力基础设施提出了全新的考验。张鹏作为中国头部大模型企业的掌舵人，其表态更能体现行业一线对AI基础设施即将爆发的紧迫感。

与此同时，中美两国之间的差距也在快速收窄。粤开证券首席经济学家、研究院院长罗志恒指出，尽管美国在尖端AI大模型性能上仍保持领先，但这一优势正在被中国迅速追赶。据人工智能研究公司Epoch AI测试，截至2026年1月，美国先进大语言模型的性能仅领先中国约7个月；而美国白宫AI负责人更是预估，这一差距可能仅有3至6个月，“是一场非常接近的竞赛”。

当模型能力差距逐渐缩小，AI产业竞争的焦点将越来越多地转向基础设施层面。谁能在同样的电力、同样的机柜空间、同样的芯片资源下，更快、更便宜、更稳定地生产出更多高质量Token，谁就有可能掌握智能经济时代的主动权。

正如黄仁勋所言，AI工厂正在生成一种前所未有的新商品——Token。而围绕Token产能、Token成本和Token效率展开的基础设施竞争，正在成为全球AI产业的新战场。

国产算力破局，关键在“芯模共进”

随着Token调用量的爆炸式增长，加速暴露出了国内传统算力供给模式的深层矛盾：一方面，高端GPU受出口管制影响供给持续紧张；另一方面，国产AI芯片虽在加速补位，却因底层生态不完善、框架适配差、工程优化经验匮乏，让众多企业陷入了“买得到”却“用不好”的尴尬。

业内人士指出，当Token调用量呈千倍增长时，单纯堆砌GPU数量已无法满足成本和效率要求。必须用系统级思维重构推理基础设施，从每瓦特Token吞吐量、单位Token成本等更精细的维度重新定义竞争力。

在此背景下，“芯模共进”成为2026年国产算力破局的关键词。

长江证券分析师宗建树指出：“国产算力已从单纯追求算力规模，转向‘芯片—模型—系统’协同优化阶段。芯片与模型的深度适配已成为2026年国产算力破局的关键，‘芯模共进’的新周期已经开启。”

所谓“芯模共进”，本质是是以应用层的模型训练与推理需求反向驱动芯片迭代，在摊薄研发成本的同时持续提升性能，形成需求牵引技术、技术释放需求的正向循环。这意味着，破局的核心不再局限于芯片制程的单点追赶，而在于“芯-云-模型-推理”全栈协同效率的系统级比拼，这直接决定了AI商业化落地的速度。

政策层面也在加码。国家发改委政策研究室副主任、新闻发言人李超此前在新闻发布会上宣布，发改委正在指导国产大模型加大力度适配国产算力芯片，并指出将加快“人工智能+”落地配套文件、推动央国企开放高价值应用场景等多重增量政策信号。业内人士指出，此次表态将“模型层与芯片层的深度适配”提升至国家级战略高度，为国产算力产业链打开了明确的政策确定性空间。

打造中国版CoreWeave：“超智融合”的技术突围

在全球AI云基础设施赛道，美国CoreWeave以其GPU云服务商的定位异军突起，成为独立第三方算力巨头的标杆。它的价值并不只是提供GPU资源，而是围绕大模型训练与推理需求，构建了一套面向AI时代的新型云基础设施能力。

而在中国，源自清华系、依托有国家级算力中心工程经验的科研团队组建的是石科技（Meta-Stone），正以独特的“HPC+AI”超智融合技术路径，加速构建中国自主可控的国产GPU云生态。

但中国版CoreWeave不能只是对海外GPU云模式的简单复制。

在国产AI芯片路线更加多元、软件生态尚未完全成熟、大模型应用加速落地的背景下，中国市场真正需要的，不只是一个提供算力资源的平台，而是一个能够把分散、异构、复杂的国产算力，转化为企业可用、好用、稳定可控Token产能的新型AI基础设施。

从这个意义上看，是石科技真正要补上的并不是一朵国产GPU云，而是国产算力从芯片供给走向规模化AI推理落地之间最关键的工程化中间层。

与传统的通用公有云不同，是石科技专注于垂直领域的AI基础设施（AI Infra），核心使命在于解决大模型应用与底层国产芯片之间的适配难题。通过算子级优化、内存管理、Continuous Batching等HPC级推理优化技术，结合对华为昇腾、昆仑芯、天数智芯、太初、瀚博等主流国产芯片的深度适配，是石科技将“好用的异构算力”转化为企业可用的标准化Token生产能力。

根据Gartner则预测，到2028年，超过60%的企业AI推理工作负载将运行在标准化的Token生产平台上，而非直接采购裸算力。这意味着，未来企业购买的将不再只是“卡”或“裸算力”，而是更接近工业化生产逻辑的Token产能。

行业专家评价称，是石科技的核心价值在于填补了国产AI推理产业的生态空白。作为独立第三方国产GPU云，其不绑定单一硬件、不局限单一生态的中立属性，能够最大化兼容各类国产模型与国产芯片；而HPC级优化能力与全链路合规保障，则有效解决了国产算力“落地难、效能低、不稳定”的行业痛点。

结语

面对日均 140 万亿次且还在暴增的Token调用海啸，国产算力的突围，绝无法寄希望于某一颗孤立的芯片，或某一家垄断的公有云。它需要的是一个更加开放、中立、兼容、可持续优化的基础设施层。

这正是独立第三方国产 GPU 云平台的战略价值所在。在这场全球AI基础设施的重构浪潮中，类似是石科技这样以“芯模共进”为引擎、以“超智融合”为路径的中国力量，正加速凿通国产芯片与原生应用之间的天堑，实现国产算力体系从追赶到并跑的跨越。

责任编辑：SemiInsights

申请专栏作者

: 半导体行业观察

: 摩尔芯闻

“中国版CoreWeave”崛起

相关文章

最新新闻

热门文章本日 七天 本月

热门评论

热门搜索

“中国版CoreWeave”崛起

相关文章

最新新闻

热门文章 本日 七天 本月

热门评论

热门搜索

热门文章本日七天本月