跳转到主要内容

云天励飞重磅发布:推理时代算力新架构“GPNPU”曝光,三大产品线瞄准万亿级AI市场!

日期: 栏目:人工智能企业 浏览:

当大模型应用如雨后春笋般涌现,当AI正从实验室走向千家万户的日常生活,一个根本性的转变正在悄然发生:人工智能的算力需求正从“训练竞赛”转向“推理规模化”。在近日的“雪球嘉年华”舞台上,云天励飞董事长兼CEO陈宁发表了一场深刻洞察未来趋势的主题演讲《重新定义AI推理时代的算力》,不仅系统阐释了这一产业变革的内在逻辑,更重磅发布了公司面向推理时代的产品矩阵与下一代云端推理芯片架构规划,为正在蓬勃发展的AI应用生态提供了坚实的技术底座。

resized-202512221547112812.jpg

陈宁在演讲中开宗明义地指出,行业正在经历一场底层逻辑的根本切换。随着大模型应用从“尝鲜试用”走向“高频使用、规模化部署”,推理需求呈现爆发式增长。这种增长不是线性的,而是数量级的跃升。他列举了两个生动的案例:海外知名大模型产品的日均token量在用户规模扩大、使用时长增加和使用频率提升的多重因素推动下,实现了百倍级的惊人增长;而在国内市场,以豆包为代表的AI应用,其日均token量在短短一年半内也呈现出显著攀升态势,且增长势头依然强劲。当token成为衡量推理规模化的“产能指标”,推理算力便从过去的“配角”一跃成为支撑AI应用大爆发的“基础设施”。

基于这一深刻的产业洞察,云天励飞将推理芯片重新定位为“面向规模化落地的产业化引擎”。这一定位的核心转变在于,其目标不再仅仅是追求芯片的峰值性能这一单一指标,而是紧紧围绕客户最关心的总体拥有成本(TCO),致力于提升token的生产效率,持续降低单位token的资本支出(CapEx)与运营支出(OpEx)。陈宁形象地将其比喻为帮助客户将推理能力打造成一座可以持续运营、高效产出的“算力工厂”。这一理念的提出,标志着AI芯片产业的竞争维度已从单纯的技术参数比拼,升级为对客户商业成功全生命周期的赋能。

围绕“推理规模化”这一核心需求,云天励飞构筑了清晰而完整的产品矩阵,以三大系列覆盖从边缘到云端,再到新兴的具身智能等关键场景。这三大系列分别是DeepEdge、DeepVerse和DeepXbot。

DeepEdge系列瞄准的是广阔而分散的边缘推理市场。在智慧城市、工业质检、零售分析等场景中,边缘设备需要处理多业务、多模型的并发推理任务。DeepEdge强调的正是这种复杂场景下的算力效率与极致性价比,旨在让高质量的AI能力能够更广泛、更经济地部署在网络的“最后一公里”。

DeepVerse系列则面向云服务商、运营商等需要处理“大规模推理”需求的客户形态。它并非单一的芯片产品,而是围绕推理集群形态(包括加速卡、服务器乃至超节点)构建的一整套云端推理能力栈。这意味着云天励飞能够为客户提供从硬件到软件的完整解决方案,助力其在云端高效、稳定地运营大规模的AI推理服务。

DeepXbot系列则展现了公司对未来的前瞻布局,它面向的是具身智能、视觉-语言大模型等新型AI模型的需求。随着机器人、智能体等应用的兴起,对AI算力提出了新的要求。DeepXbot系列规划覆盖更宽的算力区间,并基于国产工艺路线,旨在为这些前沿领域提供可靠的推理芯片供给。

通过这三条产品线的协同布局,云天励飞的战略意图清晰可见:将推理能力从“单点芯片性能”的竞争,升级为“面向不同应用形态的可交付方案”的体系化能力,从而更贴近推理时代真实、多元且规模化的产业需求。

在演讲的最高潮部分,陈宁首次对外披露了公司面向下一代云端推理场景的芯片架构规划——GPNPU。这一架构是云天励飞为应对云端大算力推理的独特挑战而进行的重大创新。GPNPU的设计思路体现了卓越的系统工程思维,它并非凭空创造,而是对三类关键能力的深度融合与优化。

首先,它借鉴了GPGPU在顶层调度与生态兼容性方面的成熟思路,旨在降低开发者的软件迁移门槛,保护客户的现有投资,这对于推动新架构的产业化落地至关重要。其次,它深度融合了云天励飞团队在专用指令集设计以及硬件与算法亲和性优化方面的长期技术沉淀,重点强化了矩阵计算等推理任务关键路径的效率。最后,也是最体现前瞻性的一点,GPNPU架构充分考虑了在当前国产工艺条件下的存储与封装演进方向,旨在从系统层面缓解推理时代日益突出的“内存墙”与“带宽墙”瓶颈,从而在整体成本与能效比上寻求更优的解决方案。陈宁特别强调,推理时代的芯片成功关键,不在于追求某一单项指标的极致,而在于针对多样化的推理负载,实现“算力、带宽、存储容量”三者之间更科学、更合理的参数配比,并在功耗、部署便利性和长期运营成本等环节实现系统性优化,最终实现单位token综合效率的全面提升。

面对“云天励飞为何能在这一赛道取得成功”的潜在疑问,陈宁在演讲中提炼了公司的三项核心硬实力。第一是深刻的场景理解与需求牵引能力。公司不仅进行技术架构的研发,更坚持从消费电子、企业服务到垂直行业等丰富场景中,提炼推理范式的演变规律,并以此反向指导芯片指令集与软件栈的设计,确保产品始终贴近客户真实的TCO目标和部署约束。第二是长期积累的指令集与NPU架构设计能力。公司已经成功将多代自研的神经网络处理器架构推向商用市场,并积极参与国内NPU相关标准体系的建设。在此基础上,GPNPU等新架构的推进才更具底蕴和方向感。第三是深耕国产工艺与构建供应链体系的战略能力。公司较早地坚定拥抱国产工艺路径,并围绕Chiplet(芯粒)、先进封装、高带宽存储等关键方向延伸自身能力,形成了与推理时代所要求的“成本可控、能效优异、供给稳定”相匹配的产业化基础。

从全球范围的“训练竞赛”到如今方兴未艾的“推理规模化”,人工智能产业正进入一个以token为关键计量单位的新阶段。陈宁的演讲,不仅是一次趋势的研判,更是一家深耕AI芯片领域的企业发出的行动宣言。云天励飞将继续All in AI推理芯片这一黄金赛道,依托DeepEdge、DeepVerse、DeepXbot三大产品线的协同布局,全力推动下一代GPNPU架构在云端推理场景的落地。其最终目标,是以更优的总体拥有成本和更高的token生产效率,服务于AI应用在全球范围内的大规模普及与深度产业化,真正让千行百业都能用得上、用得起、用得好人工智能。这场由推理驱动的算力革命,正在重新定义AI的未来,而像云天励飞这样的探路者,已经在这条新赛道上迈出了坚实而有力的步伐。

标签: