英伟达开源新一代智能体模型 混合架构刷新推理效率极限

匿名作者
2026-03-13 09:477

英伟达最新发布的1200亿参数开源模型Nemotron3Super,凭借首创的混合架构实现推理速度的三倍跃升。该产品在多项权威基准测试中表现亮眼,正以前所未有的算力性价比冲击闭源巨头的市场防线。

极致架构瘦身 攻克长上下文协同难题

大模型在多智能体协同场景中,常常面临随着对话轮次增加而出现的“目标跑偏”或“上下文爆炸”等底层技术痛点。英伟达此次推出的Nemotron3Super正是为了解决这些行业顽疾而生。

该模型破局的关键在于引入了创新的Mamba-MoE混合架构。在总计1200亿的庞大参数规模下,其激活参数被极致压缩至仅120亿。这种“以小博大”的动态调度机制,不仅使得模型的单次推理速度相比传统架构暴增三倍,整体吞吐量更是实现了五倍的跨越式增长。更重要的是,系统能够稳定支撑高达1M的超长上下文处理,为复杂的高端多智能体协作提供了坚实的基础底座。

22.png

图源备注:图片由AI生成

测评成绩亮眼 逼近顶级闭源水准

算力指标的突破迅速在应用端转化为了卓越的实战能力。在近期公布的多项全球权威性能测评中,Nemotron3Super展现出了远超同级别开源模型的统治力。

该模型一举登顶了效率与开放性双料榜单,并作为底层大脑驱动了英伟达自研的AI智能体,在权威双榜单中成功霸榜。而在业内公认难度极高的热门智能体任务测试中,其任务成功率达到了惊人的百分之八十五以上。这一数据不仅刷新了开源阵营的历史记录,更在核心指标上无限逼近了业界公认的顶级闭源大模型水准。

软硬生态协同 顶级云厂商集体入局

作为底层算力霸主,英伟达在发布新模型的同时,也完成了从硬件到软件生态的深度闭环。为了最大化释放自研芯片的潜力,该模型在常规格式之外,率先针对最新的Blackwell架构实现了特殊训练格式的支持,这一举措将显著压降训练成本并拉升算力转化率。

得益于开源免费的零门槛策略与顶尖的性能表现,Nemotron3Super的发布在科技圈引发了强烈的连锁反应。目前,该模型已被多家跨国科技巨头火速集成于核心业务流中,并同步登陆了全球三大主流云服务平台。在开源与闭源的路线之争中,英伟达正通过提供极具性价比的替代方案,悄然重塑整个AI产业的版图。

评论 (0)

暂无评论,快来发表第一条评论吧!

AI 技术峰会

2025 AI 技术峰会

AI 实战课程

AI 实战课程

热门工具

AI 助手

智能对话,提升效率

智能图像处理

一键美化,智能修图

AI 翻译

多语言实时翻译