全面开源,商汤日日新SenseNova U1发布,迈向模型理解生成统一时代

来源:劳动观察 作者:陈宁 发布时间:2026-04-29 12:08

摘要: 4月29日,商汤科技正式发布并开源日日新SenseNova U1系列原生多模态模型。

4月29日,商汤科技正式发布并开源日日新SenseNova U1系列原生多模态模型,该模型基于今年3月商汤自主研发的NEO-unify架构打造,在单一模型架构内实现了多模态理解、推理与生成的原生统一,完成了从模态集成到原生统一的多模态AI范式跨越。


NEO-unify架构彻底摒弃了传统多模态模型依赖的视觉编码器与变分自编码器,重新构建了端到端的统一表征空间,将语言与视觉信息作为统一复合体直接建模,让理解与生成能力在同一套计算体系内协同增强,既完整保留了语义丰富度,也实现了像素级的视觉保真度,从根源上解决了传统拼接式架构信息流转损耗、模态协同冲突的行业痛点。


本次同步开源的SenseNova U1 Lite轻量系列,包含基于稠密骨干网络的SenseNova-U1-8B-MoT、基于混合专家骨干网络的SenseNova-U1-A3B-MoT两款模型,相关权重与推理代码已上线GitHub及Hugging Face平台,配套技术报告也将于近期正式发布。


实测数据显示,该系列模型在图像理解、生成编辑、视觉推理等多项主流基准测试中,达到同量级开源模型的SOTA水平,即便8B参数量的轻量版本,综合性能也可对标甚至超越部分大型商业闭源模型。在复杂信息图生成等高难度任务中,模型展现出商业级的排版控制与文字渲染能力,同时推理响应速度较同性能竞品具备显著优势。


依托原生统一架构,SenseNova U1实现了业内首创的单模型单次调用连续性图文交错生成,无需多模型串联即可完成高风格一致性的连贯图文创作,同时为具身智能、世界模型等前沿技术方向提供了核心底层支撑。商汤方面表示,将持续迭代升级该系列模型,后续推出更大参数规模的版本,同时不断完善开源生态,与行业开发者共同探索原生统一多模态技术的落地路径。


头图展现了 SenseNova U1 Lite的商业级复杂信息图生成能力。由受访者供图


责任编辑:王迪
劳动观察新闻,未经授权不得转载
收藏

相关新闻

腾讯开源算法大赛学术成果和千万级...

技术硬核突围,国产大模型出海迈入...

春节AI应用DAU全线冲高,“千...

首页

顶部