
7月5日,在2024世界人工智能大会上,商汤举办了“大爱无疆·向新力”论坛,商汤科技董事长徐立在现场发布了大模型“日日新5o”,交互体验对标OpenAI最新发布的GPT-4o。
实时交互能力背后的支撑来自于商汤最新的基座模型。在会上商汤同时宣布大模型迭代到“日日新5.5”,其综合性能较上一代“日日新5.0”平均提升30%,在数学推理、英文能力和指令跟随等能力明显增强。据介绍,通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,“日日新5o”可以带来全新的AI交互模式,即实时的流式多模态交互。
在现场展示环节,徐立与工作人员一起体验,刚开始仅是和“日日新5o”打个招呼,它就自动识别出工作人员脖子佩戴的胸卡带子上的字眼,判断出现场就是世界人工智能大会会场,并表示在这个地方可以“好好学习”。
接下来工作人员拿了一只可爱小狗玩偶,“日日新5o”准确描述了小狗的外貌、表情以及重要穿戴——一个带着印有商汤科技logo白帽子。而随便翻开一本书的任何一页,“日日新5o”都能自动介绍,不是简单的OCR识别文字,而是识别图文给出好理解的总结,这一切在瞬间即可完成,真正做到实时交互。
工作人员还现场发挥了“画功”,随手画了一只简笔画小兔子,“日日新5o”直呼“画得可爱”;而后工作人员又画了一个微笑表情,它从这个平静的表情中捕捉到了笑意;工作人员又改了一笔把嘴巴画大增添了舌头,“日日新5o”看到后立马说道“这表情开心多了”。
“我一直的观点是,虽然我们的行业非常热,包括像ChatGPT带来了聊天式的应用,Sora带来了视频,但它还没有到超级时刻,是因为它没有真正走进到一个行业的垂直应用中引起广泛的变化。”徐立认为,实时的交互性能够带来流畅的体验,也是带来超级时刻以及推动应用变化的一个核心。
针对“日日新5o”背后的基座大模型,商汤介绍,日日新5.5基于超过10 TB tokens数据训练,包括大量人工合成数据,数据构造从基础知识转向合成思维链,在数学、推理、长文本、编程等多个维度都有大幅提升。此外,模型采用混合端云协同架构,可最大限度发挥云边端协同。
在演讲最后,徐立在现场特别提到了“大模型0元Go”计划,称凡是“日日新”的新注册用户,都可获得涉及调用、迁徙、训练等多项免费服务大礼包。同时,商汤表示将免费赠送5000万Tokens包,并且派出专属搬家顾问,帮助OpenAI用户实现零服务成本迁移。
头图为商汤论坛现场,劳动报记者陈宁摄