阿里大模型“通义听悟”宣布升级:音视频问答助手“小悟”上线,支持超长视频问答

来源:劳动观察 作者:陈宁 发布时间:2024-03-19 16:04

摘要: 3月19日,阿里大模型产品“通义听悟”发布多项新功能。音视频问答助手“小悟”上线。


3月19日,阿里大模型产品“通义听悟”发布多项新功能。音视频问答助手“小悟”上线。据介绍,通过多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。


用户不仅可在单一记录页呼唤小悟,对最高6小时、6G大小的音视频提问任何相关话题,或直接小悟要求整理金句、梳理结论、写会议纪要;更可在首页针对用户所有记录提问,支持一次性扫描理解上百条音视频内容;也可花式对英文视频用中文提问,小悟将直接给出中文回答,省去翻译。


此外,针对学习科研场景对AI工具的强烈需求,通义听悟推出“高校公益计划”,向所有中国大陆高校师生直接赠送价值数千元的500小时音视频转写时长。


音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,长期以来内容查找难、回顾难、提炼难。阿里通义听悟产品负责人杨帆介绍,通义听悟为这一需求而生。“作为一款工作学习AI助手,通义听悟希望让高知识附加值的音视频被轻松阅读、整理和分享。”


针对用户需求,通义听悟还上线了一键AI改写、思维导图生成等新能力。例如,一键AI改写,将口语转为书面表达,尤其适合整理采访;思维导图自动生成,最多支持五级xmind脑图,适合播客摘要。


头图来源:手机截图


责任编辑:罗菁
劳动观察新闻,未经授权不得转载
收藏

相关新闻

企事录|秒画“繁花”、生成驾驶员...

能当“健康管家”、“陪诊助手”…...

上海“模速空间”创新生态社区暨人...

首页

顶部