
近期爆火的“苏超”,非球迷看不懂怎么办?在7月2日举行的智谱开放平台产业生态大会上,智谱正式发布并开源视觉语言大模型GLM-4.1V-Thinking。在现场演示中,该最新模型化身成为AI“解说员”,可以跟进视频直播,并应用户要求给出专业解说,并从技术、战术等角度解释某一进球的精彩之处。同时,智谱宣布浦东创投集团和张江集团对智谱总额10亿元的战略投资,并于近期完成首笔交割。
据悉,GLM-4.1V-Thinking是一款支持图像、视频、文档等多模态输入的通用推理型大模型,专为复杂认知任务设计。它在GLM-4V架构基础上引入“思维链推理机制(Chain-of-Thought Reasoning)”,采用“课程采样强化学习策略(RLCS, Reinforcement Learning with Curriculum Sampling)”,系统性提升模型跨模态因果推理能力与稳定性。
其轻量版GLM-4.1V-9B-Thinking模型参数控制在10B级别,在兼顾部署效率的同时实现性能突破。
智谱CEO张鹏表示,在面向科学研究、教育、自主Agent及多模态助手等更复杂现实世界应用时,补足推理能力的GLM-4.1V-Thinking ,真正解决开放式、信息丰富的千行百业的场景问题。如长视频理解、图像问答、学科解题、文字识别、文档解读、Grounding、GUI Agent和代码生成。
当天,智谱宣布推出全新生态平台“Agent应用空间”,并开启“Agents开拓者计划”,投入数亿资金,全方位扶持AI Agents创业团队。
“Agent应用空间”是一个面向企业客户和开发者的AI Agent能力聚合平台,汇聚丰富的Agent应用与模型插件(MCP),提供开箱即用、灵活编排的组件服务和Agents应用,帮助企业无需自建大模型团队,即可低门槛接入成熟、安全、可控的Agent能力。
在大会现场,张鹏提到,希望现有的大模型能力能通过智能体的方式转化成真正的生产力,帮助用户在日常生活和工作当中解决实际的问题。“我们希望大模型不光能思考,还能帮助我们解决执行的问题。当前的代码和执行能力(Agent能力),仍然还有大量的空间去提升。”
头图为大会现场。劳动报记者王嘉露 摄影