2025全球开发者先锋大会前夕探访:巨擘与新锐“同台”,展现AI技术新图景

来源:劳动观察 作者:陈宁 发布时间:2025-02-18 18:16

摘要: 2025全球开发者先锋大会(GDC)的脚步日益临近。

2025全球开发者先锋大会(GDC)的脚步日益临近,这场将于2月21日至23日在上海盛大举办的行业盛会,正吸引着全球目光。在大会前夕,记者跟随市经信委走进了两家极具代表性的参会企业——商汤科技和MiniMax,提前探寻其技术突破与创新实践。


商汤科技:行业巨擘博采众长


走进商汤科技,其最新发布的“小浣熊2.0”办公辅助系统成为焦点。这一系统基于商汤提出的AI模型三层能力圈理论(知识、推理、执行),可完成从需求分析到产品自主开发的全流程。例如,在制定产品推广预算时,系统能整合财务报表、账户信息等数据,生成科学方案,展现出强大的推理能力。据悉,这一版本的AI办公助手将在此次全球开发者先锋大会上发布。


不仅如此,商汤科技将主办本届GDC大模型生产力分论坛。负责“小浣熊家族”产品的产品总监贾安亚表示,作为AI从业者她感到非常激动:“这一波AI浪潮的特点是训练成本更低、架构更优化、模型能力更强,以及图、文、视频等多模态模型融合。这些能力的增强,将会加快AI在产业的落地应用,带来更多机会,包括医疗、金融、教育、工业等行业,以及辅助编程、智能办公、智能客服和营销等场景。”


作为AI 1.0时代诞生的AI“四小龙”之一,商汤科技如今已发展成为人工智能领域的行业巨擘。其学术底蕴深厚,长期专注于原创技术研究,在感知智能、决策智能、智能内容生成和智能内容增强等关键领域,构建起全栈式人工智能能力,同时在AI芯片、AI传感器及AI算力基础设施等方面,也具备强大的支撑实力。


谈及近期风头正劲的新秀DeepSeek,商汤科技方面表示,其不仅让更多人感到AI技术的巨大潜力,也让企业和个人逐步意识到AI在各行各业中的应用价值,对于AI生态的蓬勃发展无疑是个利好消息。


“商汤科技会博采众长,借鉴行业内的优秀实践经验,例如:如何提高推理效率、优化强化学习等,最终将这些创新转化为客户价值,更好服务B端和C端用户。”贾安亚认说。


MiniMax:AI新锐另辟蹊径


另一家受访企业MiniMax,虽成立时间不长,却已凭借卓越的技术实力与创新的模型架构,在全球AI领域崭露头角。


MiniMax的技术创新亮点颇多。其采用的MoE架构,通过将模型巧妙划分为多个“专家”模块,每个模块专注处理特定任务或数据子集,极大提升了计算效率,成为其技术优势的重要基石。2024年,其推出的万亿参数大语言模型abab 6.5模型便是基于此架构的杰出成果,目前,已在全球200多个国家和地区获得创作者青睐。


“AI时代的产品逻辑需跳出传统框架——更好的模型才能导向更好的应用,而非反之”。这是这家AI新锐公司的创始人在公开场合多次发表的观点。在AI行业贡献上,“小而精”的AI创业公司,也的确凭借着不同的“独门秘籍”,为大模型的发展开辟了新方向。


比如今年1月该公司就做了一次大模型开源,开源的是全球首个大规模实现线性注意力机制的模型MiniMax-01系列,其语音模型能够反映出人类的喜怒哀乐,目前已可支持17种语言。据介绍,该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破Transformer传统架构记忆瓶颈,在综合性能比肩GPT-4o、Claude-3.5等海外头部大模型的基础上,能高效处理高达400万token的输入,可输入长度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。


MiniMax副总裁刘华表示,创业公司在中国大模型领域将继续发挥重要作用。大模型研发框架的敏捷迭代要求研发人员对技术变革抱有极致热情,而不能仅仅依赖过去的经验,这也是DeepSeek能够脱颖而出的重要原因之一。


据悉,在此次大会上,MiniMax也将通过多场主题分享、圆桌对话,共同探讨大模型开源技术的最新发展、多模态大模型在各行业的应用落地、人工智能在智能硬件等领域的创新实践、智能硬件转型升级等话题。


头图为商汤办公小浣熊。受访者供图


责任编辑:李蓓
劳动观察新闻,未经授权不得转载
收藏

相关新闻

AI技术走向普惠,多家互联网企业...

DeepSeek刷屏:国产大模型...

激发古老艺术新活力、助力新生代“...

首页

顶部