
3月23日,“2024全球开发者先锋大会”(GDC)在上海徐汇盛大开幕。大会以“模速空间——开发者的模力之源”为主题,促进全球范围内最尖端技术、最热门议题和最先锋人才的深入交流与对话。当前,以大模型为代表的生成式人工智能等前沿技术正在持续迭代发展,与社会生产生活各方面加速融合,形成新质生产力,也引发了业内外的议论热潮。在AGI(通用人工智能)时代即将到来,我们该如何做好准备?听听与会嘉宾如何展开。
OpenAI前全球商业化负责人:
2030年AGI时代将会到来
“2030年AGI(通用人工智能)时代即将到来”,在2024年全球开发者先锋大会上,OpenAI前全球商业化负责人Zack Kass在演讲中说。
他将AI技术的发展分为三个阶段:首先,应用增强阶段,AI功能日益强大,如ChatGPT的出现,使得我们通过简单的手机操作就能享受到AI的便利;其次,AI自动化阶段,预计在未来两年内实现。在这一阶段,AI能够自动执行任务,无需手动打开应用程序。用户可以通过语音命令或耳机传达指令,实现直接操作。
最后是AI赋能的操作系统阶段,这将是一个更加革命性的变革。随着CPU的发展,人们对工具和设备的期待也在不断提高。在未来10年内,计算机、手机等设备将经历重大变革,人们甚至可以通过戴眼镜来操作电器,电器将变成公共工具,我们的生活也将因此发生改变。
当下AGI的时代已经到来,我们该如何做好准备?Zack Kass称,面对技术的发展,非常重要的一点是一定要学会区分技术能做什么,能为我们服务什么。AGI技术的发展,对每个开发者来说,意味着技术的成本越来越低。ChatGPT3.0刚开始问世的时候,成本非常高,而现在已经接近于零成本。
“而且开发者一定要牢记哪些是当下我们面临的技术瓶颈,比如每年在高速公路上或者无人驾驶的事故率也有很多,我们应该更好的进行风险评估。”他说。
在演讲最后,Zack Kass建议大家要规划好个人生活,要去思考,AI把人类的知识技能商业化之后,我们人类还能做什么。
商汤科技董事长兼CEO徐立:
AIGC是最好的新质生产力工具
“最近大家都在讨论一个热词“新质生产力”,对于开发者来说,生成式AI是最好的带来生产力工具、生产力突破的行业,”商汤科技董事长兼CEO徐立在发表演讲时表示,从深度学习开始业内关注的是感知智能,现在大模型开始业内走了一个反向的方向,关注的是生成式的内容,被称之为AI2.0时代。
他分享了一个有意思的观察,ChatGPT到来之后,AI2.0时代开始备受关注,是Chat的应用,把GPT的共识推向了普罗大众的认知,所有人都开始关注到这件事情上。其中,中国对此的关注热度位居所有AI热词的榜首。不过,虽然中国对于这部分的关注度非常高,但是真正意义上在使用这部分的应用当中排在了美国印度之后。
“我想这里面还有一个问题——语言问题。如果用自然语言来完成编程的任务、设计的任务,目前来说英语和现在的程序匹配非常得完整,有大量的现成的数据,但是到中文相信需要有更好的中文语言的工具。”徐立表示,他把现在作为生产力工具的AI模型分成能力圈的三层,三层之间互有依赖,但又不完全相关。
第一层知识层,即将世界的知识灌输到大模型能力当中。“今天很多生产力工具也好,代码也好,解决的都是知识层的问题,你提出问题或者你需要它补全,需要它解决一些问题,基于背后的道理是世界上没有新鲜事,你做过的事情前人做过,所以你可以完成一个很好的任务的完成。”
第二层是有了世界知识之后的演绎。“有可能你不知道这件事事实,但是你可以通过AI的过程,逐步把这个事实推理出来,给出更多的可能性。”他说,知识和演绎构造出来的两层是作为生产力工具大模型最重要的两层,但是在推理层面目前来说,成长还相对有限,而且这也是后面要集中突破的能力之一。
第三层是如何跟这个世界互动反馈,即执行。一系列的任务都是在这三层上面,这三层可以组成一个完备的对于世界提供生产力工具模型的三层能力。
在演讲中,他也介绍了商汤目前基于上述三个层面构造出来的一个办公辅助大软件,叫做“小浣熊”。这个大软件的2.0版本能够真正意义上基于海量数据去筛选用户需求,制定产品的特征,在产品的特征之上完成产品的自主开发。
美国国家工程院外籍院士沈向洋:
Sora引发焦虑,开发者未来的机会在哪里?
开幕式上,美国国家工程院外籍院士沈向洋在“大模型时代的机遇和挑战”的演讲中分享了对大模型的思考。他表示,人工智能蓬勃发展,但人们对智能的本质并没有清晰认知。
“文生图使得一言胜千图,ChatGPT使得一句顶一万句,Sora的出现使得输入几句提示就能产生大片效果。”沈向洋说,这三件事让人们产生一个个焦虑,未来开发者的机会在哪里?他的答案是多模态。
多模态是通用人工智能的必经之路。以OpenAI代表的技术实际上是对不同模态的理解,“OpenAI的内部有两套体系,一是从文生图延展到文生视频,走的是Stable Diffusion路线,二是文生文,走的是Transformer路线。到现在为止,这两条线路还没完全统一起来,相信接下来中国的开发者、世界的开发者,很快会有这方面的突破。”
沈向洋分享了关于大模型的五方面思考。首先,大模型的到来,强迫人类重新思考人机关系。“我们受到的冲击,到底有多少是机器智能的发展,有多少是人机交互的震撼。”他认为,不管是什么技术,最终目的是帮助人更好运用机器,不忘初心。
第二,大模型将横扫所有垂直行业。大模型可分为通用大模型、行业大模型、企业大模型和个人大模型。“一个通用大模型如果没有万卡、不上1万亿参数,基本上以后就不太好意思说这是一个通用模型了。行业大模型大致上是千亿参数、千亿卡的训练规模。企业大模型可能只需要100张卡、百亿参数。最有意思的是个人大模型,利用个性化参数,结合云和端,这是非常有意义的。”
第三,算力是门槛。影响算力的两大因素是模型大小和数据规模,随着参数增加,对算力的需求几乎是几何级的。
第四,AI带来社会冲击。这些冲击包括对民众的冲击、企业的冲击、政府监管的冲击、社会发展的冲击,带来深度伪造等伦理问题,很多国家开始立法,这需要共同推动治理、向前发展。
第五,智能的本质。人工智能蓬勃发展,但人们对智能的本质并没有清晰认知。“大模型大到一定地步以后就涌现出来。多大才涌现出来?没人讲得清楚。”沈向洋表示,“很多人相信scaling law(规模法则),但今天的深度学习,理论非常欠缺。从宇宙到量子,物理学有一套大一统的理论统一起来,叫作Theory of Everything。今天深度学习没有这样的理论,所以叫作Theory of Anything。”
头图为开幕式现场,劳动报记者陈宁摄