11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。无代码技术“秒哒”让每个人都拥有程序员的能力,将打造数百万“超级有用”的应用。
大会现场
在AI应用的发展趋势上,李彦宏表示,智能体是AI应用的最主流形态,即将迎来爆发点。他依次讲解了公司、角色、工具和行业四大类智能体,将做智能体类比为PC时代做网,或是移动时代做自媒体账号,“不同之处是智能体更像人、更智能,更像你的销售、客服和助理。智能体可能会变成AI原生时代,内容、信息和服务的新载体。”
幻觉问题是大模型广泛应用的最大限制之一,而解决文本生成幻觉问题背后的技术就是RAG,即检索增强。回顾过去两年,李彦宏认为,检索增强生成(RAG)从百度特色,逐渐发成为了行业共识。目前,文字层面的RAG已经做得很好,基本让大模型消除了幻觉;但在图像等多模态方面,和RAG的结合还不够,这也是百度希望重点突破的方向。
目前,基于大语言模型的文生图还有比较严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,极大地影响了AI的实用性。
消除大模型的幻觉,也是AI应用爆发的基础。在李彦宏看来,今天,基础大模型能力就绪,即将迎来AI应用的群星闪耀时刻。
“今天,全球所有顶尖科技公司都在关注智能体,但像百度这样把智能体作为最重要战略方向的公司并不多。”李彦宏表示,就像PC时代的网站、移动时代的自媒体账号,在AI原生时代,智能体将成为内容、服务和信息的新载体。
他以公司类智能体举例,在传统的PC官网模式下,企业只能静态地展示公司介绍、产品参数,但缺失主动推荐、及时响应和一对一服务能力;而公司智能体则可以根据顾客的需求推荐相应产品,在服务方面,也能更直接、快速地响应需求,能大幅地提升互动营销的效率。
此外,李彦宏展示了角色、工具和行业等多类智能体的特色功能及使用场景。例如百度文库和百度网盘联合打造的工具类智能体“自由画布”,让用户可以在一块类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。再比如,法律智能体“法行宝”,已回答用户1660万个法律问题,不仅能像专业律师一样给出解答,还能计算法律赔偿金额、撰写法律文书,并推荐适配律师。
演讲结尾,李彦宏带来了当天的OneMoreThing——无代码工具“秒哒”,一款不需要写代码就能实现任意想法的软件,涵盖无代码编程、多智能体协作以及多工具调用等特点,只需说说话,就能构建出各种应用。它可以帮助更多人、更多企业打造出数百万“超级有用”的应用。
他介绍说,无代码编程,由大模型直接生成代码,不需要人写一行代码。它门槛很低,人人可上手;多智能体协作,是基于文心大模型的思考和规划能力,实现对不同智能体的调度和编排;多工具调用,是通过大模型的工具调用能力,可调用网页检索、iRAG、地图API等各类型工具。
演讲现场,李彦宏以萝卜快跑新技术发布会为例,展示了活动报名系统的搭建过程:只要在“秒哒”上用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥多个智能体协作,完成报名系统的开发。
就像工作场景中的团队合作一样,在现场演示的“秒哒”开发过程中,小组长、策划、小编、程序员和质检员五个智能体互相协作,协同完成策划、内容和开发等各种工作,还能自动识别bug、调用各种工具。
“一个人通过自然语言交互,就可以完成一套系统的搭建,除了上面展示的邀请系统,还可以做任意场景下的各种应用,应用的复杂度也会随着我们技术的提升不断提升。”李彦宏总结说,这意味着每个人自己就能指挥多个智能体来协同完成任务。
在他看来,无代码的秒哒让每个人都具备程序员的能力,会说话就能做出应用,极大提升了人类的工作效率。“AI之所以被称为产业革命级的机会,就是因为它对社会经济,带来了生产力的无限扩张。”(百宣)
(注:此文属于央广网登载的商业信息,文章内容不代表本网观点,仅供参考)
下一篇:深圳和中山电子印章互信互认