新华网沈阳10月30日电(记者崔师豪)近日,第二十届中国计算机大会(cncc2023)在辽宁沈阳举办,国内外计算机领域的专家学者、科技领军人才、企业代表共同探讨计算及信息科学技术领域最新进展和宏观发展趋势。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在会上解读文心大模型最新技术,阐述大模型产业模式。据了解,自文心一言3月发布至今,文心大模型4.0训练算法效率提升3.6倍,周均训练有效率超过98%,推理性能提升50倍。
王海峰认为,人工智能具有多种典型能力,理解、生成、逻辑、记忆是其中的基础能力,这四项能力越强,越接近通用人工智能,而大语言模型具备了这四项能力,且越来越强,为发展通用人工智能带来了曙光。
据介绍,百度在3月16日发布知识增强大语言模型文心一言,目前文心一言的基础模型已迭代到文心大模型4.0版本。知识增强大语言模型从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。
据了解,在推理方面,文心大模型4.0通过大规模逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络,提升逻辑能力。此外,在输入和输出阶段都进行知识点增强。而在插件方面,通过数据驱动、提示构建以及插件增强进行场景适配,协同优化。文心一言已上线百度搜索、览卷文档、e言易图、说图解画、一镜流影等原生插件,扩展了大模型能力边界,更适应场景需要。
此外,百度进一步研制了智能体机制,包括理解、规划、反思和进化,能够做到可靠执行、自我进化,并一定程度上将思考过程白盒化,让机器像人一样思考和行动,自主完成复杂任务,在环境中持续学习实现自主进化。
王海峰表示,基于更强平台、更优数据、更好算法,我们训练出规模更大、效果更好的文心大模型4.0。通过飞桨与文心的协同优化,模型周均训练有效率超过98%,训练算法效率提升3.6倍,推理性能提升50倍。文心4.0的理解、生成、逻辑、记忆四大能力显著提升,其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。