百度CTO王海峰详解“文心一言”背后技术特性

风君子博客3月16日消息，百度于北京总部召开新闻发布会，主题围绕新一代大语言模型、生成式AI产品文心一言。百度首席技术官王海峰现在详解了文心一言背后的文心大模型及技术特性。

文心一言是新一代知识增强大语言模型，也是百度继文心一格之后的又一个生成式AI产品，具备对话交互、内容创作、知识推理、多模态生成等能力。

王海峰表示，新一代知识增强大语言模型文心一言，是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术，ERNIE和PLATO中已经有应用和积累，在一言中又有了进一步强化和打磨；后三项则是百度已有技术优势的再创新，也是一言未来越来越强大的基础。

在知识增强方面，文心一言的知识增强主要是通过知识内化和知识外用两种方式。知识内化，是从大规模知识和无标注数据中，基于语义单元学习，利用知识构造训练数据，将知识学习到模型参数中；知识外用，是引入外部多源异构知识，做知识推理、提示构建等等。

在检索增强方面，文心一言的检索增强，来自以语义理解与语义匹配为核心技术的新一代搜索架构。通过引入搜索结果，可以为大模型提供时效性强、准确率高的参考信息，更好地满足用户需求。

在对话增强方面，基于对话技术和应用积累，文心一言具备记忆机制、上下文理解和对话规划能力，实现更好的对话连贯性、合理性和逻辑性。

“百度特有的技术，现在已经应用在文心一言上”，王海峰也坦言，技术有了，但是大模型的训练的还不够充分。不过文心大模型建立起人类反馈、奖励模型和策略优化之间的飞轮机制，随着真实用户的反馈越来越多，文心一言的效果会越来越好，能力越来越强。

王海峰称，百度自2010年起开始全面布局人工智能，是全球为数不多、进行全栈布局的人工智能公司。从昆仑芯片、飞桨深度学习平台、文心大模型到应用，百度在技术栈的各层都有领先业界的关键自研技术，实现了层与层反馈，端到端优化。

王海峰强调，飞桨深度学习平台支撑文心一言效果更好、效率更高、性能更强。对于开发训练，飞桨动静统一的开发范式，以及自适应分布式架构，可以实现大模型的灵活开发和高效训练。在推理部署方面，飞桨支持大模型高效推理，并提供服务化部署能力，包括计算融合、软硬协同的稀疏量化、模型压缩等等。文心大模型加上飞桨深度学习平台，夯实了产业智能化基座。随着文心一言与飞桨平台的进一步融合发展，人工智能技术和应用的研发将越来越标准化、自动化和模块化，加速人工智能的工业大生产，同时也反哺文心一言加速迭代进化，落地更多场景和行业。

百度CTO王海峰详解“文心一言”背后技术特性

巴菲特旗下伯克希尔·哈撒韦再度增持西方石油股票持股比例增至23%

花了3000亿把4/3nm带到美国台积电失算了：成本翻倍

最新文章

日本开发出全固态电池新技术可将容量提高至3倍

「经验分享」单位规模如何填写

ai复制快捷键（复制与粘贴的几种办法）

探路者和骆驼哪个好(探路者冲锋衣什么档次)

太监怎么净身（揭秘太监净身全过程）

破折号的作用

圭吾怎么读(东野圭吾什么意思)

防晒口罩巾怎样做

学困生转化措施（以及转化学困生的三项策略）

半斤多少克(一斤等于多少两)

标签

热评文章

潮汐app怎么设置耳机闹钟

经典话语（30句非常精辟的经典语录）

数量的英文（关于数量的英语词汇你知道多少？）

北海景点排行榜（北海十大好玩的地方）

谈笑间樯橹灰飞烟灭（苏轼《江城子》）

百度CTO王海峰详解“文心一言”背后技术特性

巴菲特旗下伯克希尔·哈撒韦再度增持西方石油股票 持股比例增至23%

花了3000亿把4/3nm带到美国 台积电失算了：成本翻倍

最新文章

日本开发出全固态电池新技术 可将容量提高至3倍

标签

热评文章

潮汐app怎么设置耳机闹钟

经典话语（30句非常精辟的经典语录）

数量的英文（关于数量的英语词汇你知道多少？）

北海景点排行榜（北海十大好玩的地方）

谈笑间樯橹灰飞烟灭（苏轼《江城子》）

关注我们的公众号

巴菲特旗下伯克希尔·哈撒韦再度增持西方石油股票持股比例增至23%

花了3000亿把4/3nm带到美国台积电失算了：成本翻倍

日本开发出全固态电池新技术可将容量提高至3倍