风君子博客过去一年,人工智能浪潮席卷全球。以ChatGPT为代表的大模型发展如火如荼,大模型被认为将重塑人类社会的生产生活方式。
面对方兴未艾的大模型,如何真正赋能千行百业,形成新的生产力,是行业普遍需要面对的问题。
在2024华为开发者大会上,华为常务董事、华为云CEO张平安给了业界答案。
盘古大模型三大升级
会上,华为发布了盘古大模型5.0,在全系列、多模态、强思维三个方面带来全新升级。
全系列:从十亿级到万亿级参数 小到手机大到云端复杂推理都能满足
盘古大模型5.0包含不同参数规格的模型,以适配不同的业务场景。从十亿参数覆盖万亿级参数范围,小到手机、PC等端侧应用,大到云端复杂推理的各种需求,都能一键满足,应用广泛,算是一个全系列升级。
多模态:让人机交互、内容生成分析体验更好
为了更好更精准地理解物理世界,包括文本、图片、视频、雷达、红外、遥感等领域,新版本的盘古大模型还加强了多模态处理能力,让整个人机交互、内容生成和分析等体验逐步提升。
举例来说,盘古大模型5.0能够识别卫星遥感图像,准确分析出区域农作物的生长情况,用于产量预估、病虫害监测等。还能识别红外影像,当夜间通过可见光无法看清的时候,盘古5.0能够通过红外影像精准的识别车辆的位置,进行交通违停的管理;此外,盘古5.0能够通过可见光和雷达的影像综合判断该地区的植被覆盖情况,帮助生态部门进行自然保护地的监测。
在内容生成方面,在自动驾驶领域,盘古大模型5.0通过可控时空生成技术,结合场景视频生成、4D BEV视频生成、自动驾驶仿真库及路网信息,能更好地理解物理规律,大规模生成和实际场景相一致的驾驶视频数据,还可以灵活增加控制条件,生成不同路况、不同光照、不同天气的训练视频数据,加速自动驾驶技术的快速成熟。
强思维:思维链结合策略搜索,支持复杂推理
复杂逻辑推理是大模型成为行业助手的关键。盘古大模型5.0将思维链技术与策略搜索深度结合,提升了数学能力、复杂任务规划能力以及工具调用能力。
例如,在一道立体几何题中,需要证明图中的直线PQ与三棱柱的侧面平行。盘古大模型5.0可以将输入的2D图片在3D空间中进行推理,首先给出了正确的解题思路,并通过思维链多步生成和策略搜索,一步一步完成题目的证明。
基于盘古具身智能大模型的人形机器人首次亮相,在现场首次演示了复杂任务的执行。
这款名为“夸父”的机器人上台与张平安击了个掌,展示了识别物品、问答互动等能力。
张平安在大会上表示,除了人形机器人,盘古具身智能大模型还可以赋能多种形态的工业机器人和服务机器人,让它们帮助人类去从事危险和繁重的工作。“正如大家所期望的,让AI机器人帮助我们去洗衣、做饭、扫地,让我们有更多的时间去看书,写诗,作画。”张平安表示。
真正赋能千行百业
能力的提升,让盘古大模型能更好的赋能千行百业。
张平安分享了盘古大模型在工业设计、建筑设计、具身智能、媒体生产和应用、高铁、钢铁、气象等领域的丰富创新应用和落地实践,持续深入行业解难题。
在工业设计领域,以新车造型设计为例,周期一般需要1-2年,盘古大模型可以让汽车的造型设计时间大幅缩短。造型设计师可以将自己的灵感,通过对话、画图与大模型交互,生成3D汽车数字模型,并可进行风格化调整、零部件编辑、颜色更换等。
除了汽车造型设计,盘古大模型还可以用于汽车的工装设计、模具设计,以及电子产品领域的工业设计等。
在建筑设计领域,基于盘古大模型的可控生成能力,只需输入设计的黑白草图,即可生成彩色并带有纹理的建筑群360°实景视频;基于盘古3D重建能力,还可以构建出高真实感的建筑3D模型,将复杂建筑群的概念设计周期从数周缩短到数十分钟。
在具身智能领域,盘古大模型能够让机器人完成10步以上的复杂任务规划,并且在任务执行中实现多场景泛化和多任务处理。同时盘古大模型还能生成机器人需要的训练视频,让机器人更快地学习各种复杂场景。
在媒体内容生产和应用领域,盘古大模型能自动将视频译制成不同语言,并保留原始角色的音色、情感、语气;将译制配音、动漫生成等场景的制作周期从月级缩短到天级,还能通过AI翻译和拟人化语音合成能力,实现AI同声传译,让云会议、视频通话等可以实现母语交流体验。
在铁路领域,全国每天需要检测的动车大概有3.2万节车厢,过去需要大量的巡检工人在凌晨时段去完成,耗时耗力。如今结合盘古大模型和巡检机器人,可精准识别一列动车的3.2万个项点,覆盖8大类、350多种复杂故障,帮助高铁提升运营效率,降低成本,减少人工在凌晨时段去巡检的艰辛作业。
在钢铁领域,以上海宝武钢铁热轧生产线为例,每次调整生产钢板的种类和尺寸,都需要工程师重新调整7道精轧机组的300多个参数,需要耗费约5天的时间。盘古大模型能够对最优参数进行预测,显著降低热轧生产线调优时间,并提高预测精度和钢板成材率。
目前盘古大模型目前已在宝钢1880热轧生产线上线,预测精度提高5%以上,钢板成材率提升0.5%,预计每年可以多产钢板2万余吨,年收益达9000余万元。
在气象领域,华为云联合深圳市气象局,在分辨率为25公里的全球模型基础上,融合区域高质量气象数据集,升级了分辨率分别为1公里、3公里、5公里的区域预报能力,包含气温、降雨、风速等气象要素。不仅如此,今年华为云还联合天融环境打造了环境大模型,将污染六项的预测准确度全面提升10%以上。
在医药领域,天士力基于盘古大模型打造“数智本草大模型”。一方面基于盘古L0能力,学习训练了378万篇文献等数据,尤其是学习了1000多本古籍,从古方古籍和现代文献中总结出知识和经验,可以赋能方剂筛选和优化、提升研发效率,也能辅助医生问诊。另一方面,天士力在盘古17亿化合物的药物分子大模型基础上,增训了350万天然产物分子数据,未来有望更好地优化方剂和发现新药。
盘古5.0升级背后,是华为云昇腾AI云服务的一年迭代优化。目前昇腾AI云服务已全面适配行业主流的100多个大模型,以云服务的方式协助客户开发,训练,托管和应用模型,华为已经在贵安、乌兰察布和芜湖,构建了三大AI算力中心,支持大模型产业发展。
写在最后
华为发布盘古大模型3.0曾提出,产品要面向全行业,“不作诗,只做事”,随着盘古5.0的发布,华为云提出“不仅要做事,还要做最难的事”,真正赋能行业解决实际遇到的难题。
未来,随着技术的不断发展和应用场景的拓展,盘古大模型将继续帮助各行业攻克难关,创造新的生产力,真正实现赋能千行百业的目标。