作者:李泽南

  在天气预报中,我们常常会听到「局部地区」这样的字眼。随着技术的发展,「局部」出现的次数正越来越少。在深圳,大数据和人工智能的融入将在不久之后为我们带来「精准到街区」的个性化天气预报服务。

  如果天气预报 APP 能告诉你两个小时后,一平方公里面积内的天气是什么样的,我们的生活方式可能会完全不一样了。

  如何让天气预报变得更准确一直是个世界性难题。事实上,现代气象预报的准确度远没有人们想象的那么高。

AI加持的精准天气预报将从深圳开始:两小时内,一平方公里范围-冯金伟博客园

  想必不少人都遭遇过机场因为天气造成的大面积航班晚点的情况,乘飞机出行最怕遇上大雨。如果天气预报更准确一点,或许我们能够提早选择其他航班,而不是在机场苦等一宿。尤其对于深圳这种位于粤港澳湾区,人口密集,时常出现台风、雷暴等天气的城市而言,天气预报的准确性显得尤为重要。

  去年 7 月,美国宾夕法尼亚州立大学等机构组成的研究小组开发出了一种用于识别潜在风暴的新模型,基于机器学习算法,可以从卫星图像中识别云的旋转运动。

  研究人员发现,基于 AI 的方法可以有效地检测出逗点云型,准确率高达 99%,且平均每次预测仅需 40 秒。这种方法可以有效地预测出 64% 的恶劣天气事件,优于大多数其他现有的预测方法。

  目前,虽然全球已经在为气象行业的智慧发展付诸行动,但是气象预报服务仍然面临着不小的挑战。

  首先,当前天气预报最大的瓶颈要属雷雨大风、短时强降水等突发灾害性天气预报的准确率,同时预报预警信息精细化程度不高,如何千方百计提高预报预警准确率和提前量,实现定时、定点、定量的精准预报预警是气象部门永远的追求;其次,如何实现气象监测预报预警信息的快速精准发布、主动和被动实时快速获取。是人们获取气象信息「最后一公里」的瓶颈制约;另外,政府、行业和社会公众对气象服务需求具有复杂性,如何满足不同服务对象的个性化需求,进一步提高针对性和有效性实现智慧服务,也是推动气象服务发展不可忽视的关键点。

  而人工智能正是能够解决上述瓶颈的一把利刃。

  「在深度学习发展起来之后,有很多机构都在探索如何应用更多种类的数据,如大量使用云服务」。华为云人工智能领域总裁贾永利介绍道。「过去科研人员使用雷达去识别云的形态,现在也可以通过摄像头来采集图像,使用 AI 领域里的计算机视觉算法进行分析,这或许会是未来的重要发展方向。」

  1 月 6 日,华为云与深圳市气象局签署深度合作协议,双方将就云计算、5G、人工智能等创新技术在气象领域行业的应用和推进、未来技术趋势研究展开合作,共同推动气象精准预报、智慧城市气象服务等业务创新。这意味着,深圳市民将率先享受到由 AI 带来的先进天气预报服务。

  对于深圳市气象局而言,利用新兴技术,例人工智能,实现「精准预报服务」是其发展目标之一。通俗一点解释来说,如果将深圳市所在的区域分解成许多个 1 公里×1 公里的网格,而公众就生活在这样一个个的网格中,每个网格中的天气情况也会有所差异。「精准预报服务」计划就是针对这样的每一个网格开展预报的。

  与原来的定点预报相比,网格化预报在空间上更加精细,也更具针对性。就拿深圳的预报来说,原来的预报只是以同一定点预报结果代表整个城市的天气情况,但通过开展网格化预报,人们可以在整座城市的每个不同的网格之中享受到更精细的气象服务。

  在本次合作中,华为云发挥自己的技术优势,通过云 +AI+5G 为深圳市气象局构建新一代超大城市精准预报系统,帮助推出基于智能网格的新一代精准预报,实现智能感知、精准预报等智能化服务,让大众体验到「两小时内、一平方公里范围」的个性化精准天气预报。

  首先,在数据分析上,因为气象数据的时空分辨率都非常高(空间上每个像素值代表地面 1 公里 x1 公里的实际大小,时间上 6 分钟收集一次雷达回波样本),造成了数据量极大,普通服务器难以承受如此规模的数据处理和模型训练、推理,这也正是使用华为云 AI 昇腾集群进行模型训练的原因。华为云 AI 昇腾集群服务,可以按需提供强大的 AI 算力,并加速气象预测模型开发进程,对深圳市气象局 10 年的雷达数据进行训练仅仅需要 3 天的时间。

  据介绍,华为云 AI 昇腾集群可以极大缩短气象预测模型训练周期,原先需要训练一到两个星期的模型,通过大规模并行计算,可以将训练时间缩短到三天甚至几个小时以内。

  在数据存储上,气象局每年存档大约 300TB 的数据,对这些海量的气象资料进行存储需要建设庞大的数据中心,投资大,周期长,而华为云的弹性存储服务可以快速灵活地完成任务。

  事实上,气象行业近年来一直在大数据的方向上进行探索——全球很多顶尖超算的算力经常会被用在气象学模型上。各种传感器接收到的气象观测资料都是海量的。据介绍,目前每年全球新增气象资料大约达到了 4PB(约 4×10^6GB),这一切都需要超大规模的 AI 计算资源做支撑。

AI加持的精准天气预报将从深圳开始:两小时内,一平方公里范围-冯金伟博客园
台风「山竹」流动风场图。

AI加持的精准天气预报将从深圳开始:两小时内,一平方公里范围-冯金伟博客园

  其实,气象数据本质上就是一种时空数据格式,我们需要时间序列预测算法来进行短时气象预测,在这个过程中可以用到卷积神经网络、递归神经网络、对抗性图像生成网络等深度学习算法。相比传统方法,深度学习可以更好地挖掘数据中的时空变化信息,预测准确率可以提高 20% 左右。华为云表示,传统的预测方法可以刻画云团的移动信息,却难以建模云团的生消强弱变化信息,而深度学习很好地弥补了这一点。

  经过两个多月研发,研究人员们通过华为云 ModelArts 一站式 AI 开发与管理平台训练了「灾害性天气 AI 气象预测模型」。它可以通过捕捉雷达、云图等数据中的时空关系,建立云团运动、生成和消散的预测模型,从而识别未来两小时内的降雨、雷暴等灾害性天气。在台风来临时,AI 算法还会通过分析卫星实况数据,预测台风可能的移动轨迹。 

AI加持的精准天气预报将从深圳开始:两小时内,一平方公里范围-冯金伟博客园
运用华为云 ModelArts 平台训练短临天气预测 AI 模型

  除此之外,华为与深圳市气象局还计划探索有关 5G 的智能化应用,将先进通信技术应用在改进预警信息发布和传播上,开展气象信息发布传播技术应用和市民个性化服务,向市民提供实时预报预警和风险提示信息。

  深圳市气象局还计划基于华为云人工智能和图像识别技术,研发云雨等天气现象的自动识别技术,实现天气智能感知:利用 5G 和边缘计算提升气象观测的精度和效率,并通过摄像头采集图像生成云天全景拼图,进行网格化的精准天气预测。  

AI加持的精准天气预报将从深圳开始:两小时内,一平方公里范围-冯金伟博客园
深圳气象局基于灾害风险影响预警信息靶向精准发布系统

  从去年 9 月发布 AI 昇腾集群服务起,华为云目前已经开放了带有 2024 块昇腾 910 芯片的昇腾集群服务,众多企事业单位和科研院所已经提出使用申请。

  华为开发者大会 2020(Cloud)将于 2020 年 2 月 11 日-12 日在深圳举办,这是华为面向 ICT(信息与通信)领域全球开发者的年度顶级旗舰活动。大会旨在搭建一个全球性的交流和实践平台,开放华为 30 年积累的 ICT 技术和能力,以「鲲鹏+昇腾」硬核双引擎,为开发者提供澎湃动力,改变世界,变不可能为可能。