一条淘宝直播链接的背后,没有那么简单-冯金伟博客园

  摘要

  淘宝直播深度用户,也不一定了解直播背后的技术。

  「直播经济」恐怕是 2020 年年度最热的词汇之一了。

  当人们办公、上学、购物全部转移至线上,线上市场前所未有地迅速膨胀起来。市场、县长、明星、央视主播…… 化身「主播」带货,也让「主播」这个看似高不可及的职业辐射的面积更加宽泛。网络公开数据显示,今年国内直播用户规模将达到 5.24 亿,市场规模将破 9000 亿元,去年「蹿红」的行业,未来将持续热门。

  这一趋势,在淘宝平台上体现的尤为明显。

  不久前,阿里巴巴披露的财报显示,淘宝直播连续 8 季度翻倍增长,增速持续超 100%。其中,商家直播带来的成交占比超 6 成。淘宝直播不但成为阿里巴巴创新业务中的新型增长引擎,更驱动商家业绩的增长。

  也就是说,10 个买家中有 6、7 个人是通过观看直播的方式达成交易,更不用提未达成交易的人群。电商直播改变了卖货、买货的业态与商业逻辑,以至于小孩都能随便说上几句直播口头禅,「OMG,超好看」、「买它」、「3、2、1,上链接」。

一条淘宝直播链接的背后,没有那么简单-冯金伟博客园

  凡尔赛宫直播中淘宝

  但是,很多人可能不了解,即便是看起来最为简单的常规直播操作「3、2、1,上链接」,也是一个极为复杂的技术活儿。延时、卡顿不仅仅影响互动率、成交率、客单价,还影响用户的使用观感、体验、好评度。当然,技术给直播行业带来的变革是全方位的。

  技术改变直播

  淘宝主播林珊珊自 2019 年开始,全面转向淘宝直播卖货,仅在去年一年店铺销售额就达 8 亿左右,目前,店铺粉丝累计接近 1000 万。

  作为国内最早一批「吃螃蟹」的电商网红,技术给电商直播行业带来的多样化探索,林珊珊团队感触颇深。

  以「3、2、1,上链接」模式开品为例,林珊珊淘宝直播后台最高在线粉丝数量为 20 万,如此庞大的在线粉丝用户数,一旦在直播最后上链接的关键时刻,出现延迟,后果不堪设想。评论区可能瞬时间被海量的粉丝留言淹没,每一条不满、差评对于淘宝主播而言,都极为致命。

  不只是粉丝粘性与好评度困扰着主播。大多数主播在经历长达数十个小时的直播后,嗓子因过度使用,不可避免地受到物理性损伤,嗓音会出现嘶哑。这时候,如有虚拟主播功能,能在很大程度上缓解主播的高强度劳动负荷,解放生产力。

  据淘宝主播林珊珊团队负责人凌霄介绍,林珊珊直播间的虚拟主播颇受粉丝欢迎,有 90% 的点击量来自粉丝,很多粉丝后半夜睡不着觉时,会「撩」虚拟主播与她进行互动。虚拟主播带来的数据量也非常可观,即便在半夜也有多达 240 人的增粉。

一条淘宝直播链接的背后,没有那么简单-冯金伟博客园

  淘宝主播林珊珊团队负责人凌霄淘宝

  「如果一个粉丝在店铺中成交 1 万元,240 人将带来 240 万,虚拟主播功能为我们增加不少 GMV(成交总额)。」凌霄对采用虚拟主播前后的数据变化感到一些意外。

  实际上,电商直播从开场到收官,并不意味着结束。直播带货具有很强的「长尾效应」。通过直播回放功能、智能数据分析两项关键技术,才能进一步实现商业闭环。

  以往电商平台没有回看功能,错过直播,意味着永远错过商品信息详情,对卖家、粉丝双方都是损失。回看功能属于刚性需求,从营销机制来看,不单单保障粉丝知晓信息,充分利用碎片化时间,对直播博主也是一种「隐形」保障。

  凌霄谈到一组数据,「林珊珊淘宝直播结束两三天后,直播间的成交额依然在不断增长。差不多有 15%-20% 是通过直播回放实现成交的。」

  直播结束后,林珊珊团队还会根据每一个时间段的数据分析锚点,考核直播状态,分析出直播最佳路线图,为下次直播「避障」。

  直播技术为每一位用户带来视觉、感知与体验的升级,但很多人却不了解这些直播技术的潜在「能量」。

  背后的「烧脑」技术

  无论是「3、2、1,上链接」、「回放」功能、智能数据分析、智能直播间,还是虚拟主播,背后的技术构成都极为复杂。

  单单虚拟主播一项功能,就集合了 AI 人工智能领域中几乎所有的核心技术。虚拟主播是人、货、场的统一体,涉及一系列复杂算法与工程体系。从外在形象、表情动作来看,协调的肢体动作、面部表情,运用到 AI 算法模型以及复刻技术。

  除了外在,虚拟主播更为重要的是内在功能。比如,与用户互动,回答用户提问,理解用户意图,商品介绍,这些功能则囊括了 NLP(自然语言处理)、语音合成、机器智能、图像智能在内,AI 技术的四大方向。

一条淘宝直播链接的背后,没有那么简单-冯金伟博客园

  阿里巴巴达摩院资深算法专家陈海青淘宝

  在阿里巴巴达摩院资深算法专家陈海青看来,从 2G、3G、4G 甚至再到 5G,是文本、语音、图像到视频的升级,也是从单模态到多模态的演进。直播属于多模态场景,虚拟主播与场景融合,与用户互动,本质上是回到了感知+认知阶段。

  陈海青认为今天直播行业最大的技术挑战来自于动态的交互过程,不同时间段,商品的卖点、展示内容、场景交互都是实时的。人物驱动需要基于实时的大数据决策能力。

  特别是,人物驱动的关键技术难点在于声音处理,即人物驱动个性化、情感化 TTS(从文本到语音),如跨语音、语言转换,语音、语调、抑扬顿挫的情感控制。不同的技术解决方案、细节处理差异,可能导致用户体验天壤之别。

  此外,「3、2、1,上链接」、「回放」功能涉及到大规模低延时、窄带高清、存储等云计算技术。据了解,淘宝直播利用阿里云在全球 70 个国家地区,2800+ 节点,卡顿率下降 55%,播放延时低于 1s,比业界平均水平下降 72%,自研 S265 编码器相比业界通用的 X265 编码器最多可以节省 40% 的带宽。

  淘宝内容社交互动团队技术负责人梁舒举了一个例子,双十一期间,薇娅、李佳琦两位主播直播间人数高达 3000 万以上,商品上架后,一秒之内就产生巨大的高并发需求,对服务器、网络的稳定性要求苛刻。

  正是这些大家都习以为常的直播场景,恰恰需要长期的技术积淀与实战积累。

  技术普惠:降低直播门槛

  从 2015 年算起,淘宝直播在技术研究领域已经积累五年之久。2020 年,直播行业迎来一个新的节点。受到疫情影响,今年 2 月以来,直播行业业态更加丰富、多元化,商家店主、娱乐明星、KOL、柜姐、农民纷纷涌入电商直播平台,整个行业主播量级呈直线式上升。

  问题也随之而来,相当一部分新增主播没有直播经验,而直播是一个看起来容易,做起来却很难的行业,具有一定的准入门槛。比如,怎样运营粉丝,如何与粉丝保持互动、维系关系,如何以较高的用户接受度介绍、展示商品。

  再比如,如果想深层次挖掘直播信息、用户需求,还需要专业的数据分析师。据了解,市场上一位初级数据分析师的月薪约为 2 万元,运营成本对于刚刚起步的中小主播、商家或者柜姐、农民而言,无疑是一个隐形的屏障,阻断了他们更多的可能性。

  所以,只有技术才能带来直播业态颠覆,让机会均等化。

一条淘宝直播链接的背后,没有那么简单-冯金伟博客园

  淘宝直播产品负责人岱妍淘宝

  今年年初,淘宝零门槛、免费开放包括「播小宝」智能数据分析师、虚拟主播等淘宝直播技术。淘宝直播产品负责人岱妍认为,一方面,淘宝的愿景是帮助平台上一千万家中小企业获利,帮助商家生长出新的能力。在行业爆发增长的背景下,快速提升他们的专业性。

  另一方面,淘宝一直在思考如何技术普惠,怎样让田间地头的农民伯伯也能享受到和世界五百强公司一样的智能数据分析服务。

  尤其是,整个直播行业已经走到专业化、精细化运营、个性化的分岔路口,未来专业化运营将成为绝大部分主播的重要命题。

  在岱妍看来,不论是虚拟主播,直播间的低时延、窄带高清技术,都是综合性直播指标的提升。淘宝直播的很多玩法都经过了长时间的测试与反复测算,方才全量面世。

  「我们更看重淘宝通过直播的形式,升级原有的经营方式,将手淘中没有享受到的服务,做到更多用户触达。我们未来最为关注的是通过商业化方式帮我们的产品去做更高的进阶,形成一个可持续发展的商业模式,给客户带来真正的商业价值。」岱妍总结称。

  图片来源:阿里巴巴淘宝