大数据文摘出品,作者:牛婉杨

  「爱人离世,你会把 TA 的记忆交给 AI 吗?」

  《奇葩说》的这期辩题似乎在探讨一个离我们仍遥远的科幻话题,但去年 9 月,阿里巴巴人工智能实验室真的接到了这样一个请求。

失独妈妈求助阿里:将逝去女儿做成AI,3个月后重现女儿声音-冯金伟博客园

  请求帮助的是一位上海妈妈,她的女儿因患T淋巴母细胞性淋巴瘤离世,年仅 14 岁。

  怀抱着太多孩子生前未能实现的遗憾,这位妈妈决定将女儿做成“AI”,用另一种方式缅怀她。去年 9 月,她尝试在微博向阿里巴巴人工智能实验室发出了这条消息。

  “可以把我故去的女儿做成和我互动的软件吗?”

  没想到,这条求助很快有了回应

  三个月的时间让失独妈妈重新听见女儿

  考虑许久,阿里巴巴人工智能实验室负责人、语音助手首席科学家聂再清接受了这位妈妈的求助。

  单从技术角度考虑,在足够的语料数据和算法的加持下,通过目前的语音合成技术,“复制”一个虚拟人的难度并不大。

  聂再清称,目前的技术条件下,通过个性化语音合成技术以及对话技术,需要大概十分钟的、特别干净的音频信号,就能够让我们的机器进行学习。

  但对阿里人工智能团队而言,帮这位妈妈重现女儿的音容,面对的不只是技术难点。

  首先,最大的技术问题是可用语料不足。要实现语音合成必须给算法提供大量可供训练的素材,但女儿生前留下的语音素材并不多,而且能提供的多是用智能手机录下的视频,大多环境嘈杂。据阿里团队称,所有的片段加在一起,能够用作训练的语音素材,只有短短的两三分钟。

  这就让训练难度变得极大。因此,聂再清告诉求助者,凭借现有的技术很难达到她心中理想的效果,而这也就意味着,无论技术团队如何攻坚,AI 终究不是“真实”的女儿。

  其次,除了语音合成,聂再清团队也坦诚向她表达了对“AI 女儿”认知上的担忧。当妈妈问出一个问题,“AI 女儿”是否能够以女儿的认知水平和价值观来回答,在这方面,技术难度较大。

  另外,市面现有的语音助手,例如 siri 和天猫精灵,当输入的语言超过 AI 的理解范围时,它的设定是去网络检索一个最接近的回答进行反馈,这就存在很大的不可控性。比如上个月,亚马逊的语音助手 Alexa 就因为从维基百科中提取到了一些恶意文本,劝主人“自杀”,对英国一位 29 岁的医生丹妮说出了“用尖刀刺入心脏”这样可怕的话。

  为这位妈妈做出的“AI 女儿”,也因此会存在回应的随机性,这很有可能在某些情况下冒犯到她和她的家人。

  了解了可能面对的风险后,这位妈妈和她的丈夫还是坚持了最初的想法,她表示不在乎虚拟女儿偶尔的“冒犯”,这是成长期孩子最正常的表现。之后,他们配合技术团队列出了女儿生前感兴趣的话题,希望在这些话题下进行训练,确保在某种程度上,虚拟女儿的回答是可控的。

  除了技术难点,阿里的工程师也就此与罗汉堂专家,以及外部的心理学家在技术之外的可能性上展开了探讨。三个月后,他们终于输出了一份小成果,帮助这位妈妈合成了一段女儿长达 20 秒的语音,存在了天猫精灵里。

  这段语音复原了女儿写的一篇作文,记录了她和妈妈一起去爬山的故事。

失独妈妈求助阿里:将逝去女儿做成AI,3个月后重现女儿声音-冯金伟博客园
图片来自《人物》

  尽管最终做出的音频样本与设想还有一些差距,但妈妈表示,音频开头的语气,和女儿几乎一模一样。

  关于具体的研发过程、算法实现等,大数据文摘尝试采访阿里巴巴相关负责人。但阿里表示,现阶段仍不希望在过多的聚焦在技术细节上,他们也担忧在相关伦理探讨更清晰前,这一举动会被模仿。

  美国记者自学代码,让去世的父亲在手机中复活

  想要用人工智能留住逝去的亲人,这位上海失独妈妈并不是第一例。

  2016 年,一位美国记者 James Vlahos 的父亲查出肺癌晚期,悲痛的他想要尽可能留住自己与父亲的记忆。

失独妈妈求助阿里:将逝去女儿做成AI,3个月后重现女儿声音-冯金伟博客园

  James 突然冒出了一个疯狂的想法:与其将这些信息存在纸上,不如利用 AI 让它们活过来,他决定开发 Dadbot——拥有父亲记忆的聊天机器人。

  James 首先说服了自己的家人与父亲本人,老爷子对此意外的没有任何抵触,同时还觉得很酷。于是 James 让父亲在生前最后几个月讲述其生平故事。

  接下来他开始攻克技术难关,自学代码,利用 AI 公司 Pull String 的开源软件进行开发。其中包括 140 多个相关的问题词条,并用多达 9 万个词的语料库训练 AI。

  最终,赶在父亲离世前,他完成了一个为父亲量身定制的人工智能程序,当他和家人想父亲时,就打开这个程序聊几句,这给他和他的家人莫大安慰。

失独妈妈求助阿里:将逝去女儿做成AI,3个月后重现女儿声音-冯金伟博客园
老爹,你在吗?-机器人会休息吗?傻小子。

  在 James 心中,这还差的很远,他要的不是智能的语音助手,而是那种与父亲交流时的熟悉感。但显然,9 万字的生平记录也无法填充一个真实的灵魂,于是他不得不为父亲重新制作了一块更大的“记忆拼图”。

  新的问题框架更为庞大详细,这些问题涵盖了父亲的父母,他的童年时光,学生时期,与母亲的甜蜜邂逅,职业的选择等。另外聊天机器人的训练极为枯燥,据 James 介绍,他只能频繁的与其交流,让 Dadbot 能够理解每句话的含义。同时要寻找 BUG,很多词汇机器人并不理解,需要他手动调整。为此他经常拉着全家人和 Dadbot 聊天,全方位的“轰炸”这位 AI 老爸。

  这段时期对于 James 来说也非常难熬。他不确定自己是否扭曲了对父亲的感情,也很犹豫 Dadbot 设定应该无限趋于真实的父亲,亦或是仅仅作为一个回忆道具。

  Dadbot 在成长的同时,父亲的生命也在流逝。好在功夫不负有心人,随着技术提升与不断的调整测试,Dadbot 最终在父亲临终前拥有了一定的智能表现,聊天不再是一问一答的独白,更像是有思维的对话。

  当前技术的迅速发展让这种“复制”技术的门槛迅速降低,也许很快,不止技术机构,很多非专业人员通过自学也能够完成。

  去年热播日剧《轮到你了》中,男主角就通过大量的照片和聊天记录,复原了去世的女主,在手机里创造了一只“菜奈 AI”。TA 能够用女主的声音和语气与人对话,成为了男主案件调查过程中的最大安慰。受其启发,有不少网友也分享了如何通过风格迁移等方式,让机器模仿自己的话语,制作一个 AI 版自己。

  日前,78 岁的美国间谍小说家、好莱坞编剧安德鲁·卡普兰已同意成为“AndyBot”——一个数字人,他将在云上永生数百年,甚至数千年。如果一切按照计划进行,未来几代人将能够使用移动设备或智能语音计算平台与他互动,即使在他的肉身去世很久之后,仍能得到他一生经验的宝贵建议。

  但是,这样的举动是否存在伦理问题和法律风险?其所属权如何定义?针对逝者的留存数据归谁所有的问题,文摘菌也咨询了相关专家,其表示“逝者虚拟化”仍然是一个非常新的技术领域,和目前法律界已有相对成熟共识的“克隆人”以及“AI 人格”议题都不太一致,当前法律界还没有一个定论。

  如果用 AI“还原”已逝亲人正成为一种作用于失独家庭的新可能,那么需要首先确定的是,如何让它成为辅助疗愈的手段,而不是让失去亲人的人沉溺在被技术还原的陪伴中,影响真正意义上的康复。

  在开头提到的《奇葩说》辩题中,六位辩手用了近两个小时的时间,去探讨“还原”已逝亲人是会治愈我们,还是会令我们跌入思念的深渊。当前技术条件下,尽管被“复活”的 AI 目前只能完成一些微弱的功能,距离科幻片中的场景还有很大距离,但依然值得更广泛的讨论。

  和所有的技术一样,AI 最终仍要作用于人。如何在智能和人性中实现平衡,是一道永恒的命题。

  而面对这一问题,这位想要复活女儿的妈妈早已有了自己的判断。

  “尽管技术的完善需要时间,但已经给人带来了希望,这是最重要的。”