阴谋论下的人脸识别简史-冯金伟博客园

  图片来源@视觉中国

  文丨老衬

  众所周知,人工智能主要围绕感知、认知以及创造这三种能力。

  感知能力包括人脸、语音、图像识别、机器翻译等,认知能力包括阿法狗下围棋、自动驾驶、数据预测等,创造能力包括作曲、绘画、作诗等。创造能力我们人类还遥遥领先,短期内不会被超越,但认知和感知能力,目前已经在商业领域得到广泛应用。

  2015 年,老衬创业一款家居 App,决定植入市场还属空白的一个 AI 功能,需要 SLAM(位置定位与建图)这种感知技术,找商汤等头部 AI 公司接触一圈,既没有 SDK 也很少相关研究,最后只能和国外公司购买,过程中浪费了大量时间和人力物力。

  那时查阅国外大量的 AI 资料发现,人脸识别技术发展背后,其实主要依赖美国极为复杂的政府和军方关系,如今人脸识别技术早已应用在短视频和直播等热门领域,但这个话题至今在国内还是空白,所以籍此机会,为大家八卦一篇野史。

  01

  人脸识别技术的早期阶段,有着非常浓重的政治色彩,甚至与核武器都有一些渊源。人脸识别之父伍迪布莱索(Woody Bledsoe),早在 1960 年以前,就已经在研究机器识别的相关技术,还得到了美国最秘密机构—中央情报局(CIA)的赞助。

  情报机构的赞助背景,使得伍迪布莱索对于人脸识别技术基本缄口不言,直到 2000 年以后 CIA 逐渐解密,大家才公认布莱索是最早研究人脸识别技术的科学家,而且早在 1965 年就首次获得成功,1967 年再次优化效率,只是出于“政治原因”没有论文问世。

阴谋论下的人脸识别简史-冯金伟博客园

  伍迪布莱索 1921 年出生于美国俄克拉荷马州的梅斯维尔镇,家里有 12 个兄弟姐妹,生活过得非常贫困,父亲在他 12 岁时就去世了,为了补贴愈加拮据的生活,他高中毕业就开始做苦力活,每天干活 12 个小时,并且没有周末,后来因为二战爆发,他才辞掉工作去参军。

  军旅生涯让伍迪布莱索从一个参战者角度见识到了原子弹的力量,这让他对核武器异常着迷,二战胜利之后,他迫不及待回到学校,2 年半就完成了大学学业,然后又去伯克利读到博士,毕业后直接去了 Sandia 公司从事核武器研究,和氢弹发明者之一的乌兰做了同事,还亲眼目睹过一场氢弹试验。

  伍迪布莱索的编程技术,早期纯粹是为了模拟和计算核爆炸数据,之后随着对计算机理解愈加深刻,他开始喜欢上机器替代人类识别事物这件事,和 Sandia 公司的同事布朗宁共同研究出一个称为N元组的算法,应该就是机器识别这个领域的最早雏形,那时他的梦想是未来造出一台识别所有事物的机器人。

  1960 年,伍迪布莱索和两个同事离开 Sandia 公司,共同成立一家新公司,名叫全景(Panoramic)。相比较伍迪布莱索后来的经历,全景公司期间的大多数工作至今都还是谜,大概那时研究的项目大多都与国防有关。

  中央情报局(CIA)2001 年解密一个资料,二战期间 CIA 发起过一个项目叫做 MKUltra(控制人脑用于获取情报、逼供等),这个项目因为拿人体做实验,在美国引起很大舆论,MKUltra 项目的研究范围很广,合作了 80 多家顶尖科学机构,其中就包括全景公司。

  另一个是 2014 年 King-Hurley 公司的解密,King-Hurley 向 MuckRock(美国一个和政府索要信息公开的非营利组织)公布 1963 年他们就已经在研究人脸识别技术,而且合作者就是伍迪布莱索。值得一提的是 King-Hurley 也被证明是中央情报局的壳公司,

阴谋论下的人脸识别简史-冯金伟博客园

  King-Hurley 的解密透露,伍迪布莱索在 1964 年汇报进度时称,头发生长、面部表情和衰老状态,这三种因素超出了当下的计算机能力,建议增加预算,寻找新方法。1965 年底,他终于在一款称为 RAND 的平板电脑上,第一次实现了人脸识别。

  CIA 在 2005 年又一次解密,伍迪布莱索 1967 年离开全景公司以后,也许是最后一次和 CIA 合作了人脸识别项目,除他以外还有一个科学家叫彼得哈特(Peter Hart),后来哈特引领了斯坦福研究所(后独立成为著名的 SRI)的计算机视觉技术。CIA 的项目叫做“快速筛查照片和肖像数据库”,解密文件称该项目可以将搜索时间缩短 100 倍。哈特后来回忆,出于“政治原因”,他和布莱索当时的研究,不能发布公开论文。

  到了 1970 年,有朋友告诉伍迪布莱索,贝尔实验室里有位叫莱昂哈蒙(Leon Harmon)的科学家也在研究人脸识别,1973 年 11 月,哈蒙发表了“人脸识别”第一篇公开论文,因此登上了《科学美国人》封面。

  这是布莱索在 1965 年就应该获得的荣誉,此时他已经开始研究自动推理,还是评价了哈蒙的人脸识别论文说,哈蒙的研究至少还落后他和哈特 5 年时间。

  在随后的二十多年里,伍迪布莱索在自动推理领域获了奖,又担任过美国人工智能协会主席,但他在人脸识别领域的巨大成就,很长时间以来并没得到世人认可,这位科学家 1995 年 10 月 4 日去世时,身份跟人脸识别没有太大关系。

  02

  人脸识别的技术发展,从伍迪布莱索开始,大部分时间都是由美国政府部门主导。

  莱昂哈蒙发完论文,此后也都是在做计算机视觉相关的研究,他离开贝尔实验室去了凯斯西储大学,担任生物医学工程系主任,之后指导博士生托马斯克鲁拉(Thomas Collura)在脑电图领域获得了成功。

  1991 年,特征脸(Eigenface)算法被应用在人脸识别,首次实现了自动检测人脸。这项技术是霍普金斯大学的希洛维奇(Sirovich)提出,再由麻省理工学院(MIT)“连接科学”的创始主任亚力克斯彭特兰(Alex Pentland)发扬光大,彭特兰在 2012 年被《福布斯》评为“全球 7 个最强数据科学家之一”,获此殊荣的还有谷歌创始人拉里佩奇。

阴谋论下的人脸识别简史-冯金伟博客园

  彭特兰对人脸识别的另一个贡献,是后来他亲自参与了人脸识别技术的首次商业化,也是和国防部合作。

  1993 年,国防部旗下的高级研究局(DARPA)发起一个 FERET 项目,在全美选拔五组人脸识别领域的顶级专家团队,研发最先进的人脸识别算法和数据库,主要目的用于安全监控和情报获取,亚力克斯彭特兰就是其中一组,国防部此举后来被很多人称为计算机视觉元年。

  FERET 项目从 1993 年 9 月份开始,总共经历了三个阶段,每个阶段的时间都是一年。

  第一年考验五组团队的科研能力,只有三组团队成功了(包括彭特兰所在的 MIT 组)。第二年这三组团队继续深入研发和完善可用性。第三年测试性能和制定标准,他们成功建立了第一个人脸数据库,同时确定了人脸识别技术和性能检测的所有流程标准。

  FERET 项目从 1997 年开始在各大政府部门商用,而且变更了项目管理权,从国防部旗下的 DARPA 研究局移交给了美国商务部旗下的技术研究院(NIST),由 NIST 研究院开始普及商用,并且继续完善优化算法和性能,到今天,NIST 已经拥有 200 多种人脸识别算法,还有超过 800 万人的人脸数据库。

  2000 年以后,NIST 研究院又在 FERET 项目基础上做了延伸,先后发起两个新项目 FRVT 和 FRGC,FRVT 是评估技术可用性,测试算法系统性能,为采购技术的相关部门提供检测报告。FRGC 则是面向市场上的公司和团队,联合其他部门的定制化需求,发布竞标比赛,FRVT 负责对接评估,帮助不同部门完善人脸识别系统的个性化要求。

  美国谍战大片中很多关于人脸识别的剧情,在现实生活中其实早已实现。美国军方从 2004 年开始建立自动化生物识别系统(ABIS),不仅包括人脸识别,还有虹膜、指纹、DNA 等生物数据,这个数据库大约有 800 万个身份信息,而且正在快速增长。

  比较知名的应用记录是在 2011 年,美国军方承认使用人脸识别来寻找本拉登,其他诸如警察局取证、机场监视等已经不胜枚举。

  03

  2010 年,随着 Facebook 加入人脸识别功能,人脸识别开始走向个人。

  从支付到美颜,全球互联网公司纷纷跟进,2017 年苹果 iPhone X 首次发布人脸解锁功能,抢购一空同时引爆了市场,如今人脸识别已经应用在了方方面面,短视频、直播这些每天都会高频出现在我们身边。

  近期,美国一家人脸识别公司 Clearview AI 因为客户名单泄露又引起了轩然大波,这家公司在社交媒体上抓取了 30 多亿张照片,可以精准查询用户的敏感信息,天使投资人是贝宝(PayPal 类似支付宝)创始人,也是美国著名的科技捕手彼得蒂尔(Peter Thiel)。

阴谋论下的人脸识别简史-冯金伟博客园

  Clearview AI 一直声称其合作对象是政府部门,其实早在 2018 年,他们就辅助一位亿万富豪,获取女儿在曼哈顿餐厅的约会情景,包括约会者的身份信息。此次他们被入侵,泄露出来的客户名单长达 2200 多个,包括 NBA、百思买、梅西百货、沃尔玛等 27 个国家/地区的不同机构和个人,并且 Clearview AI 是在全球抓取照片,不仅限于美国。

  如今 Facebook、Twitter、YouTube 等社交媒体陆续禁止了 Clearview AI 抓取,但这种以贩卖个人敏感信息为商业模式的行为,市场早已有之。

  与 SaaS 的软件即服务一样,很多市场调研、大数据类机构都自称自己是人脸识别即服务,这触发了人们又一次的科技伦理讨论,如果我们个人的敏感信息被大量私人机构掌握,未来将会带来什么样的后果。

  04

  疫情当前,除了短视频、直播以外,新的防疫“高科技”也火了,刷脸验证身份以及自动测量体温的设备开始广泛应用。

  车站、酒店、商超、小区、办公区等公共场所均有摆放,只要有人从镜头前经过,后台工作人员就能获得数据,甚至无需摘下口罩,不仅避免了交叉感染,也大大提升了检测效率。

  人脸识别技术包括图像采集、人脸定位、身份确认等多种学科,目前国内技术较强的公司有商汤、旷视和 BAT 等,大多数人脸识别 App 和硬件设备,都是直接采购这些公司提供的 API/SDK,不用自己开发。

  当机器被赋予了更多能力,海量数据汇总以后的评估预测会超出我们人类的智慧很多,能够极大的优化工作效率以及预防犯罪,但与此同时,这个“黑匣子”同样也引发了很多令人不安的伦理问题。

  除了大量讨论 AI 未来的不可控以外,近在眼前的隐私问题,以及大家普遍关注的失业可能,就已经迫在眉睫。

  机器开始承担多种复杂化工作,而且效率远胜人类。比如自动驾驶,我国仅货运司机数量已经超过 3000 万,出租车加网约车司机数量更多,机器学习远超个人学习新技能的速度,那么随着 5G 快速发展,类似失业这种现象将不可避免。

  我们显然会拥抱 AI,但同时也要敬畏和警惕新科技。

  参考资料:

  1、《纽约时报》:Before Clearview Became a Police Tool, It Was a Secret Plaything of the Rich

  2、《BuzzFeed》:Clearview’s Facial Recognition App Has Been Used By The Justice Department, ICE, Macy’s, Walmart, And The NBA

  3、《NIST》:Face Recognition Technology (FERET)

  4、《连线》杂志:The Secret History of Facial Recognition