微软删除全球最大公开面部识别数据库MS Celeb-冯金伟博客园

新智元报道  

来源:gizmodo

编辑:张佳

  【新智元导读】据英国《金融时报》报道,微软从互联网上悄悄删除了 MS Celeb 数据库,该数库包含超过 1000 万张大约 10 万人的图像,报道称该数据库原为学术用途,但已被商业机构所用,而微软不能控制商业使用的目的。

  早在 2016 年,微软就建立了一个拥有超过 1000 万张图像的数据库,其中大约有 10 万人。近日,据英国《金融时报》报道,微软从互联网上悄悄删除了这个名为 MS Celeb 的数据库。

  该数据库最初于 2016 年发布,被微软描述为世界上最大的公开面部识别数据库,并用于培训全球科技公司和军事研究人员的面部识别系统。

  据称,它被称为“Celeb”,意味着数据库中的面孔来自公众人物。但据英国《金融时报》报道,数据库中的许多人并没有授权这一行为。相反,他们的图像是通过“知识共享”(Creative Commons )许可证来抓取图像和视频搜索的。(根据许可证,你可以将照片重新用于学术研究。照片中的人物并不一定授权许可,而是版权所有者授权。)

  “这个网站是用于学术用途,”微软对《金融时报》说:“它是由一位已经不在 Microsoft 工作的员工运行的,并且已被删除。”

  真能彻底删除吗?

  然而,由柏林的研究员 Adam Harvey 发现的 MS Celeb,也包含了所谓的“可以说是私人”的图像,如安全记者和作者。Adam Harvey 负责管理名为 Megapixels 的项目,这个项目揭露了有关此类数据库的详细信息。

  在接受采访时,Adam 还表示即使 MS Celeb 已被删除,其内容仍在网络上共享。“你不能让数据库消失。一旦你发布它,人们下载它,它就存在于全世界的硬盘上,”他说。

  不幸的是,事情并不那么简单。MS Celeb 已被多家公司使用,包括 IBM、松下、英伟达和日立等。

  微软本身一直在公开反对将这种技术作为政府监督的一种形式。在 2018 年 12 月的一篇博客中,微软呼吁各公司建立保障措施,并要求政府开始规范面部识别技术。4 月早些时候,据报道,微软还拒绝了加利福尼亚州一家执法机构的要求,要求在警车和身体摄像头上安装面部识别技术,因为这样做会对妇女和少数群体造成不相称的影响。

  然而,微软的反对和良好的意图仅仅到此为止。《金融时报》指出,任何之前下载过该数据的学术机构或公司仍然可以使用 MS Celeb 数据库,并且该数据库仍在 GitHub, Dropbox 和百度云上共享。Gizmodo 联系微软征求意见,但没有立即收到回复。

  参考链接:

  https://gizmodo.com/microsoft-quietly-pulls-its-database-of-100-000-faces-u-1835296212 

  https://www.engadget.com/2019/06/06/microsoft-discreetly-wiped-its-massive-facial-recognition-databa