微软与哈佛大学合作开源差分隐私平台-冯金伟博客园

  微软哈佛大学 OpenDP Initiative 合作研发并开源了首个用于差分隐私的平台。这项工作已持续了将近一年,去年九月,微软首席数据分析管 John Kahan 曾宣布项目的开展:“我们需要找到一种分析数据的方式,以释放数据的全部潜力,同时又不冒拥有数据者隐私的风险。”

微软与哈佛大学合作开源差分隐私平台-冯金伟博客园

  差分隐私(differential privacy)这一概念由来自微软研究院的 Cynthia Dwork 和哈佛大学计算机科学教授 Gordon McKay 共同研究数年,并于 2006 年提出。它能够做到在不泄露个体隐私信息的情况下,对整体数据集进行分析,得出有效结论,并防止差分攻击。

  这主要是通过添加误差或噪音来实现。适量的噪音会被添加到统计结果中,以掩盖单个数据点的贡献。通过差分隐私保护手段,任何人都无法从数据集中推断出任何特定的个人信息,甚至无法判断特定个人是否包含在数据集里。

  该项技术仍处于发展阶段,微软表示开源平台对于技术的日趋成熟和广泛使用都非常重要。“大型且开放的数据集具有超出想象的潜力,而差分隐私平台为人们贡献、协作和利用这些数据铺平了道路”。

  OpenDP 平台现已开源,可用于测试及构建。目前包含八个仓库,平台系统、核心、算法和样本示例等等都在其中,主要开发语言为 Python 和 Rust。