隐私计算的各大参与者

【声明】本文为AdamsLee原创,转载请注明出自围炉网并保留本文有效链接:隐私计算的各大参与者, 转载请保留本声明!

随着大数据技术的不断发展以及政府对隐私保护的重视程度的不断加大,越来越多的学者和企业都加入到隐私计算的阵营中。本文梳理总结当前已知的隐私计算的主要参与者,以及其主要采用的技术。

隐私计算技术目前主要分为六大流派:多方安全计算、联邦学习、可信硬件环境、安全屋、同态加密、其它。另外在隐私计算产品中往往会涉及多个隐私计算技术来期望达到更广泛的适用场景。

  • 多方安全计算(MPC or SMC: Secure Muti-Party Computation)

    • 多方安全计算理论是由图灵奖得主姚期智教授在上世纪80年代提出的解决一组互不信任的参与方之间在保护隐私信息以及没有可信第三方的前提下协同计算问题而提出的理论框架。

    • 目前主要的技术分支有两个,一个是姚期智教授提出的混淆电路(Garbled Circuit),另外一个是由图灵奖得主Adi Shamirs教授提出的秘密分享(Secret sharing)

    • 目前业界公认的只要是场景基于多方数据进行联合建模,且各自原始数据不对外输出,由中心方进行协调的建模都可以称为联邦学习。

    • 最近几年MPC在数学原理上并没有什么特别大的突破,更多的是工程方面的突破与进展。采用多方安全计算技术实现隐私计算的参与者众多,主要有以下技术公司。这些公司身上也多多少少可以看到联邦学习的影子。

      • 蚂蚁摩斯

        • 蚂蚁摩斯(ANT MORSE)安全计算利用安全多方计算、隐私保护、区块链打造数据安全共享的基础设施。底层主要借助秘密分享(Secret Sharing)、哈希散列、同态加密(Homomorphic Encryption)、混淆电路(Gabled Circuit)等算法实现。

      • PlatON以及矩阵元

        • PlatON和矩阵元(Juzix)都属于万向集团旗下,其技术同源。两者都结合区块链给出

        • 矩阵元2018年推出了基于混淆电路的JUGO安全多方计算平台,2019年联合万向区块链实验室推出支持隐私计算的新一代联盟区块链系统平台PlatONE.

        • JUGO特性支持semi-honest通用两方算法:GC+OT;支持Frutta编写的IDE(通过编译器将Frutta语言编写的程序转换成电路),提供MPC算法的SDK,用户使用IDE和SDK进行开发。

      • ARPA

        • 目标是将我们的安全计算网络部署为适用于任何一个区块链系统的layer2解决方案。

        • 智能合约用作连接区块链和计算网络的桥梁。主要的概念是设计一个通用的MPC proxy,连接区块链和计算节点,数据提供者通过秘密分享的方法把数据分发到计算节点(为安全,数据提供者会参与到计算节点中去),计算结果会发给数据消费者。

      • 华控清交

        • 姚期智教授担任首席科学家,背靠清华大学人才库,技术实力雄厚。

        • 平台采用技术以秘密分享为主结合其他隐私计算技术。

      • 富数科技

        • 富数科技的FMPC多方安全计算产品以及最近发布的Avatar提供私有化部署的方式,通过秘密共享,混淆电路,同态加密等多种技术,实现安全多方求交、安全统计、安全矩阵运算等多种算子。在合作方之间实现数据安全对齐融合、数据安全计算,安全学习建模,运行加密模型运算。

      • 数牍

        • 2019年创立的初创公司,核心技术也是融合秘密分享、同态加密、混淆电路等安全计算技术。联合创始人兼CTO是联邦学习专家。

      • Sharemind

        • 爱沙尼亚语公司Cyber​​netica的基于MPC的方案,曾提出基于MPC计算卫星相撞的可能性而不用暴露卫星的轨道数据。

      • Partisia

        • 丹麦公司,实现了基于隐私保护的双向拍卖。丹麦甜菜拍卖系统可能是安全多方计算实际应用中最著名的实例。

        • 其首席密码专家Ivan Damgard是Aarhus大学教授和密码学研究所的负责人,国际密码学研究协会研究员,2015年RSA杰出贡献奖获得者。

      • Sepior

        • 从Partisia分出来的。CTO Jakob Pagter同时也是Partisia的co-founder。主要利用MPC技术提供密钥管理的解决方案。

      • Unbound tech

        • 主要提供的是加密和密钥存储管理服务。3大产品分别做密码管理Unbound Key Control,物联网Crypto-of-Things,资产管理 Crypto Asset Security Platform

      • Facebook – Crypten

        • CrypTen是Facebook在2019年10月开源的,用于多方安全计算(MPC)的框架。其底层依赖于深度学习框架PyTorch。

      • 其它一些大学机构

        • 波斯顿大学的Azer Bestavros教授领导的MPC框架曾用于BWWC分析男女性别间的工资差异

        • MIT Enigma提出MPC与区块链结合的项目

    • 很多技术公司的MPC方案并未开源,而学术界则有不少开源的项目,但目前来看,这些项目离商用还有较大的差距。这些项目的状态可参考《SoK:安全多方计算通用框架》

  • 联邦学习((Federated machine learning/Federated Learning)

    • 2016年由谷歌最先提出,原本用于解决手机端用户在本地更新模型的问题。目标是保护终端个人隐私数据的前提下,在多参与方之间开展高效率的机器学习。

    • AAAI Fellow 杨强教授与微众银行随后提出了基于“联邦学习”(Federated Learning)的系统性的通用解决方案,可以解决个人(2C)和公司间(2B)联合建模的问题。联邦学习FATE (Federated AI Technology Enabler)是微众银行AI团队自主研发的开源联邦学习框架,为联邦AI生态提供了一种安全计算框架。

    • 为了加速“联邦学习”的普及与落地,微众银行于2018年10月向IEEE标准协会提交关于建立联邦学习标准的提案——“Guide for Architectural Framework and Application of Federated Machine Learning”(联邦学习基础架构与应用标准)。该立项提案已于2018年12月获批。由微众银行主办的IEEEP3652.1(联邦学习基础架构与应用)标准工作组第一次会议在深圳成功召开,此次会议的召开也正式宣告“联邦学习”走入行业规范。

    • 最近几年机器学习的兴盛和联邦学习的逐步规范,其参与者在快速增加

      • Google-TensorFlow Federated

        • 谷歌大脑团队2019年2月发布了开源的联邦学习开源框架TensorFlow Federated。TensorFlow Federated运行于谷歌的开源深度学习框架TensorFlow之上,方便科研人员和应用开发者基于分布式的数据(即数据没有集中在一起)来训练全局模型。

      • 微众银行

        • 杨强教授与微众银行是联邦学习FATE框架的构建者,在联邦学习生态中具有非常大的影响力

      • 蚂蚁金服-共享智能

        • 推出共享智能,提供分别基于MPC和TEE的共享学习框架,其本质是TEE, MPC, 联邦学习的拼盘方案。

      • 百度-PaddleFL

        • 百度开源基于飞桨(PaddlePaddle,百度在2016年开源的深度学习平台)开源框架的联邦学习框架 PaddleFL

      • PyTorch – PySyft

        • Facebook PyTorch的联邦学习项目,由OpenMined开源社区主导

  • 可信硬件环境(TEE)

    • 目前较为成熟的引入了可信执行环境的技术主要有ARM TrustZone和Intel SGX,在这两种技术中,外界应用均无法访问处于可信执行环境中的应用所使用的的内存空间

    • ARM TrustZone

      • TrustZone技术将中央处理器(Central Processing Unit,CPU)的工作状态分为了正常世界状态(Normal World Status,NWS)和安全世界状态(Secure World Status,SWS)。

      • 当CPU、处于正常状态时,任何应用都无法访问安全硬件设备,也无法访问属于安全世界状态下的内存、缓存(Cache)以及其他外围安全硬件设备。

    • Intel – SGX

      • SGX全称Intel Software Guard Extension,是Intel在2013年推出的指令集扩展, 旨在以硬件安全为强制性保障, 不依赖于固件和软件的安全状态, 提供用户空间的可信执行环境。

      • 将合法软件的安全操作封装在一个enclave中,保护其不受恶意软件的攻击,特权或者非特权软件都无法访问enclave。一旦软件和数据位于enclave中,即便操作系统也无法影响enclave里面的代码和数据。Enclave的安全边界只包含CPU和它自身

    • 微软-Open Enclave

      • Intel自己的SGX 库运行速度比较慢,所以微软开发了一个开源的SDK,运行效率较高

      • 主要是为TEE提供一个通用的软件库,来加速TEE软件开发过程和提高性能; 目的是推广使用基于TEE的技术

      • 在Azure有提供预装open enclave SDK的VM

    • 百度-MesaTEE

      • 2018年百度安全与Intel联合发布MesaTEE下一代可信安全计算服务框架。并在百度区块链引擎BBE中被使用

      • Rust SGX SDK 是一个来自百度安全实验室的开源项目,它将 Rust 语言和 Intel SGX 技术进行结合,可通过该项目用 Rust 语言编写 Intel SGX 应用程序。

    • Oasis Lab – Ekiden

      • Oasis Labs 由美国加州大学伯克利分校计算机系教授 Dawn Song 宋晓冬教授创办

      • 利用基于硬件的可信执行环境(TEEs),比如英特尔SGX,Ekiden能够在安全的离线环境中提高吞吐量。

  • 安全屋

    • 安全屋主要是通过物理方式对数据的所有权和使用权进行分离,各个数据提供方按照主控平台的接入规范统一接入平台,而所有管理权限由主控平台统一提供

    • 通过安全屋的方式,可以一个构建包含了数据源方,算法方,数据需求方,渠道方等多种用户角色的生态系统。安全屋在此生态中作为一个中立的第三方,通过安全的方式引入多样性的数据源,并协调和保证各参与方能够各司其职,形成数据流通生态闭环。

    • BaseBit

      • 主要为医疗数据打造安全协作的平台。通过将各医疗机构的数据导入平台,统一在平台内进行数据处理。计算结果输出需要经过授权

    • UCloud

      • UCloud安全屋产品是国家重点研发专项“云计算和大数据”研究取得的重要阶段成果,旨在支持云服务提供者在其数据所有权不变的情况下实现数据使用权的可信流通共享。

      • 安全屋使用堡垒机隔绝外部访问,区块链保证数据操作透明可追踪,分级密钥管理和访问权限控制确保数据安全。

  • 同态加密

    • 同态加密是指这样一种加密函数,对明文进行环上的加法和乘法运算再加密,与加密后对密文进行相应的运算,结果是等价的。由于这个良好的性质,人们可以委托第三方对数据进行处理而不泄露信息。

    • 同态加密由于其数学理论基础要求特别高,所以参与者一般都是技术实力特别高的大公司或者大学教授

    • Duality – PALISADE

      • Gartner提名的2019年隐私技术3个酷供应商之一

      • 技术实力雄厚:美国以色列裔的图灵奖获得者, MIT教授, Shafi Goldwasser(Shafi Goldwasser是密码学的图灵奖获得者)。MIT密码学教授Vinod Vaikuntanathan,NJIT密码学教授Kurt R. Rohloff;

      • 开源部分基础库(PALISADE Lattice Cryptography Library),主力产品(SecurePlus™ platform)

    • IBM – Helib

      • 全同态加密由克雷格•金特里(Craig Gentry)在2009年提出,他在IBM Wason实验室研究工作了10年,2019年才跳槽去了Algorand

      • IBM 在2020年6月推出了为MacOS和iOS开发同态加密的工具包

    • Microsoft – SEAL

      • SEAL(Simple Encrypted Arithmetic Library)是微软开源的同态加密库,基于C++11编写

    • IXUP

      • 澳大利亚的一家技术公司,基于微软的SEAL同态加密库构建的平台

    • Google – Private Join And Compute

      • 谷歌2019年中推出的技术框架型项目,偏重于使用同态加密技术。对重叠的数据集进行某些类型的计算,从而汇总两个数据集中的有用信息。

    • Inpher – TFHE

      • JP摩根参与了投资

      • Gartner提名的2019年隐私技术3个酷供应商之一

      • 客户包括荷兰国际集团比利时银行( ING Belgium )和法国国防承包商Thales。

      • 法国凡尔赛大学副教授,同态加密专家,NICOLAS GAMA;瑞士EPFL数学教授Dimitar Jetchev

      • 提供开源的框架TFHE

    • Enveil

      • Enveil创始人 Ellison Anne Williams 曾作为高级研究员为美国国家安全局(NSA)做了12年保密技术开发工作。2016年,在美国政府情报机构背景的投资公司In-Q-Tel支持下,她基于在NSA时研究的技术创立了这家公司。

      • Enveil技术的核心创新点是其同态加密的大范围实现。Enveil ZeroReveal Cloud Fabric 包括客户端和服务器应用。客户端应用能加密公司执行的搜索操作。服务器应用则相当于指挥全局的大脑,知道该怎么在不解密的情况下处理收到的加密搜索请求。

    • 美国情报高级计划研究署IARPA-HECTOR

      • HECTOR计划开发一套工具和编程语言,以便在保持加密状态的同时处理数据,旨在帮助具有高级加密功能的安全信息技术系统降低成本及风险,并促进部门和机构之间的合作。目前IARPA已向Galois公司、IBM、Stealth软件技术公司、西北大学及普渡大学领导的团队授予了HECTOR研究合同,并任命来自麻省理工学院林肯实验室和约翰霍普金斯大学应用物理实验室的专家负责测试和评估工作。

  • 其它

    • 隐私计算技术除了上面提到的五大类技术以外,还有比如零知识证明(Zero-Knowledge Proof),隐私信息检索(Private Information Retrieval – PIR),差分隐私(Differential Privacy)等等。

    • 隐私信息检索(Private Information Retrieval – PIR)技术是由Chor B等在1955年提出解决保护用户查询隐私的方案。主要目的是,保证查询用户在向服务器上的数据库提交查询请求,在用户查询隐私信息不被泄漏的条件下完成查询,即在过程中服务器不知道用户具体查询信息及检索出的数据项。

    • 零知识证明(Zero-Knowledge Proof),是由S.Goldwasser、S.Micali及C.Rackoff在20世纪80年代初提出的。它指的是证明者能够在不向验证者提供任何有用的信息的情况下,使验证者相信某个论断是正确的。

    • 差分隐私(Differential Privacy)是Dwork在2006年针对数据库的隐私泄露问题提出的一种新的隐私定义。主要是通过使用随机噪声来确保,查询请求公开可见信息的结果,并不会泄露个体的隐私信息,即提供一种当从统计数据库查询时,最大化数据查询的准确性,同时最大限度减少识别其记录的机会,简单来说,就是保留统计学特征的前提下去除个体特征以保护用户隐私。

    • Baffle

      • Gartner提名的2019年隐私技术3个酷供应商之一

      • 主要使用传统的AES加密技术,提供安全数据库访问的产品给企业用户,同时也与云服务商开展合作。比如密文数据查询(Baffle将SQL/NO SQL的数据加密存储,上层应用在密文数据上查询后显示结果)

    • 苹果

      • 在2016年WWDC主题演讲中,苹果工程副总裁Craig Federighi宣布苹果使用本地化差分隐私技术来保护iOS/MacOS用户隐私。根据其官网披露的消息,苹果将该技术应用于Emoji、QuickType输入建议、查找提示等领域。例如,Count Mean Sketch算法(CMS)帮助苹果获得最受欢迎的Emoji表情用来进一步提升Emoji使用的用户体验

隐私计算的应用场景较为广泛,典型的场景有

    • 联合查询与统计分析

      • 在金融领域,银行或者小贷机构可借助MPC技术通过其他机构的征信信息、客户公共评价信息、商务经营信息、收支消费信息等对一个企业进行全方位的信贷能力评估,而又能够保证这些外部信息的安全性

    • 模型训练与预测分析。

      • 数据模型的准确性取决于数据量、数据种类和数据质量。使用MPC技术或者联邦学习将多方数据联合在一起,训练出的模型将更加准确,从而对未知情形提供更加合理的预测。

    • 个人隐私保护。

      • 对于一些面向个人的应用,比如基因分析。使用同态加密技术可以在不保护用户个人基因的情况下,分析用户基因潜在缺陷。

    • 信息安全存储。

      • 企业可使用MPC相关技术(如同态加密、秘密共享等)将数据以密文或分片的方式存储,有效防止内部人员非法盗用数据的情况发生。同时,由于MPC能够在密文上运算,存储的数据无需解密即可进行其他计算,既保证了安全性,又提升了计算效率。

    • 数据资产化

      • 利用隐私计算技术可以有效分离数据的所有权和使用权,企业和个人可以把数据作为重要的资产进行交易的同时,可以规定数据的用途、用量、有效期等使用属性,数据的使用者在拿到数据后只能在授权范围内合理地使用数据。

此条目发表在未分类分类目录,贴了标签。将固定链接加入收藏夹。