Princess

Posted by Maxul's Technical Notes on June 3, 2018

题目: PRINCESS: Privacy-protecting Rare disease International Network Collaboration via Encryption through Software guard extensionS

作者: Feng Chen, Shuang Wang, Xiaoqian Jiang, Sijie Ding, Yao Lu, Jihoon Kim, Süleyman Cenk Sahinalp, Chisato Shimizu, Jane C. Burns, Victoria J. Wright, Eileen Png, Martin L. Hibberd, David D. Lloyd, Hai Yang, Amalio Telenti, Cinnamon S. Bloss, Dov Fox, Kristin E. Lauter, Lucila Ohno-Machado

单位: University of California San Diego

出版: Bioinformatics (2017)

综述:

  1. 基因数据作为绝对隐私,其安全问题在生物信息领域十分重要。
  2. 罕见病因其样本稀少,需要全球人员共同协作。这个平台必须是分布式共享的,由此也引入了隐私问题。
  3. 传统的平台思路将个体病例的DNA序列分别放在每个节点中,PRINCESS在多个节点间用加密保护数据,并用机构策略和规范保护病人健康信息。
  4. 本文借助对家族遗传病史Kawasaki的研究,在3大洲间建立起共享数据平台,比现有的homomorphic encryption and garbled circuits快了4万倍。

解决问题:

  1. 21世纪人类基因测序技术发展迅猛,广泛用于医疗、生物医学等领域。
  2. 主要的隐私担忧来自供体,因为基因信息中包含了供体的身份、遗传病、性征等特点。一旦被恶人利用后果不堪设想。
  3. 既有思路使用加密(如homomorphic encryption (HME)),或者将数据水平或垂直分配。HME对通信双方在计算和存储上都有要求,对于数据分析也只能支持加法和乘法操作。30多年前Yao提出了secure multiparty computation (SMC),很可惜并没有多少真实可用的例子。尽管SMC的计算复杂度小,但是它通常需要复杂的circuit设计,同时对特定任务的优化有限,限制了它的灵活性。
  4. 保护基因隐私,同时允许跨国合作,挑战艰巨;此外各国对基因有自己的法律,甚至禁止个体基因的出口。而最近的基因分析技术只能在有限数据和环境中测试,缺乏更多真实样本。种种挑战和机遇下,本文设计并实现了针对罕见病的跨国网络合作平台,利用SGX技术保护隐私。

贡献点:

  1. 实现了分析KD罕见病的TDT模块(transmission disequilibrium test),实验说明其十分高效,加速了跨国分析速度。
  2. 使用SGX提供的轻量级加密原语(in-enclave AES-GCM)和数据压缩技术,在安全计算和传输上比相关工作快4万倍。
  3. 对来自不同大洲的三个医学机构(UC San Diego, Imperial College London and Genome Institute of Singapore)提供的real life数据进行实验,证明其在保护个体基因隐私的基础上如何实现跨国安全分析。

基础技术

  • 身份认证:Elliptic Curve Digital Signature Algorithm (ECDSA)
  • 数据传输:Secure Sockets Layer (SSL)
  • 密钥协商:Elliptic Curve Diffie–Hellman (ECDH)

局限:

  1. 现有的PRINCESS不支持安全存储。
  2. 支持的基因模块不足;压缩实现效率不高。
  3. 未考虑侧信道攻击。
  4. 对大数据分析导致的性能下降未做考虑(SGX自身的EPC限制)。

体会:

  • 很好的一次跨界合作。很棒的工程实现。

工程链接:https://github.com/achenfengb/PRINCESS_opensource