科技日报记者 付丽丽
作为数字经济时代的关键要素,数据资产的重要性被提升到前所未有的高度。但数据安全、数据孤岛等问题让释放数据价值掣肘颇多,如何充分保证数据安全并提升数据融合能力已成为一项重要课题。
9月17日,第四届全球智博会期间,瑞莱智慧发布全新升级的隐私保护计算平台RealSecure。瑞莱智慧合伙人朱萌表示,隐私计算正成为一项必备的技术基础,此次发布的平台能够在确保数据隐私保护的前提下促进数据流通,实现“数据不出库、模型多跑路”,以保护数据隐私和数据安全。
数据通过流通共享与协同计算将更好地释放价值,随着人工智能等新技术的发展,数据本身的底层价值在快速井喷。但朱萌表示,现有的数据流通模式面临三大困境,一是数据权属的不可分割导致数据拥有方不愿共享,二是针对数据安全的法律框架正全面构筑,监管日渐趋严,数据合规风险让企业机构不敢共享数据,三是技术不成熟与协议不统一导致数据仍无法实现互通互联,数据资产割裂、自成体系。
海量数据散落在众多机构和信息系统中,形成“信息孤岛”和“数据烟囱”,数据要素的经济社会价值无法得到充分发挥。同时在强监管和行业规范的要求下,数据的价值和安全性陷入二元对立的状态。在此背景下,隐私保护计算为实现数据安全合规的互通互联提供了技术最优解。
据介绍,该平台就是一款基于安全多方计算、联邦学习、可信执行环境等技术打造的数据安全共享基础设施,通过将计算环节移动到数据端,实现“数据可用不可见”。朱萌表示,“数据不出库,模型多跑路”是该平台的核心功能,在数据不出本地、无中间方作为协调者的前提下,完成多方参与的模型训练并获得可投入生产的模型,既保障数据隐私安全,又以AI的方式驱动整个数据处理闭环。
当前,隐私计算作为近年来的热门赛道,各类玩家纷纷入局。但从效果来看,隐私计算市场仍处于早期阶段,规模化的商业落地面临挑战。朱萌分析,隐私计算不同于传统机器学习,是分布式与可信芯片、密码学、人工智能三个领域的结合,在投入商用的过程涉及技术适配的工作。具体来说,大部分隐私计算的技术栈在遇到不同算法时,需要堆人力对算法进行一对一的剖析和改写,来将其联邦改造或“隐私计算化”,这就导致这项工作成为一项劳动密集型工作,投入与代价之大。
针对这一问题,平台通过自研的隐私保护AI编译器架构实现与传统算法的自动编译和一键适配。通过将隐私保护计算算法公式表达向更细颗粒度解构,解构成“算子”,基于算子的灵活组合来自动将普通机器学习算法程序转换为分布式的隐私安全程序,摆脱重复改写的繁琐工作,实现机器学习生态与隐私保护计算生态的相统一。
“传统的做法可理解为‘雕版印刷’,RealSecure平台实现的是‘活字印刷’,兼容主流机器学习算法,无需改写,只要调用函数,在编译器里重新编译一遍就可以。”朱萌解释,“可以让数据科学家以最熟悉的方式使用隐私计算,大幅提升易用性,这也是加速隐私计算落地的最优路径。”