正在阅读:

矩阵元CEO孙立林:隐私计算如何解决数据产权和交易难题

扫一扫下载界面新闻APP

矩阵元CEO孙立林:隐私计算如何解决数据产权和交易难题

而区块链的最大价值,是解决了最根本的清结算问题,将多层级的数据托管变成了一个分布式的高效率的体系。

记者 | 司林威

新冠疫情给全社会造成了极大冲击,科技工具渗透到生活的各个角落,公共空间和私人空间的界线日渐模糊。和个人隐私相关的社会议题层出不穷,比如人脸识别才能进小区,房产公司用人脸识别给客户分类,某些App甚至比用户更了解其兴趣爱好……无所不在的摄像头究竟是让人们更安全,还是牺牲了隐私,人们陷入两难。

在让渡个人信息以维护公共安全的同时,隐私和个人数据如何不被滥用?由此带来的安全隐患和商业利益分配问题如何解决呢?

外交学院教授施展在他的《破茧》一书中曾提到一个名词——隐私计算。“所有的数据都应该在自己的终端上,个人数据进到算法里面就有点类似于进入了小黑箱,而技术上是能够确保对数据的各种计算过程都是加密的,没有人知道这数据究竟是什么,它只能反馈出来一个计算结果。”施展认为,“一旦我承诺了我的隐私可以给你用,以什么方式被你用,那么我是应当获得分红的。”他认为,我们过去所熟悉的关于个人权利、产权等的定义,可能都会被迭代,各种新规则也会浮现出来。

究竟什么是隐私计算?由个人信息构成的大数据,个人、公司、政府各方的责权利应该如何分配呢?界面新闻就此采访了矩阵元创始人兼CEO孙立林。孙立林是Chinaledger创始成员及技术委员会副主任、中国证券基金业协会金融科技委员会委员。他长期从事支付清算金融基础设施的工作,对区块链如何传统改造金融行业以及信息传输方面有着深入理解和丰富经验。

成立于2014年的矩阵元,恰好把自己定位于隐私计算和区块链技术提供商,目标正是解决数字时代数据协同计算过程中的数据安全和隐私保护问题。矩阵元于2016年获得来自万向控股的1.5亿元投资,并与上海交通大学、复旦大学、武汉大学、中国科学院等高校研究机构有深入合作。就在上个月,上海市科学技术委员会发布了矩阵元全资子公司上海阵方科技有限公司获批“上海市数据隐私安全计算企业重点实验室”和”上海市分布式隐私人工智能技术创新中心“的通知。

在孙立林看来,数据本身就是一个多方共同计算出的的结果,数据的所有权确实很难界定。而区块链的最大价值,是解决了最根本的清结算问题,将多层级的数据托管变成了一个分布式的高效率的体系。作为要素市场,数据一定不能被任何一个单一机构或者平台所把持。隐私计算的市场,未来会出现类似政府授权牌照的模式。

以下为采访记录,有一定删改。

 (图片:孙立林照片)

如何确保技术持有者不会滥用我们的隐私信息

记者:能不能用比较简单的话解释一下,什么是数据?

孙立林:Ackoff(1989)提出了一个著名模型—DIKW模型,D指数据(Data),I指信息(Information),K指知识(Knowledge),W指智慧(Wisdom)。在该模型中,最底层是数据,上面是信息,然后是知识,最上面是智慧,这是人类原来的理解的方式。

数据其实是人与外部世界的交互过程,然后人类从当中抽象出信息,再从信息当中抽象出知识,最后升华为智慧。

数据是体现在服务或者说由服务过程中产生的,贯穿整个全服务过程的一个载体。简单地说,对万事万物以及行为的客观的观察和记录是数据,所以人是独立于数据之外的。

记者:现在很多小区需要人脸识别才可进入,于是很多人都要去小区存储人脸信息。而一般人们在进入办公楼时,只需要登记包括身份证号、电话号码在内的个人信息,你觉得这种方式是合理的吗?

孙立林:这确实牵涉到隐私的好例子。以身份证登记进办公楼来说,这反映的就是访客和物业管理者之间的关系。写字楼作为一个私有领地当然是有权利,也有动机保护他的权利(空间),即禁止闲杂人员进入。这种权利是正当的。但问题是,这种权利归属于谁:物业的业主、物业的管理方,还是承租的公司。

但是接下来的问题是,他们之间在进行信息分享时如何保证信息的安全。

记者:当我在前台提供个人信息之后,相应的企业是不是有能力或者有义务来保护我的隐私?

孙立林:它不一定有能力,目前也不认为它有义务这么做。

现在大家达成的默契是,物业管理方有权力来决定谁能否进入该空间,而不是承租公司。因为物业管理方在拥有权力的同时,它是有相应的义务和责任来承担风险。

但是绝大多数物业又不具备这个能力真的来做,也没有足够动机去保护访客的信息安全,因为它的主要动机保护他的私有空间。

当我们进入一个写字楼、登记信息的时候,就与物业有了一个契约关系,这既是威慑,也是统计,出了事情物业可以找得到相应人员。

但现在普遍发生的情况是,物业并没有另外一个承诺:我不会拿你的这些信息干别的事。

于是乎,信息泄漏也就不可避免地屡屡发生。

记者:技术,尤其是区块链,有没有可能去改善信息泄漏问题?

孙立林:技术手段可以在相当的程度上解决这个问题,替代或者说成为人类社会公共治理的基础设施。

但当技术彻底沉降为公共基础设施的新的范式的时候,它在解决了一部分问题的同时,也带来了更深刻的问题:就是由谁来掌握这个技术。

实际上我们把权利彻底地披露给了所谓的技术持有者。但是我们又如何确保技术持有者不会彻底地滥用我们的隐私信息?我们又怎么确保阿里、腾讯这样的大平台不会擅用我们的数据?

数据是多方计算出的结果,其所有权很难界定

记者:隐私计算到底是什么意思?真的能保护隐私吗?

孙立林:关于隐私计算,我最早在创办矩阵元的用的词是协同计算,协同计算的本质就是人类的协同。

数据计算根本的范式迁移,比金融范式迁移还要深刻。数据计算把大量的计算、大量的事务处理,从集中化的云端向边缘侧、向个体和机构迁移,让我们有更多的能力来处理计算,同时大大降低门槛。

比如隐私计算产品Rosetta,它的口号是让不懂密码学的人可以使用密码学技术。而我们所做的AI产品,是让不懂AI的人可以使用。所以,实际上矩阵元真正要做的事情是让没有数据的人可以使用数据。

隐私计算解决方案,现在用在医疗领域特别合适。我原来也曾非常激进地认为,病例信息归属于病人,不归属于医院,后来我发现这是错的。为什么呢?病人是生病的本体,如果没有医生的知识加持在我的身体之上,病人是不知道得了什么病的。

病人是写不出来病例的,病人只知道我感冒流鼻涕了,因为我对感冒有认知。但是假定有别的更严重的病,病人是不知道的,只有通过医生通过设备检测才能知道。

所以,今天说的绝大多数意义上的数据,都是被计算过后的结果,而这个计算别人是投了成本的,包括设备、人力等等。

所以,数据本身就是一个多方共同计算出的的结果,数据的所有权确实很难界定。

记者:区块链可以在数据所有权的划分里面发挥什么作用吗?

孙立林:数据具有公共性,而数据计算本质上就是多方计算,这一点同样适用于隐私计算。

区块链的最大价值,就是解决了最根本的清结算问题,由多层级的孤立的数据托管变成了一个一致性、分布式、高效率的投入。

记者:有专家指出,区块链的本质是一个公开的账本,它的公开性和隐私保护之间是不是存在一种矛盾?

孙立林:隐私计算和区块链是两个维度的产品,是互相配合的两个工具。

区块链本身并不是加密的,比特币只用了哈希签名,其加密程度甚至不如某些高等级的手机。区块链与隐私计算的关联在于,它只是为隐私计算提供了清算能力。隐私处理的这部分基本都是在本地的。

机构间的利益博弈才构成商业模式

记者:如果说区块链是公共的基础设施,那么,像矩阵元这类企业,能在隐私计算里面发挥什么作用呢?

孙立林:有一句特别经典的话,未经觉醒的权利就不是权利。当我没有意识到这是我的权利,我是无所谓这个权利是不是被拿走了。因为隐私权利在产生了效用之后还产生了利益,人们才在利益面前觉醒,才会去保护自己的隐私权利。

人们在利益面前觉醒以后,这件事情就变得非常关键。所以,在做矩阵元的商业模式设计的时候,我就认为,2C(针对消费者)的隐私保护在相当长的时间里只构成道德上的压力,而不构成商业模式。只有机构间的信息保护才构成商业模式。

机构间的利益博弈才构成商业模式。因为机构会率先意识到它这个资产价值,而且机构有足够的量。而个体掌握可以变现的利益太小,个体不构成博弈对等的实体,就没有模式。

记者:那么,2B的业务和2C业务是没有关系还是互相促进呢?

孙立林:2C是个催化剂。中国过去2C业务的开展有一个默认的前提:它的物料供给是无限的,比如共享单车,自行车可以无限生产;比如美团外卖,餐厅可以无限供给,餐厅开的越大,吃饭的人越多,供应链就越便宜。在无限供给的前提下,就可以扩展规模。

在今天的区块链行业,绝大多数人都只把它当成2C的应用,而没有把它当基础设施去做。

基础设施领域的情况和C端的情况是相反的,所有基础设施业务都是是有限供给。比如电用得越多,你的电费越贵,高速公路跑的车越多,过路费越贵。区块链同样如此,以太坊就是典型。用得人越多,gas费也越高。

造成此种情况的原因是,基础设施所受到的天然限制,全人类的公共基础设施只能提供这么多服务。

回到金融领域,清算层的清算能力的供给是有限的,并不是大家想象的是无限的,所以才会出现双十一的时候,很多消费者的购物车无法及时清空。即使堆叠很多硬件服务器,优化数据库,提升TPS(每秒交易量),但是对不起,银联清算库的清算能力是有限的。

作为基础设施的银联,支付性能的改善是阶段性、有限的,应用的迭代更新远远超过基础设施,基础设施的迭代演进的周期远比应用漫长。

而基础设施就意味着需要监管。在电商大规模兴起之前,互联网只有HTTP协议;当电商支付开始流行之后,才有Https、SSL协议。而只有当SSL和HTTPS受到了监管,人类才能信任。人类所有交易行为的本质就是信任。

今天从全球来看,如果认定数据是要素市场,那么要素市场一定不能被任何一个单一机构或者平台所把持,无论它是哪个科技巨头企业。

所以,我认为隐私计算的商业模式也回到了20多年前中国建设电信运营商的时代,一定会出现类似得到政府的授权牌照的运营商来运营,提供公共性基础设施服务。

每个人都可以对自己能够掌控和处理的数据主张权利。但是如果我们试图建立一个交换和共享网络的时候,我们不可以直接去取得其他参与者的数据和权利;参与网络的各方都必须把自己对数据的部分所有权和使用权让渡给一个第三方运营者,这个网络才能运转。

对于矩阵元而言,我们不寻求运营商地位,我们致力于做好技术,为未来的大型数据运营商提供技术解决方案。

记者:你们目前做了哪些工作?

孙立林:我们从2017年初开始做隐私计算的,当时只是觉得这个方向肯定是对的,但是路径不清楚。直到去年新基建开始热门起来以后,我认为路径也基本清楚。目前,我们已经能够具备基本的技术能力,可以满足一些基本的需求和企业之间信息交互的基础设施。

记者:你之前在银联工作,2013年进入区块链行业。金融和区块链,是互相促进还是取代的关系?

孙立林:区块链天然就是金融基础设施,中本聪在比特币论文表达的也是这个意思,Ta在摘要里写过,人类在线交易时代彻底解决交易回溯和欺诈问题,首先要解决的就是金融基础设施最基础的清算机制问题。

区块链的本质,不过是个服务的中间件,它是面向交易的,区块链其实还只是人类的一个手和脚,帮人类干活。

而矩阵元从事的分布式AI隐私计算,它不是面向交易的,而是面向数据本体的。矩阵元的目标并不是在复制手脚,而是要复制大脑。AI分三个层次:感知——认知——决策。今天的区块链还停留在感知的阶段,矩阵元要做的事情就是利用区块链的手段,汇集海量的数据,为人类的认知和决策提供帮助,最终成为“外脑”。

未经正式授权严禁转载本文,侵权必究。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

矩阵元CEO孙立林:隐私计算如何解决数据产权和交易难题

而区块链的最大价值,是解决了最根本的清结算问题,将多层级的数据托管变成了一个分布式的高效率的体系。

记者 | 司林威

新冠疫情给全社会造成了极大冲击,科技工具渗透到生活的各个角落,公共空间和私人空间的界线日渐模糊。和个人隐私相关的社会议题层出不穷,比如人脸识别才能进小区,房产公司用人脸识别给客户分类,某些App甚至比用户更了解其兴趣爱好……无所不在的摄像头究竟是让人们更安全,还是牺牲了隐私,人们陷入两难。

在让渡个人信息以维护公共安全的同时,隐私和个人数据如何不被滥用?由此带来的安全隐患和商业利益分配问题如何解决呢?

外交学院教授施展在他的《破茧》一书中曾提到一个名词——隐私计算。“所有的数据都应该在自己的终端上,个人数据进到算法里面就有点类似于进入了小黑箱,而技术上是能够确保对数据的各种计算过程都是加密的,没有人知道这数据究竟是什么,它只能反馈出来一个计算结果。”施展认为,“一旦我承诺了我的隐私可以给你用,以什么方式被你用,那么我是应当获得分红的。”他认为,我们过去所熟悉的关于个人权利、产权等的定义,可能都会被迭代,各种新规则也会浮现出来。

究竟什么是隐私计算?由个人信息构成的大数据,个人、公司、政府各方的责权利应该如何分配呢?界面新闻就此采访了矩阵元创始人兼CEO孙立林。孙立林是Chinaledger创始成员及技术委员会副主任、中国证券基金业协会金融科技委员会委员。他长期从事支付清算金融基础设施的工作,对区块链如何传统改造金融行业以及信息传输方面有着深入理解和丰富经验。

成立于2014年的矩阵元,恰好把自己定位于隐私计算和区块链技术提供商,目标正是解决数字时代数据协同计算过程中的数据安全和隐私保护问题。矩阵元于2016年获得来自万向控股的1.5亿元投资,并与上海交通大学、复旦大学、武汉大学、中国科学院等高校研究机构有深入合作。就在上个月,上海市科学技术委员会发布了矩阵元全资子公司上海阵方科技有限公司获批“上海市数据隐私安全计算企业重点实验室”和”上海市分布式隐私人工智能技术创新中心“的通知。

在孙立林看来,数据本身就是一个多方共同计算出的的结果,数据的所有权确实很难界定。而区块链的最大价值,是解决了最根本的清结算问题,将多层级的数据托管变成了一个分布式的高效率的体系。作为要素市场,数据一定不能被任何一个单一机构或者平台所把持。隐私计算的市场,未来会出现类似政府授权牌照的模式。

以下为采访记录,有一定删改。

 (图片:孙立林照片)

如何确保技术持有者不会滥用我们的隐私信息

记者:能不能用比较简单的话解释一下,什么是数据?

孙立林:Ackoff(1989)提出了一个著名模型—DIKW模型,D指数据(Data),I指信息(Information),K指知识(Knowledge),W指智慧(Wisdom)。在该模型中,最底层是数据,上面是信息,然后是知识,最上面是智慧,这是人类原来的理解的方式。

数据其实是人与外部世界的交互过程,然后人类从当中抽象出信息,再从信息当中抽象出知识,最后升华为智慧。

数据是体现在服务或者说由服务过程中产生的,贯穿整个全服务过程的一个载体。简单地说,对万事万物以及行为的客观的观察和记录是数据,所以人是独立于数据之外的。

记者:现在很多小区需要人脸识别才可进入,于是很多人都要去小区存储人脸信息。而一般人们在进入办公楼时,只需要登记包括身份证号、电话号码在内的个人信息,你觉得这种方式是合理的吗?

孙立林:这确实牵涉到隐私的好例子。以身份证登记进办公楼来说,这反映的就是访客和物业管理者之间的关系。写字楼作为一个私有领地当然是有权利,也有动机保护他的权利(空间),即禁止闲杂人员进入。这种权利是正当的。但问题是,这种权利归属于谁:物业的业主、物业的管理方,还是承租的公司。

但是接下来的问题是,他们之间在进行信息分享时如何保证信息的安全。

记者:当我在前台提供个人信息之后,相应的企业是不是有能力或者有义务来保护我的隐私?

孙立林:它不一定有能力,目前也不认为它有义务这么做。

现在大家达成的默契是,物业管理方有权力来决定谁能否进入该空间,而不是承租公司。因为物业管理方在拥有权力的同时,它是有相应的义务和责任来承担风险。

但是绝大多数物业又不具备这个能力真的来做,也没有足够动机去保护访客的信息安全,因为它的主要动机保护他的私有空间。

当我们进入一个写字楼、登记信息的时候,就与物业有了一个契约关系,这既是威慑,也是统计,出了事情物业可以找得到相应人员。

但现在普遍发生的情况是,物业并没有另外一个承诺:我不会拿你的这些信息干别的事。

于是乎,信息泄漏也就不可避免地屡屡发生。

记者:技术,尤其是区块链,有没有可能去改善信息泄漏问题?

孙立林:技术手段可以在相当的程度上解决这个问题,替代或者说成为人类社会公共治理的基础设施。

但当技术彻底沉降为公共基础设施的新的范式的时候,它在解决了一部分问题的同时,也带来了更深刻的问题:就是由谁来掌握这个技术。

实际上我们把权利彻底地披露给了所谓的技术持有者。但是我们又如何确保技术持有者不会彻底地滥用我们的隐私信息?我们又怎么确保阿里、腾讯这样的大平台不会擅用我们的数据?

数据是多方计算出的结果,其所有权很难界定

记者:隐私计算到底是什么意思?真的能保护隐私吗?

孙立林:关于隐私计算,我最早在创办矩阵元的用的词是协同计算,协同计算的本质就是人类的协同。

数据计算根本的范式迁移,比金融范式迁移还要深刻。数据计算把大量的计算、大量的事务处理,从集中化的云端向边缘侧、向个体和机构迁移,让我们有更多的能力来处理计算,同时大大降低门槛。

比如隐私计算产品Rosetta,它的口号是让不懂密码学的人可以使用密码学技术。而我们所做的AI产品,是让不懂AI的人可以使用。所以,实际上矩阵元真正要做的事情是让没有数据的人可以使用数据。

隐私计算解决方案,现在用在医疗领域特别合适。我原来也曾非常激进地认为,病例信息归属于病人,不归属于医院,后来我发现这是错的。为什么呢?病人是生病的本体,如果没有医生的知识加持在我的身体之上,病人是不知道得了什么病的。

病人是写不出来病例的,病人只知道我感冒流鼻涕了,因为我对感冒有认知。但是假定有别的更严重的病,病人是不知道的,只有通过医生通过设备检测才能知道。

所以,今天说的绝大多数意义上的数据,都是被计算过后的结果,而这个计算别人是投了成本的,包括设备、人力等等。

所以,数据本身就是一个多方共同计算出的的结果,数据的所有权确实很难界定。

记者:区块链可以在数据所有权的划分里面发挥什么作用吗?

孙立林:数据具有公共性,而数据计算本质上就是多方计算,这一点同样适用于隐私计算。

区块链的最大价值,就是解决了最根本的清结算问题,由多层级的孤立的数据托管变成了一个一致性、分布式、高效率的投入。

记者:有专家指出,区块链的本质是一个公开的账本,它的公开性和隐私保护之间是不是存在一种矛盾?

孙立林:隐私计算和区块链是两个维度的产品,是互相配合的两个工具。

区块链本身并不是加密的,比特币只用了哈希签名,其加密程度甚至不如某些高等级的手机。区块链与隐私计算的关联在于,它只是为隐私计算提供了清算能力。隐私处理的这部分基本都是在本地的。

机构间的利益博弈才构成商业模式

记者:如果说区块链是公共的基础设施,那么,像矩阵元这类企业,能在隐私计算里面发挥什么作用呢?

孙立林:有一句特别经典的话,未经觉醒的权利就不是权利。当我没有意识到这是我的权利,我是无所谓这个权利是不是被拿走了。因为隐私权利在产生了效用之后还产生了利益,人们才在利益面前觉醒,才会去保护自己的隐私权利。

人们在利益面前觉醒以后,这件事情就变得非常关键。所以,在做矩阵元的商业模式设计的时候,我就认为,2C(针对消费者)的隐私保护在相当长的时间里只构成道德上的压力,而不构成商业模式。只有机构间的信息保护才构成商业模式。

机构间的利益博弈才构成商业模式。因为机构会率先意识到它这个资产价值,而且机构有足够的量。而个体掌握可以变现的利益太小,个体不构成博弈对等的实体,就没有模式。

记者:那么,2B的业务和2C业务是没有关系还是互相促进呢?

孙立林:2C是个催化剂。中国过去2C业务的开展有一个默认的前提:它的物料供给是无限的,比如共享单车,自行车可以无限生产;比如美团外卖,餐厅可以无限供给,餐厅开的越大,吃饭的人越多,供应链就越便宜。在无限供给的前提下,就可以扩展规模。

在今天的区块链行业,绝大多数人都只把它当成2C的应用,而没有把它当基础设施去做。

基础设施领域的情况和C端的情况是相反的,所有基础设施业务都是是有限供给。比如电用得越多,你的电费越贵,高速公路跑的车越多,过路费越贵。区块链同样如此,以太坊就是典型。用得人越多,gas费也越高。

造成此种情况的原因是,基础设施所受到的天然限制,全人类的公共基础设施只能提供这么多服务。

回到金融领域,清算层的清算能力的供给是有限的,并不是大家想象的是无限的,所以才会出现双十一的时候,很多消费者的购物车无法及时清空。即使堆叠很多硬件服务器,优化数据库,提升TPS(每秒交易量),但是对不起,银联清算库的清算能力是有限的。

作为基础设施的银联,支付性能的改善是阶段性、有限的,应用的迭代更新远远超过基础设施,基础设施的迭代演进的周期远比应用漫长。

而基础设施就意味着需要监管。在电商大规模兴起之前,互联网只有HTTP协议;当电商支付开始流行之后,才有Https、SSL协议。而只有当SSL和HTTPS受到了监管,人类才能信任。人类所有交易行为的本质就是信任。

今天从全球来看,如果认定数据是要素市场,那么要素市场一定不能被任何一个单一机构或者平台所把持,无论它是哪个科技巨头企业。

所以,我认为隐私计算的商业模式也回到了20多年前中国建设电信运营商的时代,一定会出现类似得到政府的授权牌照的运营商来运营,提供公共性基础设施服务。

每个人都可以对自己能够掌控和处理的数据主张权利。但是如果我们试图建立一个交换和共享网络的时候,我们不可以直接去取得其他参与者的数据和权利;参与网络的各方都必须把自己对数据的部分所有权和使用权让渡给一个第三方运营者,这个网络才能运转。

对于矩阵元而言,我们不寻求运营商地位,我们致力于做好技术,为未来的大型数据运营商提供技术解决方案。

记者:你们目前做了哪些工作?

孙立林:我们从2017年初开始做隐私计算的,当时只是觉得这个方向肯定是对的,但是路径不清楚。直到去年新基建开始热门起来以后,我认为路径也基本清楚。目前,我们已经能够具备基本的技术能力,可以满足一些基本的需求和企业之间信息交互的基础设施。

记者:你之前在银联工作,2013年进入区块链行业。金融和区块链,是互相促进还是取代的关系?

孙立林:区块链天然就是金融基础设施,中本聪在比特币论文表达的也是这个意思,Ta在摘要里写过,人类在线交易时代彻底解决交易回溯和欺诈问题,首先要解决的就是金融基础设施最基础的清算机制问题。

区块链的本质,不过是个服务的中间件,它是面向交易的,区块链其实还只是人类的一个手和脚,帮人类干活。

而矩阵元从事的分布式AI隐私计算,它不是面向交易的,而是面向数据本体的。矩阵元的目标并不是在复制手脚,而是要复制大脑。AI分三个层次:感知——认知——决策。今天的区块链还停留在感知的阶段,矩阵元要做的事情就是利用区块链的手段,汇集海量的数据,为人类的认知和决策提供帮助,最终成为“外脑”。

未经正式授权严禁转载本文,侵权必究。