正在阅读:

【视频】从姚氏百万富翁难题说起,真实的数据到底属于谁?

扫一扫下载界面新闻APP

【视频】从姚氏百万富翁难题说起,真实的数据到底属于谁?

数据作为新时代的生产资料,它的核心价值在于通过安全的流通,为社会创造更大的价值。

文|造就

季昕华

优刻得科技股份有限公司创始人兼CEO

非常感谢造就邀请我来参加这个大会。昨天晚上,我去见了我的大学同学。非常有意思啊,1999年他离开上海去美国深造的时候,我跟他之间有个小的赌约。

我说20年后我们比比谁更有钱,看看到底是中国学生毕业后赚的钱多,还是美国学生毕业后赚的钱多。更有钱的那个,要回同济大学,我们的母校,请吃一块同济的炸猪排。

所以昨晚我们在浦东一个地方相聚,喝酒聊天,回想起当年这个有趣的约定。

但是我们发现这个问题解决起来并没有那么容易,因为我们两个人都不愿意把自己的身价告诉对方。

我想说:“哎,那能不能请餐馆的服务员帮我们看一下我们双方账户上的存款数字”——也很难实现,因为我们也都不愿意把自己卡上的数额告诉服务员,尽管他是第三者。

这问题怎么解决呢?

其实,这就是著名的姚氏百万富翁问题——当两个人要比较到底谁更有钱的时候,那必须把彼此的所有收入,包括各种资产都公开给对方。但这个时候问题出现了,大家都不愿意公开自己收入情况,有多少存款、多少股票、多少房子……

在现实生活中这种情况更多,比如说人工智能领域里的医疗行业,它需要有大量的临床影像数据去做AI的分析,但不管是个人还是医院都不会轻易把这些数据交给人工智能公司。分析工作就会很难推进,非常非常痛苦,因为找各个地方都拿不到数据。

数据流通的痛点和诉求

信息和数据是社会的重要生产资料,但在目前的环境下,数据很难被流通,很难被共享,为什么呢?

因为数据和其他商品有个非常不一样的地方,其他商品一旦给人家了,商品的所有权就发生了转移,别人拿走之后很难再被复制。

但是数据具有非常好的可复制性,我把数据给了A,A拿完之后马上告诉B,B又告诉了C,数据就这么被无限复制,泛滥传播,所有权很难厘清。

所以,保障数据在安全的情况下被使用,并发挥出它的价值,是一个亟需解决的问题。 比如刚刚提到的人工智能公司,它非常需要数据,但是,第一,它获取不到数据,第二它没法判断这个数据的质量是不是好,第三个数据存在于每个单位内部,没法形成连通性。

数据有连接才有价值,而且连接的数据量越多越有价值。但在目前情况下,数据的需求者拿不到数据,也没法对数据质量进行判断,就形成了一个一个的数据孤岛。

同时,数据的拥有者对数据开放也有诉求。

第一,他希望数据能够安全可控地开放。如果数据被拿走、被泄露了,那数据拥有者将面临很大的安全和法律风险。

第二,数据要和应用场景有深度的结合。因为数据和产品密切相关,只有对应数据的场景才能获得价值。

第三,数据的价值问题。一个商品能流通是因为它有价值,而且很容易被衡量出来,但是数据对于不同人的价值是不一样的,比如病人的数据对医药公司很有价值,但那对普通人没有价值,那如何对这个数据进行定价?这是当前难度非常大的地方。

另外,技术储备不足、环境不允许,在面对多样化的数据需求时,心有余而力不足,以上四点就是当前面临的一些难题。

数据共享的现有模式

那么,怎么样能实现数据安全可靠地共享呢?目前全球有五个方案:

第一个就是我们现在常见的API方案。

它其实已经在全世界范围内大量应用了,比如说大家在网上要注册账号的时候,都需要你把身份证信息发过去,这时候API(Application Programming Interface,应用程序接口又称为应用编程接口,是一组定义、程序及协议的集合,通过 API接口实现计算机软件之间的相互通信,提供通用功能集。它同时也是一种中间件,为各种不同平台提供数据共享)就发生作用了,它会把你的身份证信息,和姓名信息通过API方式发送到公安部的认证中心,检测身份证号码和姓名是否匹配。

它的好处是简单,但这个公司有可能把你的数据存下来再次利用,同时,它要做复杂的计算的时候就发生问题了,它没法比较你和另外一个人的关系,没法解决说你的信用问题,没法分析你的个人兴趣爱好,所以API方式有它非常大的局限性。

第二就是原始数据的线下模式。

数据只属于所有者,然后让别人进你的系统内进行分析,分析完之后在物理上做隔离,比如说因为医院不敢把数据拿到外面去,就让人工智能公司在医院里进行分析处理,最后只拿走结果模型,但这种方法的效率非常低,没法实现多方的数据融合。

第三种就是安全屋模式。能够把数据放到一个公共的安全屋里,然后在安全屋里进行分析处理,能够比较好地解决问题之后把模型拿走。

第四种也是现在非常流行的,在国际上我们叫多方隐私计算。就是用区块链技术以去中心化的模式,通过区块链的智能合约,把算法下发到每个数据的拥有者手中,然后实现分布式的确定计算。

最后一种,也是前几年很流行的,我们叫数据的私下买卖方式,这种模式是违法的,已经被国家大量地限制和禁止。

前四种是当前的主流模式,第一种模式简单但是拓展方向有限;第二种模式效率低且没法融合多方。

安全屋模式能解决数据汇总分析处理的问题,但是还是要数据汇总,它会有个心理压力,数据的第三方看到数据之后会不会泄漏出去,这是非常令人担忧的事情,就像我和我到同学不愿意告诉服务员我们的存款一样。

第四种就是区块链模式,通过去中心化,通过区块链模式能够让数据真正地保留在本地,然后让算法执行流动。

这几种模式到底有哪些应用场景呢?

数据开放的应用场景

第一种场景是企业内部的跨部门的业务数据。

比如说一个做汽车的公司,同时有保险业务,保险公司非常希望集团内的汽车公司,把数据给到保险公司,但汽车公司不愿意把数据交出去。

因此,我们可以通过安全屋或区块链的模式,把汽车的使用数据让保险公司去分析,最后把结果拿走,数据不会有任何流动,确保了数据的安全。

第二种场景是不同组织间的数据共享。

比如说某个监管机构,它要求各个公司把数据交给监管机构,如果在原始模式下,这些公司会非常担忧把数据交给监管机构后,数据的所有权发生转移了。现在通过安全屋和区块链模式,可以实现不同组织之间的整个数据共享,可以保证数据被很好地使用,但不会被拿走。

第三个场景是跨组织的数据汇总和交换。

比如很多公司会通过获取用户访问网页时留下的cookie来进行广告定向投放,但为了保障数据安全和隐私,现在各个公司和组织之间的cookie越来越被限制了,那么如何在保证隐私的情况下实现数据的汇集呢?

还有更重要的场景就是数据的对外开放。

你知道我们的数据都存在哪些地方吗?

第一个是大家所熟悉的各种大的互联网公司,第二是我们常见的政府部门,这里面存了我们从出生、上学,到工作的所有数据。第三就是各种央企、国企, 第四种就是各种中小互联网公司。

此外,除了BAT这样的大型互联网公司,很多拥有数据的中小型公司本身并不具备很好的数据分析能力,这时候就需要专门的大数据和人工智能的公司来做这样的工作,所以说人工智能将会是未来新一轮的社会驱动力。

如何让数据创造更多价值?

但是我们要知道,人工智能如果能有大的成就,核心在于要有足够的数据,并且在数据的使用、处理和分析中,很好地保护数据隐私。

去年欧洲颁布了《通用数据保护条例》,简称GDPR,这个法案很好地保护了数据隐私。但也有报告指出,GDPR对使用数据的严格限定给整个行业、社会和科技带来非常大的阻碍。

那在隐私安全和科技进步之间,如何能找到一个好的解决方案呢?

我们认为通过技术手段,通过区块链,通过多方隐私计算,能够实现数据的安全流通和使用,同时确保隐私,这会是一个非常重要的发展方向。

并且随着5G的快速发展,社会各方各面的信息都会被快速地记录、存储和分析,那么数据体量会更大,结合多方隐私计算,各种区块链技术,使得整个数据可以在安全的情况下被使用起来,整个技术会更加成熟,人工智能的发展也会更为快速。

最后,还有一个非常重要的话题,数据到底属于谁?

当我们使用互联网服务时,互联网企业会记录下我们的数据,那这个数据的所有权,是属于这些互联网公司的呢?还是属于我们?

现在有一些观点认为这些数据应该属于每个用户,也就是说,当Facebook使用用户数据的时候,它应该向用户付钱。

如果这个事情真的能实现的话,那未来每个人都是数据生产者,我们可以通过制造数据产生价值。

可能你在玩游戏、买东西的时候,每一次键盘的输入、每一次鼠标的点击、你的摄像头对你的记录,都在为这个社会创造价值。使用这些数据的公司都要为你的每一次行动来付费,真正实现数据生产者和数据所有者的统一,同时也能打破数据的垄断,保护好用户的隐私。

总而言之,数据作为新时代的生产资料,它的核心价值在于通过安全的流通,为社会创造更大的价值。

策划 | 曹威;编辑 | 颖仔;校对 | Lily;视频 | Eddie;版面 | 漫倩

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

【视频】从姚氏百万富翁难题说起,真实的数据到底属于谁?

数据作为新时代的生产资料,它的核心价值在于通过安全的流通,为社会创造更大的价值。

文|造就

季昕华

优刻得科技股份有限公司创始人兼CEO

非常感谢造就邀请我来参加这个大会。昨天晚上,我去见了我的大学同学。非常有意思啊,1999年他离开上海去美国深造的时候,我跟他之间有个小的赌约。

我说20年后我们比比谁更有钱,看看到底是中国学生毕业后赚的钱多,还是美国学生毕业后赚的钱多。更有钱的那个,要回同济大学,我们的母校,请吃一块同济的炸猪排。

所以昨晚我们在浦东一个地方相聚,喝酒聊天,回想起当年这个有趣的约定。

但是我们发现这个问题解决起来并没有那么容易,因为我们两个人都不愿意把自己的身价告诉对方。

我想说:“哎,那能不能请餐馆的服务员帮我们看一下我们双方账户上的存款数字”——也很难实现,因为我们也都不愿意把自己卡上的数额告诉服务员,尽管他是第三者。

这问题怎么解决呢?

其实,这就是著名的姚氏百万富翁问题——当两个人要比较到底谁更有钱的时候,那必须把彼此的所有收入,包括各种资产都公开给对方。但这个时候问题出现了,大家都不愿意公开自己收入情况,有多少存款、多少股票、多少房子……

在现实生活中这种情况更多,比如说人工智能领域里的医疗行业,它需要有大量的临床影像数据去做AI的分析,但不管是个人还是医院都不会轻易把这些数据交给人工智能公司。分析工作就会很难推进,非常非常痛苦,因为找各个地方都拿不到数据。

数据流通的痛点和诉求

信息和数据是社会的重要生产资料,但在目前的环境下,数据很难被流通,很难被共享,为什么呢?

因为数据和其他商品有个非常不一样的地方,其他商品一旦给人家了,商品的所有权就发生了转移,别人拿走之后很难再被复制。

但是数据具有非常好的可复制性,我把数据给了A,A拿完之后马上告诉B,B又告诉了C,数据就这么被无限复制,泛滥传播,所有权很难厘清。

所以,保障数据在安全的情况下被使用,并发挥出它的价值,是一个亟需解决的问题。 比如刚刚提到的人工智能公司,它非常需要数据,但是,第一,它获取不到数据,第二它没法判断这个数据的质量是不是好,第三个数据存在于每个单位内部,没法形成连通性。

数据有连接才有价值,而且连接的数据量越多越有价值。但在目前情况下,数据的需求者拿不到数据,也没法对数据质量进行判断,就形成了一个一个的数据孤岛。

同时,数据的拥有者对数据开放也有诉求。

第一,他希望数据能够安全可控地开放。如果数据被拿走、被泄露了,那数据拥有者将面临很大的安全和法律风险。

第二,数据要和应用场景有深度的结合。因为数据和产品密切相关,只有对应数据的场景才能获得价值。

第三,数据的价值问题。一个商品能流通是因为它有价值,而且很容易被衡量出来,但是数据对于不同人的价值是不一样的,比如病人的数据对医药公司很有价值,但那对普通人没有价值,那如何对这个数据进行定价?这是当前难度非常大的地方。

另外,技术储备不足、环境不允许,在面对多样化的数据需求时,心有余而力不足,以上四点就是当前面临的一些难题。

数据共享的现有模式

那么,怎么样能实现数据安全可靠地共享呢?目前全球有五个方案:

第一个就是我们现在常见的API方案。

它其实已经在全世界范围内大量应用了,比如说大家在网上要注册账号的时候,都需要你把身份证信息发过去,这时候API(Application Programming Interface,应用程序接口又称为应用编程接口,是一组定义、程序及协议的集合,通过 API接口实现计算机软件之间的相互通信,提供通用功能集。它同时也是一种中间件,为各种不同平台提供数据共享)就发生作用了,它会把你的身份证信息,和姓名信息通过API方式发送到公安部的认证中心,检测身份证号码和姓名是否匹配。

它的好处是简单,但这个公司有可能把你的数据存下来再次利用,同时,它要做复杂的计算的时候就发生问题了,它没法比较你和另外一个人的关系,没法解决说你的信用问题,没法分析你的个人兴趣爱好,所以API方式有它非常大的局限性。

第二就是原始数据的线下模式。

数据只属于所有者,然后让别人进你的系统内进行分析,分析完之后在物理上做隔离,比如说因为医院不敢把数据拿到外面去,就让人工智能公司在医院里进行分析处理,最后只拿走结果模型,但这种方法的效率非常低,没法实现多方的数据融合。

第三种就是安全屋模式。能够把数据放到一个公共的安全屋里,然后在安全屋里进行分析处理,能够比较好地解决问题之后把模型拿走。

第四种也是现在非常流行的,在国际上我们叫多方隐私计算。就是用区块链技术以去中心化的模式,通过区块链的智能合约,把算法下发到每个数据的拥有者手中,然后实现分布式的确定计算。

最后一种,也是前几年很流行的,我们叫数据的私下买卖方式,这种模式是违法的,已经被国家大量地限制和禁止。

前四种是当前的主流模式,第一种模式简单但是拓展方向有限;第二种模式效率低且没法融合多方。

安全屋模式能解决数据汇总分析处理的问题,但是还是要数据汇总,它会有个心理压力,数据的第三方看到数据之后会不会泄漏出去,这是非常令人担忧的事情,就像我和我到同学不愿意告诉服务员我们的存款一样。

第四种就是区块链模式,通过去中心化,通过区块链模式能够让数据真正地保留在本地,然后让算法执行流动。

这几种模式到底有哪些应用场景呢?

数据开放的应用场景

第一种场景是企业内部的跨部门的业务数据。

比如说一个做汽车的公司,同时有保险业务,保险公司非常希望集团内的汽车公司,把数据给到保险公司,但汽车公司不愿意把数据交出去。

因此,我们可以通过安全屋或区块链的模式,把汽车的使用数据让保险公司去分析,最后把结果拿走,数据不会有任何流动,确保了数据的安全。

第二种场景是不同组织间的数据共享。

比如说某个监管机构,它要求各个公司把数据交给监管机构,如果在原始模式下,这些公司会非常担忧把数据交给监管机构后,数据的所有权发生转移了。现在通过安全屋和区块链模式,可以实现不同组织之间的整个数据共享,可以保证数据被很好地使用,但不会被拿走。

第三个场景是跨组织的数据汇总和交换。

比如很多公司会通过获取用户访问网页时留下的cookie来进行广告定向投放,但为了保障数据安全和隐私,现在各个公司和组织之间的cookie越来越被限制了,那么如何在保证隐私的情况下实现数据的汇集呢?

还有更重要的场景就是数据的对外开放。

你知道我们的数据都存在哪些地方吗?

第一个是大家所熟悉的各种大的互联网公司,第二是我们常见的政府部门,这里面存了我们从出生、上学,到工作的所有数据。第三就是各种央企、国企, 第四种就是各种中小互联网公司。

此外,除了BAT这样的大型互联网公司,很多拥有数据的中小型公司本身并不具备很好的数据分析能力,这时候就需要专门的大数据和人工智能的公司来做这样的工作,所以说人工智能将会是未来新一轮的社会驱动力。

如何让数据创造更多价值?

但是我们要知道,人工智能如果能有大的成就,核心在于要有足够的数据,并且在数据的使用、处理和分析中,很好地保护数据隐私。

去年欧洲颁布了《通用数据保护条例》,简称GDPR,这个法案很好地保护了数据隐私。但也有报告指出,GDPR对使用数据的严格限定给整个行业、社会和科技带来非常大的阻碍。

那在隐私安全和科技进步之间,如何能找到一个好的解决方案呢?

我们认为通过技术手段,通过区块链,通过多方隐私计算,能够实现数据的安全流通和使用,同时确保隐私,这会是一个非常重要的发展方向。

并且随着5G的快速发展,社会各方各面的信息都会被快速地记录、存储和分析,那么数据体量会更大,结合多方隐私计算,各种区块链技术,使得整个数据可以在安全的情况下被使用起来,整个技术会更加成熟,人工智能的发展也会更为快速。

最后,还有一个非常重要的话题,数据到底属于谁?

当我们使用互联网服务时,互联网企业会记录下我们的数据,那这个数据的所有权,是属于这些互联网公司的呢?还是属于我们?

现在有一些观点认为这些数据应该属于每个用户,也就是说,当Facebook使用用户数据的时候,它应该向用户付钱。

如果这个事情真的能实现的话,那未来每个人都是数据生产者,我们可以通过制造数据产生价值。

可能你在玩游戏、买东西的时候,每一次键盘的输入、每一次鼠标的点击、你的摄像头对你的记录,都在为这个社会创造价值。使用这些数据的公司都要为你的每一次行动来付费,真正实现数据生产者和数据所有者的统一,同时也能打破数据的垄断,保护好用户的隐私。

总而言之,数据作为新时代的生产资料,它的核心价值在于通过安全的流通,为社会创造更大的价值。

策划 | 曹威;编辑 | 颖仔;校对 | Lily;视频 | Eddie;版面 | 漫倩

本文为转载内容,授权事宜请联系原著作权人。