正在阅读:

碳云王俊:生命科学大数据时代刚刚开始,我们要创造它的未来

扫一扫下载界面新闻APP

碳云王俊:生命科学大数据时代刚刚开始,我们要创造它的未来

理解生命本身,要从数据开始。

马云说,人算不如天算,天算不如云计算。李彦宏说,互联网现在只是一道开胃菜,真正的主菜是人工智能。微软的沈向阳说,未来的每一个商业应用都会被AI颠覆掉。在周期理论者看来,继计算机革命之后,带动下一轮超级繁荣周期的科技,非机器人和人工智能莫属。

2017年4月2日,在被誉为中国IT产业风向标的年度盛会——中国(深圳)IT领袖峰会上,包括BAT掌门人在内的众多业界领袖同台PK,论剑智能新时代。而作为生命科学领域里最具创新力的AI独角兽公司,碳云智能创始人王俊受邀参加,热议“颠覆性技术与人类未来”。

在王俊看来,生命科学大数据时代刚刚开始,未来碳基世界和硅基世界会完全打通,“我们要在这个领域做非常充分的准备,创造它的到来!”以下为论坛实录节选:

/ 生命科学的大数据时代远远没有到来 /

王俊:生命本身就是数字化的,就是一个在运行的程序,只不过它的编译方式,运行原理不被我们所知道,我们还不理解,或者我们刚刚理解了一点。我们说ATCG是人类基因,我们(可以)把它读出来,好象一个人把一个软件程序读出来一样。我们说我们能不能够用测序的方法。以前任职华大基因做这一件事,把ATCG读出来,而且让这个读出来的成本越来越便宜,但问题是人类目前并不理解这个程序。

刚刚张首晟教授讲,人工智能三个核心要素:数据、计算能力和算法。我们先把后两个放在一边,单说数据本身。在座各位,你们有多少人手上有自己的基因数据?六个人。多少人在网络上有你的社交图片数据?多少人在网络上有你说话的数据?多少人有你走路走多少步的数据?我们就知道了,生命科学的大数据时代远远没有到来。

我们刚才举手的已经是非常高端的人群了,结果只有两三个人,其实我可能要真的跟他细聊一下,可能他手上有的只是片段基因数据,并不是自己全部真正的基因数据,基因已经是生命科学里面最简单的数据。

不知道在座各位,手上有没有自己此时此刻蛋白质的数据?没有。有没有此时此刻全部的代谢物数据?没有。这就更不用讲了,DNA甲基化怎么样?身体RNA数据等怎么样?我讲很多术语,你们听了可能都头晕,但这些都是要理解数字化生命科学的数据,在座应该没有什么人有。

我们有什么数据?我们手上有最多的是临床数据。绝大多数人都去过医院或者做过体检,所以在体检中心或者医院里面,可能有你的体检报告,你的诊疗报告。这是现在人工智能领域应用最多的,IBM Watson也开始,说能不能够把所有病人的病例资料拿过来,做人工智能的诊断,能不能够把自己当成一个医生,这是现在做的更多的。

/ 理解生命本身 要从数据开始 /

如果真的想理解生命本身,从结果去算是算不出来。比如中国糖尿病发生率非常高,得糖尿病的和要得糖尿病的中国成年人差不多1/3。跟糖尿病有关数据有哪些?目前唯一的途径是去医院里面测血糖,这是唯一数据,(仅仅)通过那样的血糖数据,和一些糖尿病用药数据,就希望让自己能够不得糖尿病?几乎不可能。

糖尿病管理体系里面应该做的第一件事,是(了解)糖尿病的原因,为什么来的?有人起点不好,有人生下来得糖尿病的概率高一点,这是你的起点,出厂程序好还是不好。另外一个,你的生活方式,饮食习惯好还是不好。我糖尿病风险高,但是我天天注意运动,饮食没有问题;我糖尿病风险低,但不注意管理身体天天胡吃海喝,可能还是会得糖尿病。这些数据多少人被记录过?

想管理自己的健康和生命,首先前提是多少数据真正被记录,而不是简简单单计步的数据,这是我做第二个公司碳云智能在做的事,核心使命就是帮助每个生命数字化,这数字是你没有过的东西。

/ 用人工智能学习生命的特质 /

第二个,生命本身是一套程序,可以被计算。今天喝一碗粥血糖怎么变。这个可以用数学公式精准描述,不是随机变化,今天喝碗粥想高就高想低就低。不是,生命是一台被精准控制的机器,可以被计算,理解生命最好办法,是用计算机里面的人工智能学习系统,学习你这个生命的特质。

我今天喝一碗粥,血糖怎么变的我记录下来,放进我的模型计算,有输入输出,不断重复再回过头来看,这个模型就会越来越准确。做一个计算机的王俊,这个计算机的王俊跟现实里的王俊一模一样:我跑马拉松它也跑,跑完马拉松之后身体跟我跑马拉松的结果一样,这样一个可计算的模型实施出来,未来就可以基于你的数据做一些精准的健康管理模型。

/ 未来碳基世界和硅基世界会完全打通 /

如果我们生命以碳为基础,我认为未来这个碳基世界和硅基世界会完全打通,硅基世界的人工智能,跟碳基本身这个体系会越来越相象,越来越理解对方。很多这样突破性东西,会在未来五到十年有非常大的变化。

但是我不想过度承诺,因为像我刚才讲的,连最简单的生物类型数据——基因,在这个高端人群里面都不超过1%,更不要讲在更广阔人群体系里面,生命科学大数据时代还没有真正的到来。

我们应该在这个领域里面做非常充分的准备,迎接它的到来,或者要创造它的到来,我觉得这是我们这一个领域里面应该做的一件事儿,但是它的时间和它的步数可能会很快,可能五年,三五年时间会有飞跃发展,十年可能整个你看到医疗体系,健康体系,保险体系会完全不一样。

在那个时候我想在座各位都能够等得了,我们76岁的平均寿命,到100岁可不可能,120岁可不可能?完全有可能,因为生命这一道程序的设计就是120岁。问题是能不能让这个程序可以运行到120岁,在于你能不能够理解和认知程序怎么运行的,这些东西都要在数据基础上能够完成。

这个年代刚刚开始,有一点像10年,15年前IT行业一样,或者互联网行业一样,刚刚在兴起,充满着机会,也充满着挑战。

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

碳云王俊:生命科学大数据时代刚刚开始,我们要创造它的未来

理解生命本身,要从数据开始。

马云说,人算不如天算,天算不如云计算。李彦宏说,互联网现在只是一道开胃菜,真正的主菜是人工智能。微软的沈向阳说,未来的每一个商业应用都会被AI颠覆掉。在周期理论者看来,继计算机革命之后,带动下一轮超级繁荣周期的科技,非机器人和人工智能莫属。

2017年4月2日,在被誉为中国IT产业风向标的年度盛会——中国(深圳)IT领袖峰会上,包括BAT掌门人在内的众多业界领袖同台PK,论剑智能新时代。而作为生命科学领域里最具创新力的AI独角兽公司,碳云智能创始人王俊受邀参加,热议“颠覆性技术与人类未来”。

在王俊看来,生命科学大数据时代刚刚开始,未来碳基世界和硅基世界会完全打通,“我们要在这个领域做非常充分的准备,创造它的到来!”以下为论坛实录节选:

/ 生命科学的大数据时代远远没有到来 /

王俊:生命本身就是数字化的,就是一个在运行的程序,只不过它的编译方式,运行原理不被我们所知道,我们还不理解,或者我们刚刚理解了一点。我们说ATCG是人类基因,我们(可以)把它读出来,好象一个人把一个软件程序读出来一样。我们说我们能不能够用测序的方法。以前任职华大基因做这一件事,把ATCG读出来,而且让这个读出来的成本越来越便宜,但问题是人类目前并不理解这个程序。

刚刚张首晟教授讲,人工智能三个核心要素:数据、计算能力和算法。我们先把后两个放在一边,单说数据本身。在座各位,你们有多少人手上有自己的基因数据?六个人。多少人在网络上有你的社交图片数据?多少人在网络上有你说话的数据?多少人有你走路走多少步的数据?我们就知道了,生命科学的大数据时代远远没有到来。

我们刚才举手的已经是非常高端的人群了,结果只有两三个人,其实我可能要真的跟他细聊一下,可能他手上有的只是片段基因数据,并不是自己全部真正的基因数据,基因已经是生命科学里面最简单的数据。

不知道在座各位,手上有没有自己此时此刻蛋白质的数据?没有。有没有此时此刻全部的代谢物数据?没有。这就更不用讲了,DNA甲基化怎么样?身体RNA数据等怎么样?我讲很多术语,你们听了可能都头晕,但这些都是要理解数字化生命科学的数据,在座应该没有什么人有。

我们有什么数据?我们手上有最多的是临床数据。绝大多数人都去过医院或者做过体检,所以在体检中心或者医院里面,可能有你的体检报告,你的诊疗报告。这是现在人工智能领域应用最多的,IBM Watson也开始,说能不能够把所有病人的病例资料拿过来,做人工智能的诊断,能不能够把自己当成一个医生,这是现在做的更多的。

/ 理解生命本身 要从数据开始 /

如果真的想理解生命本身,从结果去算是算不出来。比如中国糖尿病发生率非常高,得糖尿病的和要得糖尿病的中国成年人差不多1/3。跟糖尿病有关数据有哪些?目前唯一的途径是去医院里面测血糖,这是唯一数据,(仅仅)通过那样的血糖数据,和一些糖尿病用药数据,就希望让自己能够不得糖尿病?几乎不可能。

糖尿病管理体系里面应该做的第一件事,是(了解)糖尿病的原因,为什么来的?有人起点不好,有人生下来得糖尿病的概率高一点,这是你的起点,出厂程序好还是不好。另外一个,你的生活方式,饮食习惯好还是不好。我糖尿病风险高,但是我天天注意运动,饮食没有问题;我糖尿病风险低,但不注意管理身体天天胡吃海喝,可能还是会得糖尿病。这些数据多少人被记录过?

想管理自己的健康和生命,首先前提是多少数据真正被记录,而不是简简单单计步的数据,这是我做第二个公司碳云智能在做的事,核心使命就是帮助每个生命数字化,这数字是你没有过的东西。

/ 用人工智能学习生命的特质 /

第二个,生命本身是一套程序,可以被计算。今天喝一碗粥血糖怎么变。这个可以用数学公式精准描述,不是随机变化,今天喝碗粥想高就高想低就低。不是,生命是一台被精准控制的机器,可以被计算,理解生命最好办法,是用计算机里面的人工智能学习系统,学习你这个生命的特质。

我今天喝一碗粥,血糖怎么变的我记录下来,放进我的模型计算,有输入输出,不断重复再回过头来看,这个模型就会越来越准确。做一个计算机的王俊,这个计算机的王俊跟现实里的王俊一模一样:我跑马拉松它也跑,跑完马拉松之后身体跟我跑马拉松的结果一样,这样一个可计算的模型实施出来,未来就可以基于你的数据做一些精准的健康管理模型。

/ 未来碳基世界和硅基世界会完全打通 /

如果我们生命以碳为基础,我认为未来这个碳基世界和硅基世界会完全打通,硅基世界的人工智能,跟碳基本身这个体系会越来越相象,越来越理解对方。很多这样突破性东西,会在未来五到十年有非常大的变化。

但是我不想过度承诺,因为像我刚才讲的,连最简单的生物类型数据——基因,在这个高端人群里面都不超过1%,更不要讲在更广阔人群体系里面,生命科学大数据时代还没有真正的到来。

我们应该在这个领域里面做非常充分的准备,迎接它的到来,或者要创造它的到来,我觉得这是我们这一个领域里面应该做的一件事儿,但是它的时间和它的步数可能会很快,可能五年,三五年时间会有飞跃发展,十年可能整个你看到医疗体系,健康体系,保险体系会完全不一样。

在那个时候我想在座各位都能够等得了,我们76岁的平均寿命,到100岁可不可能,120岁可不可能?完全有可能,因为生命这一道程序的设计就是120岁。问题是能不能让这个程序可以运行到120岁,在于你能不能够理解和认知程序怎么运行的,这些东西都要在数据基础上能够完成。

这个年代刚刚开始,有一点像10年,15年前IT行业一样,或者互联网行业一样,刚刚在兴起,充满着机会,也充满着挑战。

本文为转载内容,授权事宜请联系原著作权人。