
指导 | 凯文 李喆
调研 | 李喆
撰写 | 晴空
VoxelCloud(体素科技)通过深度挖掘海量医疗影像和临床数据,帮助医生提高阅片效率,并提供影像诊断所需全面量化信息。
作为VoxelCloud创始人,丁晓伟有着闪亮的背景。毕业于加州大学洛杉矶分校,获得计算机博士学位,辅修应用数学,是该所大学的计算机研究助理教授。
在校期间,丁晓伟就开始参与人工智能医疗领域的项目研究,积累了大量经验,而VoxelCloud是其美国洛杉矶研究院研究项目的延伸。
目前,VoxelCloud的影像产品主要为医院、体检中心、互联网医疗平台提供分析服务,覆盖胸部非增强CT、眼底、心脏冠脉、小儿视力障碍以及皮肤病五个领域。

有创检查金标准做结果对比,以冠心病产品构筑竞争壁垒
鉴于有大量的公开数据集和疾病高发性特征,AI影像诊断从肺结节筛查起步是创业公司的第一选择,而VoxelCloud却选择从心血管疾病进入AI影像诊断领域。
相比于肺部、肝脏等部位的肿瘤诊断产品开发,冠心病的数据收集、标记以及产品模型开发过程都更有难度。
VoxelCloud冠脉CT产品能量化分析冠脉斑块,实现冠脉无创数字活检,为医生评估冠心病风险提供辅助性诊断信息。
无创检查模型的实现过程并不简单,尤其需要大量的有创检查数据,冠心病检查数据量本就偏小,有创检查的数据积累更是一项挑战。
VoxelCloud与美国、中国的优质临床试验中心进行合作,冠脉CT产品数据来源于临床试验入组病人数据,其中绝大数病人做过有创检查确诊。
通过有创检查的金标准数据做对比验证,保证了模型的准确性,同时也通过精标注的冠心病数据和有创检查数据构筑了产品壁垒。
目前该产品已被多个多中心临床试验采用,并通过FDA认证。
提供眼底全病种解决方案,从数据根源保证产品可靠性
除了部分公司尚未涉足的冠脉CT产品,VoxelCloud也推出了眼底全病种解决方案。基于创始团队的海外知名医学中心背景,VoxelCloud的产品设计思路更符合国际惯例标准,体现在眼底产品基础数据的采集与模型训练两方面。
基础数据方面,拍摄眼底影像的方法要符合国际惯例,当前很多眼底筛查诊断竞赛所有数据都很容易忽略这一点。
VoxelCloud眼底数据来自美国筛查中心和中国医院眼科,都是严格的高质量拍摄、标注数据,从数据根源保证模型的可靠性。
模型训练方面,依据严格的国际惯例,糖网分级需要7-9张影像才能确定,如若是无法满足该条件的筛查场景,也需要2-3张眼底影像才能做糖网分级。
而且,单纯的糖网分级产品会忽略眼底其他疾病。VoxelCloud眼底全病种解方案,会提示病人是否需要做干预以及病变等级等重要信息,覆盖眼底所有病变类型,相比于只做糖网检测的产品,更具适用性和竞争力。
肺部非增强CT解决方案覆盖心胸全病种
眼底全病种解决方案的覆盖度思路,以及冠脉产品的金标准验证,同样适用于VoxelCloud肺癌分析部分,以海量金标准(活检)数据训练并建立AI模型,提供对肺结节定位、良恶性以及量化指标的智能分析。
诊断深度方面,肺癌模型能够结合其他临床数据,在做出良恶性风险判断的基础上,给出活检检查或者随访建议。
虽然市场上针对肺结节、肺癌的产品很多,但是在医院实际应用场景中,仅仅解决单病种识别、分析的产品无法满足需求。
体素科技的胸部非增强CT解决方案,同时对胸部非增强CT所能检测到的所有病种进行分析,生成自然语言报告,并且伴有异常部位的量化分析。
这种产品模型开发的复杂度更高,对数据和算法要求都明显高于单病种,但是也更贴合临床场景。因为医生在诊断影像的过程中,不能关注某一种病变而对其他病变视而不见。
以小儿视力筛查和皮肤病转诊产品切入诊前环节
当前市场上AI影像辅助诊断领域的头部玩家,在影像科筛查、诊断产品方面的布局早已进入白热化阶段,商业化落地也处于搁浅状态。
在此情景下,对于新方向的探索,VoxelCloud给出了自己的答案,切入诊前环节。
现阶段对三岁以下儿童视力检查的办法,只能检查出视力已经有严重问题的儿童,而寻求专业眼科医生检查又严重受制于医疗资源不足。
VoxelCloud推出的小儿视力障碍筛查产品利用人工智能技术,不仅能有效填补眼科医生不足的缺口,而且第一次使三岁以下儿童的视力障碍筛查变成现实。以前的检查方法要求儿童有沟通能力,三岁以下儿童被挡在检查范围之外。
VoxelCloud小儿视力障碍辅助筛查产品,只需让儿童面对录视频上传App,系统会自动识别儿童面部尤其是眼部的运动,依据儿童对不同视觉感知的反应进行筛查并做初步诊断,如若异常便提醒家长就医。
另一款同样适用于诊前的产品是皮肤病全病种转诊产品。
皮肤病全病种转诊产品需要把控用户上传的图像,并根据用户自拍的质量有限的图片,对疾病做出尽量正确的初步的判断,同时整理用户上传的文字描述,为医生呈现标准化的患者信息。
该产品主要应用于互联网医疗平台,可以实现精确的转诊,并通过“结构化”提炼病情描述,提升医生的诊断效率。
数据打造壁垒,技术能力和场景理解是公司优势
VoxelCloud产品从数据、技术和产品方面均具有较强的竞争力。由于积累了高质量数据,同时团队兼具医学背景和计算机背景,VoxelCloud在AI影像诊断领域具有较强的实力。
数据是AI影像识别产品的源头,VoxelCloud积累了大量冠脉精标注数据、有创检查数据,中美两个市场高质量眼底数据,以及肺部活检数据,在数据层面形成了一定的壁垒。
有了优质数据,还需要搭配高性能的算法,才能做出高质量的诊断产品。
VoxelCloud团队有来自加州大学洛杉矶分校、卡内基梅隆大学、亚利桑那州立大学等计算机视觉、机器学习领域高度活跃的科学家,在模型搭建方面具备优势。
在产品开发过程中,VoxelCloud创始团队中深入医院科室半年多,深入了解医生对于产品功能的需求,同时,来自西达-赛奈医疗中心、梅奥医学中心长期从事医疗影像分析的医学专家,保证了VoxelCloud产品在不同疾病影像诊断场景中的适用性。
同时,基于团队技术能力,VoxelCloud积极探索新的方向,在小儿视力障碍筛查和皮肤病转诊领域率先发力,有望先于影像诊断类产品实现商业化落地。

近期,爱分析对VoxelCloud创始人丁晓伟进行了深度访谈,现将部分精彩内容分享如下:
看好AI技术在医疗影像中的应用,切入高难度心血管疾病方向
爱分析:从UCLA毕业之后开始创业,当时是怎么考虑的?
丁晓伟:创业筹备工作做得比较早,注册只是法律层面的开始。2015年读书时就有创业的想法,初衷很简单,单纯从行业本身发展特点角度判断这是个机会。
当时深度学习用于互联网自然图像识别,医疗行业在技术应用层面相对比较滞后,整个美国业界也没有大规模使用,医学数据和医学影像分析研究还限于小数据量的方法。
深度学习的方法,对于合并入组的标记数据动辄需要几千例或者几万例,医院的体制能做到这种数量级很难。
当然,个别的国家项目或者大的NIH项目是能做得很大的,并且可能到今天为止的公司无法超越,但这不是普通研究人员可以掌握的,99%的研究人员的项目都是属于小打小闹。
作为一个99%里面的研究者,可能唯一的选择就是自己做公司,自己可以做决策,不受制于公立机构的研究经费。
爱分析:从2016年到现在,公司经历了哪些发展阶段?
丁晓伟:首先是得到资本认可,最早做的一批公司,对整个投资界的影响很大,教育了投资市场。
Voxel这两年完成了三轮正式的融资,我们认为整个行业的参与者,都还没有太正式的到B轮,也就是商业模式得到认可,只剩下扩张的阶段。所以我们认为最后一轮是A+轮。
其次是产品层面的积累。产品是公司的核心,Voxel团队来自加州大学洛杉矶分校、西达-赛奈医疗中心、梅奥医学中心、卡内基梅陇大学、亚利桑那州立大学等,大都在医疗领域耕耘20多年,在临床和产业界比较受认可,这是我们公司产品打造的基础。
产品层面,在心脏方面的积累比较深,同款产品美国版本通过FDA认证。
还有很多新的病种和部位的研究方向,能够套用原来的研究方法论。整个从临床医生交流需求、定义数据、收集标记数据到做产品,做验证,直到得到FDA认可的流程,团队比较有经验。
这是严肃的医疗器械,所以从做产品的态度和潜在质量风险等方面考虑,一个公司团队去做,比之前我们纯粹做研究得出的解决方案,有更大的市场。
爱分析:最开始做的是偏心脏、心血管方面的病种?
丁晓伟:心血管比大家主流在做的一些应用有难度,而且需求量也不是最多的。虽然心脏病是第一大病,但是无创的心脏影像数据量远不及肿瘤影像数据。
这两点的结合,使得创业公司一般不会进入心血管方向,但这是一个不小的市场。
爱分析:心血管病种比较难,是因为数据还是其他原因?
丁晓伟:分析的任务是比较特别的。因为心脏是一个动态管腔器官,涉及到很多很多流体力学、动力学,会形成一些狭窄管道、变形等等。
肿瘤分析多半是实体肿瘤,比如说肺里面就是肺部飘着一个结节或者一片肿瘤,肝脏是肝部有病变组织,相对来说目标区域比较明显。
心脏分析要对整个心脏结构和血流准确建模,真正到研发层面,数据标记就不只是圈出一个肿瘤那么简单了。可能心室心房、冠状动脉以及网络里面是有一些陈旧性或者新的斑块,这方面标记的难度很大。
爱分析:冠心病的产品现在能做到阶段性的判断,还是能提供全面量化的报告?
丁晓伟:全面量化的,包括血管的狭窄、斑块、性质,并且全球做过70多个大大小小的临床试验,验证结果与有创性检查的对应关系以及相关性,都得出比较好的相似度。
爱分析:准确性最终都是跟活检结果做对比?
丁晓伟:不见得一定叫活检,但最终都是跟心脏管腔内超声、心脏造影等有创检查的金标准做对比。
产品一大功能叫心脏数字破解,因为它能够通过无创检查预测有创检查的结果,比如斑块的性质等。
眼底影像产品数据有壁垒,追求干预性指标的量化
爱分析:切入眼部影像产品的考虑是?
丁晓伟:开始做眼科项目的初衷跟大部分公司不一样,很多公司切入眼底影像可能是因为起点比较低,网上有很多的数据库。但是忽略国际惯例和需求,用一张照片去做糖网分析。
我们做这个项目,给出的是眼底疾病的全部自动化诊断报告。
首先,在病种上关注的不只是糖网病,还有很多其他眼部疾病,比如老年性的黄斑变性、神经损伤、静脉栓塞等,以及可能的一些青光眼。
其次,覆盖超过20多种不同的病灶类型,比如渗出、出血点等一些能够量化的病灶类型,提供在眼底上所有可见的异常都能用自然语言描述的报告,产品设计思路就是医生看病的逻辑。
另外,所使用的数据方面,采用国际标准的拍摄方法。分析不同的疾病,不止是对于AI分析模型有要求,对于拍照的方法和标准都有要求,很多眼底病的竞赛,忽略了最基本的一些标准和常识。
比如糖尿病从一张照片上做分析,是不符合医学惯例的。如果是严格的糖网分级,需要七张到九张拼起来一起看,如果真的是在筛查环境中很难做到,也是用两张或者三张特定区域的照片。
所以我们按照医学的要求采集数据,而不是网上数据库。
爱分析:糖网眼科数据是通过什么渠道拿到的?
丁晓伟:混合了中国和美国病人,因为单纯中国或美国病人一般会有些缺点,混合能起到一些互补的作用。
爱分析:医院的数据可以拿出来,还是Voxel需要把自己的算法嫁接到医院PACS系统上?
丁晓伟:根据医院自己对数据的安全标准,如果数据不能出医院,我们在医院里做研发。如果数据能出院的话,我们一般是用美国的HIPAA(Health Insurance Portability andAccountability)标准做数据匿名化,下次数据不可能再还原到那个病人,对隐私保护非常强。
爱分析:眼底产品是明确勾画出所有病灶,还是只会出提示某些部位有问题的报告?
丁晓伟:对病人有影响、需要做干预手段的信息都会有,因为对于早期病人,给出不影响干预手段的信息,作用不是很大。
不是每一个出血点位置都要确定,但是系统会提示一些有意义的量,比如说出血点是不是大于2个,或者有没有出血点等属于分级依据的信息。
因为有一些分级依据一旦过了之后,疾病的严重程度和分级分期就完全不一样,干预手段也不一样。这类信息有量化标准,但不是无级量化的,能够给出病人需要的重要信息,使产品更稳定。
爱分析:眼底产品是更偏向于筛查?眼底产品假阳性现在如何?
丁晓伟:眼底产品我们自己的测试和在第三方的测试,临床实验测试上都是非常稳定的。
糖网分级方面个别情况下可能会出现一级的差别,但是我们能够保证算法的安全性,就是在涉及到干预手段的不同几个级别上面,几乎能做到不出问题。
在一些不影响干预手段的两级之间,有时候会发生混淆。但是比如说是打激光,还是不打激光的,病人需要是随访还是不需要随访,在这几个比较关键的行动决策的坎上,模型做得非常。
分级出问题有时候是不可避免的,就算是人工做分析,大家意见不统一也是经常有的,因为没有一个这种特别客观的标准,因为金标准就是人工阅片的结果,眼底没有活检金标准。
肺癌产品实现筛查到病灶管理全过程,活检数据是检验金标准
爱分析:肺部的产品现在能做到什么程度,能够进行良恶性判断?
丁晓伟:关于肺癌早筛和肺癌病灶管理的所有过程全都有。基本是先找到早期的病灶,再进行良恶性风险程度判断。
因为临床科室在诊断一个病人的时候,依靠很多家人病史等其他的信息,单从影像只能提供一部分信息。我们做的是从视觉角度的一个风险分层、调节。当然模型都是在有活检结果的病人身上训练,数据量也很大。
接着做病灶分割,就是量化。量化有体积、内部的特征,除了直方图特征以外,还做了很多跟良恶性的解释相关的特征,比如毛刺成像、有没有包含脂肪、有没有包含钙化的成分以及有没有血管穿过等,这些都是判断良性非常关键的视觉特点。
比如说如果一个节里面包含有明显的脂肪,结节的恶性的可能性就非常小,这种情况模型都会描述出来。
我们还根据国际惯例标准或者指南,对两次检查的生长速度做比较,通过帧像的绝对的大小等制定随访和下一步检查方案。不只是给出分析结果,还要给出下一步行动建议,才是临床上面最重要的。
爱分析:做患者管理的时候,会介入临床特征、饮食等其他的数据?
丁晓伟:需要这些信息,主要是来自HIS系统, RIS里面一般也都可以读到有用信息。
爱分析:肺部的判断依据是跟冠心病类似,还是主要是做量化?
丁晓伟:跟结构比较相关,病灶的大小、位置、还有它的一些特性。比如说大小是很客观的人手工画出来的大小,算法匹配程度较高。是在误差范围之内的,因为两个人对于同一个病灶的大小的测量也是不太一样。
良恶性是通过金标准来对比,没有任何的主观的意愿。但是比如说对于形象的描述,边缘是平滑或者有毛刺的、圆度是不是很大、有没有脂肪等,是靠人眼观察,作好记录。
闭环反馈需经过验证,专注现有产品线深入打磨产品
爱分析:医生使用过程会按照自己的逻辑习惯进行数据标注,这种标注会做到系统中用来提升产品?
丁晓伟:提升相对比较难。目前我们系统已经有这个功能,医生不同意算法给出的结果需要做微调的时候,需要关掉算法结果,改成他认为正确的结果,这些系统会自动记录。
用户可以自己选择让模型越来越像自己,或者保持原来的模型。我们自己收集的数据,都是经过非常严格的质控,模型本身不会出现有偏向的结果。
我们不认为用户自己改过的结果一定就是更好的,但是也会同意、尊重用户,因为有时候金标准是主观的。
爱分析:产品模型的训练更多依赖于自己收集的数据?
丁晓伟:如果某个医院用过一段时间,改了其中一部分病例,我们会先把它作为一个试用版,肯定需要做相关验证,确保他们改的是正确的。
爱分析:下一步会继续将现有病种做深,还是会覆盖更多的病种?
丁晓伟:其实覆盖一个部位就已经足够多的工作去做,我们会非常谨慎地去开展新的产品线,还是做好现在的为主。
对于一些疾病会做的更深一点,比如肺癌是大家最关心的问题,也是最有生命的危险的,这些病种我们会做得很深,甚至超过眼下的范畴。
现在我们已经跟UCLA的研究中心以及世界著名的一家肿瘤医院,联合开展肺部肿瘤的二次诊断和早筛的项目。
对于肺癌,从主观和客观两个角度同时观察,而且不是两票投票的一个办法,是混合特征之后在同一个模型中做判断,这是首次用这种方法。
能够帮一大部分有早期病灶,但又没法真正确诊的病人解决一些问题,这种症状的病人非常多,他们大多数的办法只能是随访。对于肿瘤来讲,有时候等一年、半年,对于患者自己的心理也是很大的煎熬。
两种角度检查的联合,能更早的给患者提供有效信息,并且这两个检查都是无创检查,对身体的影响都很小。
类似穿刺活检的检查,首先需要合适的病人,如果病灶很小, PET CT基本上看不出什么问题。这种情况下早期病人也不能做,就算能做,对身体有创伤,而且辐射量比较大,不是特别绿色环保的检查手段。
影像领域AI渗透有无限空间,BAT和PACS厂商都有各自进入优势
爱分析:阿里、腾讯等巨头也都在做医疗影像产品,会对VoxelCloud这样的创业公司产生威胁?
丁晓伟:我们已经感受到这一点了,他们的研究团队可以直接从其他业务转过来,而且前期可能对收入的要求也不是特别的高,会以占领市场为主。在市场定价方面给初创公司带来很大压力。
但是我们现在也可以跟最后一轮投资方腾讯有合作,优势互补,我们做的时间比较长一点,产品积累方面会比较有优势。
爱分析:影像领域未来技术的渗透率大概能达到多少?影像识别领域未来可能的识别场景会是什么样的?
丁晓伟:我觉得在医学方面,影像识别是人工智能应用比较靠谱的一个领域,数据信息的密度很大,很适合去做,结论也比较有理可循,训练模型的数据相对比较客观。
现在市场上也有不少企业,大家用两三年做出来的产品,所能覆盖的需求非常大,但依然只是影像识别领域的一个零头,要对整个行业产生巨大的覆盖面影响,还需要很长的时间。
这个行业的好处就是有做不完的Topic,在我看来技术渗透有无限的提高空间,最后的覆盖率也会非常高。首先是阅片,其次是核对,目前来看,很大程度上,很多的疾病阅片的第一步越来越多的会由机器来做。
爱分析:这个行业目前有创业公司、BAT等企业,PACS厂商会进入吗?
丁晓伟:会的,这一类厂商的优势是有自己的系统,因为已经有很多医院客户,也有部分数据。
但是我们公司团队的背景和研究风格,以及对于技术对行业改变层面的认识,都是我们的优势。


评论