AI影像征途漫漫，VoxelCloud发力全病种诊断和诊前筛查|界面新闻

指导 | 凯文李喆

调研 | 李喆

撰写 | 晴空

VoxelCloud（体素科技）通过深度挖掘海量医疗影像和临床数据，帮助医生提高阅片效率，并提供影像诊断所需全面量化信息。

作为VoxelCloud创始人，丁晓伟有着闪亮的背景。毕业于加州大学洛杉矶分校，获得计算机博士学位，辅修应用数学，是该所大学的计算机研究助理教授。

在校期间，丁晓伟就开始参与人工智能医疗领域的项目研究，积累了大量经验，而VoxelCloud是其美国洛杉矶研究院研究项目的延伸。

目前，VoxelCloud的影像产品主要为医院、体检中心、互联网医疗平台提供分析服务，覆盖胸部非增强CT、眼底、心脏冠脉、小儿视力障碍以及皮肤病五个领域。

有创检查金标准做结果对比，以冠心病产品构筑竞争壁垒

鉴于有大量的公开数据集和疾病高发性特征，AI影像诊断从肺结节筛查起步是创业公司的第一选择，而VoxelCloud却选择从心血管疾病进入AI影像诊断领域。

相比于肺部、肝脏等部位的肿瘤诊断产品开发，冠心病的数据收集、标记以及产品模型开发过程都更有难度。

VoxelCloud冠脉CT产品能量化分析冠脉斑块，实现冠脉无创数字活检，为医生评估冠心病风险提供辅助性诊断信息。

无创检查模型的实现过程并不简单，尤其需要大量的有创检查数据，冠心病检查数据量本就偏小，有创检查的数据积累更是一项挑战。

VoxelCloud与美国、中国的优质临床试验中心进行合作，冠脉CT产品数据来源于临床试验入组病人数据，其中绝大数病人做过有创检查确诊。

通过有创检查的金标准数据做对比验证，保证了模型的准确性，同时也通过精标注的冠心病数据和有创检查数据构筑了产品壁垒。

目前该产品已被多个多中心临床试验采用，并通过FDA认证。

提供眼底全病种解决方案，从数据根源保证产品可靠性

除了部分公司尚未涉足的冠脉CT产品，VoxelCloud也推出了眼底全病种解决方案。基于创始团队的海外知名医学中心背景，VoxelCloud的产品设计思路更符合国际惯例标准，体现在眼底产品基础数据的采集与模型训练两方面。

基础数据方面，拍摄眼底影像的方法要符合国际惯例，当前很多眼底筛查诊断竞赛所有数据都很容易忽略这一点。

VoxelCloud眼底数据来自美国筛查中心和中国医院眼科，都是严格的高质量拍摄、标注数据，从数据根源保证模型的可靠性。

模型训练方面，依据严格的国际惯例，糖网分级需要7-9张影像才能确定，如若是无法满足该条件的筛查场景，也需要2-3张眼底影像才能做糖网分级。

而且，单纯的糖网分级产品会忽略眼底其他疾病。VoxelCloud眼底全病种解方案，会提示病人是否需要做干预以及病变等级等重要信息，覆盖眼底所有病变类型，相比于只做糖网检测的产品，更具适用性和竞争力。

肺部非增强CT解决方案覆盖心胸全病种

眼底全病种解决方案的覆盖度思路，以及冠脉产品的金标准验证，同样适用于VoxelCloud肺癌分析部分，以海量金标准（活检）数据训练并建立AI模型，提供对肺结节定位、良恶性以及量化指标的智能分析。

诊断深度方面，肺癌模型能够结合其他临床数据，在做出良恶性风险判断的基础上，给出活检检查或者随访建议。

虽然市场上针对肺结节、肺癌的产品很多，但是在医院实际应用场景中，仅仅解决单病种识别、分析的产品无法满足需求。

体素科技的胸部非增强CT解决方案，同时对胸部非增强CT所能检测到的所有病种进行分析，生成自然语言报告，并且伴有异常部位的量化分析。

这种产品模型开发的复杂度更高，对数据和算法要求都明显高于单病种，但是也更贴合临床场景。因为医生在诊断影像的过程中，不能关注某一种病变而对其他病变视而不见。

以小儿视力筛查和皮肤病转诊产品切入诊前环节

当前市场上AI影像辅助诊断领域的头部玩家，在影像科筛查、诊断产品方面的布局早已进入白热化阶段，商业化落地也处于搁浅状态。

在此情景下，对于新方向的探索，VoxelCloud给出了自己的答案，切入诊前环节。

现阶段对三岁以下儿童视力检查的办法，只能检查出视力已经有严重问题的儿童，而寻求专业眼科医生检查又严重受制于医疗资源不足。

VoxelCloud推出的小儿视力障碍筛查产品利用人工智能技术，不仅能有效填补眼科医生不足的缺口，而且第一次使三岁以下儿童的视力障碍筛查变成现实。以前的检查方法要求儿童有沟通能力，三岁以下儿童被挡在检查范围之外。

VoxelCloud小儿视力障碍辅助筛查产品，只需让儿童面对录视频上传App，系统会自动识别儿童面部尤其是眼部的运动，依据儿童对不同视觉感知的反应进行筛查并做初步诊断，如若异常便提醒家长就医。

另一款同样适用于诊前的产品是皮肤病全病种转诊产品。

皮肤病全病种转诊产品需要把控用户上传的图像，并根据用户自拍的质量有限的图片，对疾病做出尽量正确的初步的判断，同时整理用户上传的文字描述，为医生呈现标准化的患者信息。

该产品主要应用于互联网医疗平台，可以实现精确的转诊，并通过“结构化”提炼病情描述，提升医生的诊断效率。

数据打造壁垒，技术能力和场景理解是公司优势

VoxelCloud产品从数据、技术和产品方面均具有较强的竞争力。由于积累了高质量数据，同时团队兼具医学背景和计算机背景，VoxelCloud在AI影像诊断领域具有较强的实力。

数据是AI影像识别产品的源头，VoxelCloud积累了大量冠脉精标注数据、有创检查数据，中美两个市场高质量眼底数据，以及肺部活检数据，在数据层面形成了一定的壁垒。

有了优质数据，还需要搭配高性能的算法，才能做出高质量的诊断产品。

VoxelCloud团队有来自加州大学洛杉矶分校、卡内基梅隆大学、亚利桑那州立大学等计算机视觉、机器学习领域高度活跃的科学家，在模型搭建方面具备优势。

在产品开发过程中，VoxelCloud创始团队中深入医院科室半年多，深入了解医生对于产品功能的需求，同时，来自西达－赛奈医疗中心、梅奥医学中心长期从事医疗影像分析的医学专家，保证了VoxelCloud产品在不同疾病影像诊断场景中的适用性。

同时，基于团队技术能力，VoxelCloud积极探索新的方向，在小儿视力障碍筛查和皮肤病转诊领域率先发力，有望先于影像诊断类产品实现商业化落地。

近期，爱分析对VoxelCloud创始人丁晓伟进行了深度访谈，现将部分精彩内容分享如下：

看好AI技术在医疗影像中的应用，切入高难度心血管疾病方向

爱分析：从UCLA毕业之后开始创业，当时是怎么考虑的？

丁晓伟：创业筹备工作做得比较早，注册只是法律层面的开始。2015年读书时就有创业的想法，初衷很简单，单纯从行业本身发展特点角度判断这是个机会。

当时深度学习用于互联网自然图像识别，医疗行业在技术应用层面相对比较滞后，整个美国业界也没有大规模使用，医学数据和医学影像分析研究还限于小数据量的方法。

深度学习的方法，对于合并入组的标记数据动辄需要几千例或者几万例，医院的体制能做到这种数量级很难。

当然，个别的国家项目或者大的NIH项目是能做得很大的，并且可能到今天为止的公司无法超越，但这不是普通研究人员可以掌握的，99%的研究人员的项目都是属于小打小闹。

作为一个99%里面的研究者，可能唯一的选择就是自己做公司，自己可以做决策，不受制于公立机构的研究经费。

爱分析：从2016年到现在，公司经历了哪些发展阶段？

丁晓伟：首先是得到资本认可，最早做的一批公司，对整个投资界的影响很大，教育了投资市场。

Voxel这两年完成了三轮正式的融资，我们认为整个行业的参与者，都还没有太正式的到B轮，也就是商业模式得到认可，只剩下扩张的阶段。所以我们认为最后一轮是A+轮。

其次是产品层面的积累。产品是公司的核心，Voxel团队来自加州大学洛杉矶分校、西达－赛奈医疗中心、梅奥医学中心、卡内基梅陇大学、亚利桑那州立大学等，大都在医疗领域耕耘20多年，在临床和产业界比较受认可，这是我们公司产品打造的基础。

产品层面，在心脏方面的积累比较深，同款产品美国版本通过FDA认证。

还有很多新的病种和部位的研究方向，能够套用原来的研究方法论。整个从临床医生交流需求、定义数据、收集标记数据到做产品，做验证，直到得到FDA认可的流程，团队比较有经验。

这是严肃的医疗器械，所以从做产品的态度和潜在质量风险等方面考虑，一个公司团队去做，比之前我们纯粹做研究得出的解决方案，有更大的市场。

爱分析：最开始做的是偏心脏、心血管方面的病种？

丁晓伟：心血管比大家主流在做的一些应用有难度，而且需求量也不是最多的。虽然心脏病是第一大病，但是无创的心脏影像数据量远不及肿瘤影像数据。

这两点的结合，使得创业公司一般不会进入心血管方向，但这是一个不小的市场。

爱分析：心血管病种比较难，是因为数据还是其他原因？

丁晓伟：分析的任务是比较特别的。因为心脏是一个动态管腔器官，涉及到很多很多流体力学、动力学，会形成一些狭窄管道、变形等等。

肿瘤分析多半是实体肿瘤，比如说肺里面就是肺部飘着一个结节或者一片肿瘤，肝脏是肝部有病变组织，相对来说目标区域比较明显。

心脏分析要对整个心脏结构和血流准确建模，真正到研发层面，数据标记就不只是圈出一个肿瘤那么简单了。可能心室心房、冠状动脉以及网络里面是有一些陈旧性或者新的斑块，这方面标记的难度很大。

爱分析：冠心病的产品现在能做到阶段性的判断，还是能提供全面量化的报告？

丁晓伟：全面量化的，包括血管的狭窄、斑块、性质，并且全球做过70多个大大小小的临床试验，验证结果与有创性检查的对应关系以及相关性，都得出比较好的相似度。

爱分析：准确性最终都是跟活检结果做对比？

丁晓伟：不见得一定叫活检，但最终都是跟心脏管腔内超声、心脏造影等有创检查的金标准做对比。

产品一大功能叫心脏数字破解，因为它能够通过无创检查预测有创检查的结果，比如斑块的性质等。

眼底影像产品数据有壁垒，追求干预性指标的量化

爱分析：切入眼部影像产品的考虑是？

丁晓伟：开始做眼科项目的初衷跟大部分公司不一样，很多公司切入眼底影像可能是因为起点比较低，网上有很多的数据库。但是忽略国际惯例和需求，用一张照片去做糖网分析。

我们做这个项目，给出的是眼底疾病的全部自动化诊断报告。

首先，在病种上关注的不只是糖网病，还有很多其他眼部疾病，比如老年性的黄斑变性、神经损伤、静脉栓塞等，以及可能的一些青光眼。

其次，覆盖超过20多种不同的病灶类型，比如渗出、出血点等一些能够量化的病灶类型，提供在眼底上所有可见的异常都能用自然语言描述的报告，产品设计思路就是医生看病的逻辑。

另外，所使用的数据方面，采用国际标准的拍摄方法。分析不同的疾病，不止是对于AI分析模型有要求，对于拍照的方法和标准都有要求，很多眼底病的竞赛，忽略了最基本的一些标准和常识。

比如糖尿病从一张照片上做分析，是不符合医学惯例的。如果是严格的糖网分级，需要七张到九张拼起来一起看，如果真的是在筛查环境中很难做到，也是用两张或者三张特定区域的照片。

所以我们按照医学的要求采集数据，而不是网上数据库。

爱分析：糖网眼科数据是通过什么渠道拿到的？

丁晓伟：混合了中国和美国病人，因为单纯中国或美国病人一般会有些缺点，混合能起到一些互补的作用。

爱分析：医院的数据可以拿出来，还是Voxel需要把自己的算法嫁接到医院PACS系统上？

丁晓伟：根据医院自己对数据的安全标准，如果数据不能出医院，我们在医院里做研发。如果数据能出院的话，我们一般是用美国的HIPAA（Health Insurance Portability andAccountability）标准做数据匿名化，下次数据不可能再还原到那个病人，对隐私保护非常强。

爱分析：眼底产品是明确勾画出所有病灶，还是只会出提示某些部位有问题的报告？

丁晓伟：对病人有影响、需要做干预手段的信息都会有，因为对于早期病人，给出不影响干预手段的信息，作用不是很大。

不是每一个出血点位置都要确定，但是系统会提示一些有意义的量，比如说出血点是不是大于2个，或者有没有出血点等属于分级依据的信息。

因为有一些分级依据一旦过了之后，疾病的严重程度和分级分期就完全不一样，干预手段也不一样。这类信息有量化标准，但不是无级量化的，能够给出病人需要的重要信息，使产品更稳定。

爱分析：眼底产品是更偏向于筛查？眼底产品假阳性现在如何？

丁晓伟：眼底产品我们自己的测试和在第三方的测试，临床实验测试上都是非常稳定的。

糖网分级方面个别情况下可能会出现一级的差别，但是我们能够保证算法的安全性，就是在涉及到干预手段的不同几个级别上面，几乎能做到不出问题。

在一些不影响干预手段的两级之间，有时候会发生混淆。但是比如说是打激光，还是不打激光的，病人需要是随访还是不需要随访，在这几个比较关键的行动决策的坎上，模型做得非常。

分级出问题有时候是不可避免的，就算是人工做分析，大家意见不统一也是经常有的，因为没有一个这种特别客观的标准，因为金标准就是人工阅片的结果，眼底没有活检金标准。

肺癌产品实现筛查到病灶管理全过程，活检数据是检验金标准

爱分析：肺部的产品现在能做到什么程度，能够进行良恶性判断？

丁晓伟：关于肺癌早筛和肺癌病灶管理的所有过程全都有。基本是先找到早期的病灶，再进行良恶性风险程度判断。

因为临床科室在诊断一个病人的时候，依靠很多家人病史等其他的信息，单从影像只能提供一部分信息。我们做的是从视觉角度的一个风险分层、调节。当然模型都是在有活检结果的病人身上训练，数据量也很大。

接着做病灶分割，就是量化。量化有体积、内部的特征，除了直方图特征以外，还做了很多跟良恶性的解释相关的特征，比如毛刺成像、有没有包含脂肪、有没有包含钙化的成分以及有没有血管穿过等，这些都是判断良性非常关键的视觉特点。

比如说如果一个节里面包含有明显的脂肪，结节的恶性的可能性就非常小，这种情况模型都会描述出来。

我们还根据国际惯例标准或者指南，对两次检查的生长速度做比较，通过帧像的绝对的大小等制定随访和下一步检查方案。不只是给出分析结果，还要给出下一步行动建议，才是临床上面最重要的。

爱分析：做患者管理的时候，会介入临床特征、饮食等其他的数据？

丁晓伟：需要这些信息，主要是来自HIS系统， RIS里面一般也都可以读到有用信息。

爱分析：肺部的判断依据是跟冠心病类似，还是主要是做量化？

丁晓伟：跟结构比较相关，病灶的大小、位置、还有它的一些特性。比如说大小是很客观的人手工画出来的大小，算法匹配程度较高。是在误差范围之内的，因为两个人对于同一个病灶的大小的测量也是不太一样。

良恶性是通过金标准来对比，没有任何的主观的意愿。但是比如说对于形象的描述，边缘是平滑或者有毛刺的、圆度是不是很大、有没有脂肪等，是靠人眼观察，作好记录。

闭环反馈需经过验证，专注现有产品线深入打磨产品

爱分析：医生使用过程会按照自己的逻辑习惯进行数据标注，这种标注会做到系统中用来提升产品？

丁晓伟：提升相对比较难。目前我们系统已经有这个功能，医生不同意算法给出的结果需要做微调的时候，需要关掉算法结果，改成他认为正确的结果，这些系统会自动记录。

用户可以自己选择让模型越来越像自己，或者保持原来的模型。我们自己收集的数据，都是经过非常严格的质控，模型本身不会出现有偏向的结果。

我们不认为用户自己改过的结果一定就是更好的，但是也会同意、尊重用户，因为有时候金标准是主观的。

爱分析：产品模型的训练更多依赖于自己收集的数据？

丁晓伟：如果某个医院用过一段时间，改了其中一部分病例，我们会先把它作为一个试用版，肯定需要做相关验证，确保他们改的是正确的。

爱分析：下一步会继续将现有病种做深，还是会覆盖更多的病种？

丁晓伟：其实覆盖一个部位就已经足够多的工作去做，我们会非常谨慎地去开展新的产品线，还是做好现在的为主。

对于一些疾病会做的更深一点，比如肺癌是大家最关心的问题，也是最有生命的危险的，这些病种我们会做得很深，甚至超过眼下的范畴。

现在我们已经跟UCLA的研究中心以及世界著名的一家肿瘤医院，联合开展肺部肿瘤的二次诊断和早筛的项目。

对于肺癌，从主观和客观两个角度同时观察，而且不是两票投票的一个办法，是混合特征之后在同一个模型中做判断，这是首次用这种方法。

能够帮一大部分有早期病灶，但又没法真正确诊的病人解决一些问题，这种症状的病人非常多，他们大多数的办法只能是随访。对于肿瘤来讲，有时候等一年、半年，对于患者自己的心理也是很大的煎熬。

两种角度检查的联合，能更早的给患者提供有效信息，并且这两个检查都是无创检查，对身体的影响都很小。

类似穿刺活检的检查，首先需要合适的病人，如果病灶很小， PET CT基本上看不出什么问题。这种情况下早期病人也不能做，就算能做，对身体有创伤，而且辐射量比较大，不是特别绿色环保的检查手段。

影像领域AI渗透有无限空间，BAT和PACS厂商都有各自进入优势

爱分析：阿里、腾讯等巨头也都在做医疗影像产品，会对VoxelCloud这样的创业公司产生威胁？

丁晓伟：我们已经感受到这一点了，他们的研究团队可以直接从其他业务转过来，而且前期可能对收入的要求也不是特别的高，会以占领市场为主。在市场定价方面给初创公司带来很大压力。

但是我们现在也可以跟最后一轮投资方腾讯有合作，优势互补，我们做的时间比较长一点，产品积累方面会比较有优势。

爱分析：影像领域未来技术的渗透率大概能达到多少？影像识别领域未来可能的识别场景会是什么样的？

丁晓伟：我觉得在医学方面，影像识别是人工智能应用比较靠谱的一个领域，数据信息的密度很大，很适合去做，结论也比较有理可循，训练模型的数据相对比较客观。

现在市场上也有不少企业，大家用两三年做出来的产品，所能覆盖的需求非常大，但依然只是影像识别领域的一个零头，要对整个行业产生巨大的覆盖面影响，还需要很长的时间。

这个行业的好处就是有做不完的Topic，在我看来技术渗透有无限的提高空间，最后的覆盖率也会非常高。首先是阅片，其次是核对，目前来看，很大程度上，很多的疾病阅片的第一步越来越多的会由机器来做。

爱分析：这个行业目前有创业公司、BAT等企业，PACS厂商会进入吗？

丁晓伟：会的，这一类厂商的优势是有自己的系统，因为已经有很多医院客户，也有部分数据。

但是我们公司团队的背景和研究风格，以及对于技术对行业改变层面的认识，都是我们的优势。