环球生活在线

谷歌AI乳腺癌筛查新打破准确率可超专家

放大字体  缩小字体 时间:2020-01-31 19:11:22  阅读:3479+ 作者:责任编辑NO。魏云龙0298

乳腺癌是全世界女性的头号癌症。据统计,全世界每年约有140万人被诊断为乳腺癌,而大约有50万人死于该病。在美国,八名女性中便会有一位在其一生中被诊断患有乳腺癌。

而要降低乳腺癌的死亡率,早期筛查、治疗是最为有效的手段。在英美国家,即使没有患病迹象的50岁以上女性也要接受乳腺癌筛查。目前,胸部X光成像是较常见的筛查方式,放射科医生通过检查影像是不是真的存在异常给出诊断结果。而即使是有着丰富经验的专家,也难免误诊:假阳性会给患者及其家庭带来痛苦,而假阴性则会耽误宝贵的治疗时间,十分致命。

医学界一直在研究如何利用 AI 技术来实现乳腺癌的早期筛查。近期一篇发表在《Nature》上的论文表明,谷歌DeepMind的研究人员已经训练了一套深度学习算法,可以精准、高效筛查乳腺癌,其准确率甚至可超越人类放射科医生。

此次研究并非谷歌健康涉足AI医学影像的首次尝试。此前,谷歌旗下的DeepMind已与NHS(英国国家医疗服务体系)合作开发了可准确检测眼部疾病和颈部肿瘤的AI。在过去两年间,英国帝国理工学院、西北大学、皇家萨里郡医院和谷歌健康的研究人员将DeepMind开发的深度学习系统用于来自英美女性的胸部X光影像上,发现AI能够在一定程度上帮助准确筛查乳腺癌患者。

谷歌健康主管兼英国负责人Dominic King说:“这是向安全有效使用这类技术迈出的又一步。”

研究人员最初用英国癌症研究中心的OPTIMAM数据库中76000位女性和美国15000位女性的去识别X光影像训练该算法;随后将英国25000份和美国3000份的胸部X光影像拉入该算法神经网络,模型给出患癌可能性分数;最后将AI结果与现实放射科医生的诊断作对比。

据DeepMind官网,每个数据包括四张影像

AI筛查准确率超放射科专家

结果显示,AI筛查乳腺癌的准确性可达放射科专家水平。与人类医生相比,该算法可减少癌症被误诊的情况。美国和英国的假阳性情况分别降低了5.7%和1.2%,假阴性情况则分别降低了9.4%和2.7%。

不过现实中的影像检查情况要复杂得多。在美国,胸部X光影像通常由一名放射科医生筛查,而英国至少由两名放射科医生筛查,当这两名医生出现分歧时,会有第三名甚至第四名医师来做出判断。对此,研究人员表示,DeepMind算法的准确性优于单名放射科医生,甚至“不逊色”于两位人类医生。

据皇家放射学会,英国目前共有542位专业的乳腺放射科医生,8%的医院存在该职位空缺,而全英放射科医生缺口至少在1104名左右。Dominic King指出,如果第二筛查医生的角色可以由AI取代,那便可以减轻一部分人员短缺。这也是放射科医生建议谷歌健康研究AI进行筛查的原因。“三四年前,英国一些高级乳腺放射科医生与我们取得联系,他们不仅认为乳腺癌筛查是AI可大展身手的领域,探索技术对于医疗服务的可持续性也至关重要,尤其是目前病例积压已久的英国。”

为了验证这一设想,研究人员进行了一项附加研究项目,模拟该算法如何与人类放射科医生共同工作。研究结果显示,AI和人类医生的诊断结果有88%是一致的,这在某种程度上预示着只有12%的X光影像需要由另一位放射科医师检查。不过,该研究使用的数据有限,只有六名美国背景的放射科医生接受研究测试,其中接受过乳腺影像研究级别培训的只有两位。谷歌健康的临床科学家、合著该研究的Christopher Kelly表示:“我们大家都希望未来对此进行更深入的研究,但仅是作为模拟,这也让我们对未来系统的发展潜力感到兴奋。”

皇家放射学会的临床放射学副院长Caroline Rubin强调,AI不能完全取代放射科医生,但却可当作其助手工作。她表示:“与其他医疗服务一样,乳腺成像及英国大范围的放射科医生短缺,迫切需要AI的帮助。而由于放射科医生的工作不仅仅检查图像,所以AI无法完全解决人员短缺问题。不过,它们将会是医生们的第二双眼睛和安全保障。”

除了准确性检查和模拟测试外,研究人员还试验了该系统是否可以推广开来,即是否可以在单个数据集上进行训练,之后应用于任何数据。为了验证这一点,他们将英国数据训练的算法应用于美国数据之上,结果不如美国数据训练出的算法那么准确——误诊率降低了3.5%,而使用美国数据的则减少了5.7%。

尽管目前的研究取得了较大的成功,但研究人员强调这仍处于早期阶段。谷歌研究人员表示,他们希望看到更多针对当前患者的研究,而非基于回顾性的历史数据。Kelly表示:“前瞻性研究是我们发现这些系统在现实世界中表现如何的唯一方法,特别是临床医生如何与AI交互。类似项目正在制定计划中,这是一个完全不同的研究计划,我们很高兴能够对其进行探索。”

皇家放射学会的Rubin同意这一说法。“前景大好的乳腺癌筛查AI产品的下一步是将其用于临床试验,用于实际筛查的患者,进行实践评估。这一过程需要英国公共卫生机构的监督。”她说。

AI医学影像的争议与未来

此前英国数据监管机构对于DeepMind违反数据保护法的裁定,再加上人们对于数据隐私的担忧,让谷歌谨慎地涉足这次医学研究。研究人员强调,胸部X光影像已做去识别处理,算法仅使用影像数据,完全省去患者个人隐私信息。据悉,此次研究中所用的英国方数据来自英国癌症研究中心专门收集的一组数据。

AI发展的另一个争议点是偏见,而该研究中尚未发现偏见存在。这在某种程度上预示着该算法对于任何影像都应同样有效,无论患者个体的具体细节如何——实际上,它在发现人类医生更难确诊的浸润性乳腺癌上更为有效。为了验证这一点,Kelly表示研究团队检查了与每个图像相关的元数据,以确保AI不会在少数族群上“表现不佳”。而为了确保没有这种偏见,未来也应做更深入的分析。

英国癌症研究中心剑桥研究所的高级研究员Andrew Holding指出避免这种偏见的最佳方法是在训练模型时使用多样化的数据。他说:“虽然该研究中使用了英美两国的数据消除偏见,但要代表临床中不同情况的患者,还有很长的路要走。”

“临床医生可以通过从广泛的生活经验中迅速适应像皮肤色素沉着这样的简单疾病,但是AI他们从未亲眼见过,不知道会以何种方式来进行诊断。类似的问题还有:某些医院使用的设备稍微老旧,以胸部X光成像为例,便会导致不同的诊断结果。这样一些问题虽然并非无法解决,但确实带来了巨大挑战。”

而成像设备的供应商不同也能带来偏差问题,这也是未来的研究需要注意的地方。据悉,谷歌这次研究中所使用的图像均来自Hologic,而更深入的研究也应支持其他设备的图像。

除此之外,DeepMind尚未发布该算法所使用的代码,也引起了一部分人的质疑。这篇论文中写道:“用于训练模型的代码对内部工具、基础架构和硬件有很大的依赖性,因此不对外进行发布。”研究人员还表示补充材料中对此进行了足够详细的描述,已足够非营利性数据库使用。

“这项研究的确很成功,但若作者们决定只公布AI是如何工作,却不提供源代码的话就很可惜了。源代码这些内容可以大幅度的提升该项研究的影响力,不但可以帮助其他科学家在此基础上继续研究,更好地探析如何得到结果,也有助于研究人员进行多次研究,避免重大错误的发生。” Andrew Holding说。

Holding还表示:“如果患者已经慷慨地将自己个人数据分享给谷歌这样的公司,那么这些公司也理应向这些患者提供研究的结果和方法,毕竟没有他们的同意,这项研究也不可能成功。”

谷歌健康的Kelly则认为黑匣子算法纵然能帮助医生了解其工作原理,但在临床上的用处并不大。我们大概能知道的是,这个特定的系统由三个不同的模型组成,三个模型共同给出一个分数,不过可能只有突出可疑区域的局部模型对于临床的作用会比较大。

这在某种程度上预示着尽管全局模型具有最准确的预测,但对人类放射科医生来说,却可能帮助不大。“尽管它可能表现最好,但这是一个黑匣子。” Holding补充说,“虽然我对'黑匣子'持怀疑态度,但相较而言,每个医生如何结合多年的经验做出诊断,我们也不是完全了解。”

最后,Holding认为:“目前在医学影像领域的这些研究,为这双数字眼找到了一条宽阔辽远的道路。利用AI发现潜在病症,用技术为人类提供更好的医疗,人类大可信心满满,不必担忧。”

本文译自Wired:DeepMind's new AI can spot breast cancer just as well as your doctor,原文网址:https://www.wired.co.uk/article/deepmind-google-ai-breast-cancer