为什么说今天的人工智能,还不能替代医生给人看病?
发布时间:2021-09-14 16:50:24 所属栏目:大数据 来源:互联网
导读:约翰霍普金斯医学院的娜塔莉特拉雅诺娃(Natalie Trayanova)教授,刚刚度过了魔鬼一般的一年。 在外人看来,她的科研道路仿佛是一帆风顺。她带领的心血管造影技术团队拿着来自美国国立卫生研究院(NIH)的研究基金,过去三年光论文就发表了50多篇;她的项目
Genevera Allen|EurekAlert!
她综合了一些研究结果,发现在某个样本的数据上表现出色的算法,不一定适用于所有情况,也并不能重复,在这种分类的基础上得出的诊疗意见,自然也是无意义的。“两个团队用不一样的数据,很可能得到完全不重合的亚型分类,”阿伦在会议报告上说。“这些‘发现’真的具有科学价值吗?背后是否有可靠的医学证据支撑?”
她表示,如果继续这样发展,医疗科学很有可能陷入“危机”。虽然有点悲观,但也不无道理。毕竟,不靠谱的算法在亚马逊上给你推荐一本你不喜欢的书,你不买就好了;但是“推荐”一个疗法,有时候却是关乎生死的。当然,这并不是说人类医生不会犯错误。但在面对错误的时候,医学诊断的循证基础,能够给我们提供充足的条件复盘错误、并探求避免的方法。而面对人工智能的黑箱,我们甚至很难知道机器为什么会错,应该如何纠正。
一边是人工智能领域大幅提高的计算能力与不断优化的算法,另一边却是临床医学对于证据的谨慎。在不同的学科进行交叉和对话的同时,两边是否在使用同一套语言体系,成为了解决问题的关键。
1
3
1
这个年代最常听到的一句话,是“什么专业都得写代码”。的确,像希维尔德森和布莱斯勒的实验室里,懂医学和懂计算机同等重要,甚至还需要统计等数据科学。越来越多的研究者开始恶补相关知识,注册线上课程,甚至去跟本科生挤教室。许多老教授也拉下面子,向年轻博士生和博士后取经。
而随着大数据和人工智能的广泛应用,医生们也要开始懂得怎样跑数据,即使不会编程也必须明晓其中的原理。“(数据科学)就像另一门语言,或者好几门语言,”英国惠康基金会桑格研究所的研究员蔡娜在接受 Mosaic Science 采访时的一席话,说出了生物、医药研究人员的心声。“我不得不把之前大脑中的生化路径、流程图,转化成编程代码。”
从某种程度上讲,编程和数据成为医学领域最重要的能力之一。然而,计算机领域和医学领域的学科逻辑和评价标准,却存在一些分歧。特拉雅诺娃说,“现在太多人醉心于技术细节的提升,你去参加一个学术会议,到处都是跟你吹嘘自己的技术表现有多好,算法性能有多棒,然后在核心期刊上发了多少论文这是他们领域的‘语言’。但最后能达到什么效果呢?” 说到这里,特拉雅诺娃摇了摇头。
“现有的大部分算法,包括诊断和预测等,都不是在传统的医学范式下研究出来的,不能直接体现医学所需要的指标,即使一些已经投入应用了,但可靠度、可应用程度等,都需要进一步验证。”宾夕法尼亚大学医学院血液和肿瘤专家拉维帕里克(Ravi Parikh)在电话里对我说。“他在《科学》期刊上发表的评论文章谈及了这个问题:当下的许多医疗人工智能相关的研究,都以计算能力、反应速度、概率分布曲线等作为指标,比如一个算法能够把判断某种征兆的速度提高百分之几之类。但是,这到底在临床上意味着什么?这对病人的治疗效果有多大增益?速度提高了,但误诊率呢?病人接受了这个诊断,是否病程变短、返诊率下降?这些所谓 “落脚点”(endpoint)才是医学关心的指标,也是监管机构是否给某个技术放行的依据。
一言以蔽之,人工智能想要治病救人,必须要接受医学标准的审视。特拉雅诺娃深知其中的不易,前文提到的3D造影技术即将投入大规模临床实验,最终的评判标准并不是技术、性能,而是手术的成功率。“接受了手术的病人,究竟有多少不用返工重来?返诊率是多少?”能够让临床医生彻底掌握这个技术,把除颤手术目前接近40%的返诊率大幅降低,才是这个技术成功的标志。
作者和特拉雅诺娃合影
希维尔德森也表示,算法必须要“翻译”成为医学实验的成果方才能称之为医疗,定量的测试和评估是一切的基矗而在临床实验中,需要照顾的不仅仅是数据,还有病人。“要验证现有技术的可用性、可靠性和效果,目前通用的方式是回溯性分析研究,这样才能在不影响病人的治疗水平的前提下得到好的结果,并且也需要伦理委员会的批准。”
而且,我们必须诚实面对算法的局限。所有的药物都有副作用和适用人群,同样,做人工智能的人也必须从“用算法去解决普适性问题”的思维中跳出,重视应用情景、数据来源和数据质量等等,学会医学语言的谨慎。监管也必须面对一些关键挑战例如,如何保证数据的多样性,如何打开人工智能和机器学习的“黑箱”,确定一个算法的具体原理与医学证据之间的联系。“目前可以做的是建立完善的事后审计机制(auditing system),追踪算法和数据之间的关系,以及可能出现的数据偏差。”帕里克说,“但最后,一定还是落在临床的表现上,保证效用和可重复性。”
1
4
1
我在希维尔德森的实验室里看到了一个比乒乓球略小的3D打印模型,质感柔韧,中间的裂痕用细密的针脚缝了起来。“这是一个有着先天心脏缺陷婴儿的心脏的一部分。”希维尔德森对我解释道,“我们用当前的造影技术,结合人工智能技术为心脏建模,然后打印出来供进行手术的医生练手。”
心脏模型
看着这个小小的模型,我仿佛能看到主刀医生和助手们围在屏幕前讨论手术方案,仔细观察和打量模型,思考着从哪里入手这才是人机的完美配合,也是当下的医疗技术带来的最实际的进步。“在诊断和治疗中,一个医生的训练、经验和观察依然是最重要的。即使是最好的技术,也只能是增强医生的知识和能力,而不是替代。” 希维尔德森说。
帕里克也认为,我们不应该拿人工智能和医生相比。关键并不在于人工智能本身的能力,而是人工智能和现有的医学条件结合,能够发挥多大的功效。医生多年所见、所识、所领悟的并不能完全被翻译成数据、变成机器学习的资料;而人工智能亦有更精准的观察、更快的速度和永不疲倦的眼。谈论“医生+算法”的效果,远比谈论如何替代、或者谁比谁好要更有意义。
未来的医疗场景,一定不是病人被送进机器人医生的诊所,进行全身扫描之后得到“智能”的诊疗,而是可复制、可量产的机器,为医生提供足够多有价值的参考,节省更多人力物力,让诊疗变得更普及、更平民、更快捷。医疗人工智能领域的科技树不是冲着天空、往高处长,而是伸开枝叶,为更多的人提供安全和健康的荫蔽。
![]() (编辑:宿州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |