为什么说今天的人工智能，还不能替代医生给人看病？

发布时间：2021-09-14 16:50:24 所属栏目：大数据来源：互联网

导读：约翰霍普金斯医学院的娜塔莉特拉雅诺娃（Natalie Trayanova）教授，刚刚度过了魔鬼一般的一年。在外人看来，她的科研道路仿佛是一帆风顺。她带领的心血管造影技术团队拿着来自美国国立卫生研究院（NIH）的研究基金，过去三年光论文就发表了50多篇；她的项目

Genevera Allen｜EurekAlert!

她综合了一些研究结果，发现在某个样本的数据上表现出色的算法，不一定适用于所有情况，也并不能重复，在这种分类的基础上得出的诊疗意见，自然也是无意义的。“两个团队用不一样的数据，很可能得到完全不重合的亚型分类，”阿伦在会议报告上说。“这些‘发现’真的具有科学价值吗？背后是否有可靠的医学证据支撑？”

她表示，如果继续这样发展，医疗科学很有可能陷入“危机”。虽然有点悲观，但也不无道理。毕竟，不靠谱的算法在亚马逊上给你推荐一本你不喜欢的书，你不买就好了；但是“推荐”一个疗法，有时候却是关乎生死的。当然，这并不是说人类医生不会犯错误。但在面对错误的时候，医学诊断的循证基础，能够给我们提供充足的条件复盘错误、并探求避免的方法。而面对人工智能的黑箱，我们甚至很难知道机器为什么会错，应该如何纠正。

一边是人工智能领域大幅提高的计算能力与不断优化的算法，另一边却是临床医学对于证据的谨慎。在不同的学科进行交叉和对话的同时，两边是否在使用同一套语言体系，成为了解决问题的关键。

这个年代最常听到的一句话，是“什么专业都得写代码”。的确，像希维尔德森和布莱斯勒的实验室里，懂医学和懂计算机同等重要，甚至还需要统计等数据科学。越来越多的研究者开始恶补相关知识，注册线上课程，甚至去跟本科生挤教室。许多老教授也拉下面子，向年轻博士生和博士后取经。

而随着大数据和人工智能的广泛应用，医生们也要开始懂得怎样跑数据，即使不会编程也必须明晓其中的原理。“（数据科学）就像另一门语言，或者好几门语言，”英国惠康基金会桑格研究所的研究员蔡娜在接受 Mosaic Science 采访时的一席话，说出了生物、医药研究人员的心声。“我不得不把之前大脑中的生化路径、流程图，转化成编程代码。”

从某种程度上讲，编程和数据成为医学领域最重要的能力之一。然而，计算机领域和医学领域的学科逻辑和评价标准，却存在一些分歧。特拉雅诺娃说，“现在太多人醉心于技术细节的提升，你去参加一个学术会议，到处都是跟你吹嘘自己的技术表现有多好，算法性能有多棒，然后在核心期刊上发了多少论文这是他们领域的‘语言’。但最后能达到什么效果呢？” 说到这里，特拉雅诺娃摇了摇头。

“现有的大部分算法，包括诊断和预测等，都不是在传统的医学范式下研究出来的，不能直接体现医学所需要的指标，即使一些已经投入应用了，但可靠度、可应用程度等，都需要进一步验证。”宾夕法尼亚大学医学院血液和肿瘤专家拉维帕里克（Ravi Parikh）在电话里对我说。“他在《科学》期刊上发表的评论文章谈及了这个问题：当下的许多医疗人工智能相关的研究，都以计算能力、反应速度、概率分布曲线等作为指标，比如一个算法能够把判断某种征兆的速度提高百分之几之类。但是，这到底在临床上意味着什么？这对病人的治疗效果有多大增益？速度提高了，但误诊率呢？病人接受了这个诊断，是否病程变短、返诊率下降？这些所谓 “落脚点”（endpoint）才是医学关心的指标，也是监管机构是否给某个技术放行的依据。

一言以蔽之，人工智能想要治病救人，必须要接受医学标准的审视。特拉雅诺娃深知其中的不易，前文提到的3D造影技术即将投入大规模临床实验，最终的评判标准并不是技术、性能，而是手术的成功率。“接受了手术的病人，究竟有多少不用返工重来？返诊率是多少？”能够让临床医生彻底掌握这个技术，把除颤手术目前接近40%的返诊率大幅降低，才是这个技术成功的标志。

作者和特拉雅诺娃合影

希维尔德森也表示，算法必须要“翻译”成为医学实验的成果方才能称之为医疗，定量的测试和评估是一切的基矗而在临床实验中，需要照顾的不仅仅是数据，还有病人。“要验证现有技术的可用性、可靠性和效果，目前通用的方式是回溯性分析研究，这样才能在不影响病人的治疗水平的前提下得到好的结果，并且也需要伦理委员会的批准。”

而且，我们必须诚实面对算法的局限。所有的药物都有副作用和适用人群，同样，做人工智能的人也必须从“用算法去解决普适性问题”的思维中跳出，重视应用情景、数据来源和数据质量等等，学会医学语言的谨慎。监管也必须面对一些关键挑战例如，如何保证数据的多样性，如何打开人工智能和机器学习的“黑箱”，确定一个算法的具体原理与医学证据之间的联系。“目前可以做的是建立完善的事后审计机制（auditing system），追踪算法和数据之间的关系，以及可能出现的数据偏差。”帕里克说，“但最后，一定还是落在临床的表现上，保证效用和可重复性。”

我在希维尔德森的实验室里看到了一个比乒乓球略小的3D打印模型，质感柔韧，中间的裂痕用细密的针脚缝了起来。“这是一个有着先天心脏缺陷婴儿的心脏的一部分。”希维尔德森对我解释道，“我们用当前的造影技术，结合人工智能技术为心脏建模，然后打印出来供进行手术的医生练手。”

心脏模型

看着这个小小的模型，我仿佛能看到主刀医生和助手们围在屏幕前讨论手术方案，仔细观察和打量模型，思考着从哪里入手这才是人机的完美配合，也是当下的医疗技术带来的最实际的进步。“在诊断和治疗中，一个医生的训练、经验和观察依然是最重要的。即使是最好的技术，也只能是增强医生的知识和能力，而不是替代。” 希维尔德森说。

帕里克也认为，我们不应该拿人工智能和医生相比。关键并不在于人工智能本身的能力，而是人工智能和现有的医学条件结合，能够发挥多大的功效。医生多年所见、所识、所领悟的并不能完全被翻译成数据、变成机器学习的资料；而人工智能亦有更精准的观察、更快的速度和永不疲倦的眼。谈论“医生+算法”的效果，远比谈论如何替代、或者谁比谁好要更有意义。

未来的医疗场景，一定不是病人被送进机器人医生的诊所，进行全身扫描之后得到“智能”的诊疗，而是可复制、可量产的机器，为医生提供足够多有价值的参考，节省更多人力物力，让诊疗变得更普及、更平民、更快捷。医疗人工智能领域的科技树不是冲着天空、往高处长，而是伸开枝叶，为更多的人提供安全和健康的荫蔽。

（编辑：宿州站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2/2

首页