医疗保健中的大数据与机器学习 近年来,随着医疗保健大数据的时代的到来,机器学习的作用越来越大。什么是机器学习?它究竟能够扮演什么角色?具体方法是什么?很多疑问值得去讨论和学习。纵观文献,对于机器学习的介绍都较复杂,许多的文章晦涩难懂。 今天,分享哈佛医学院发表在《JAMA》杂志的观点文章《医疗保健中的大数据与机器学习》。这是一篇相对能够理解的文章。我这里进行了翻译稍,不妨来看看下。 作者Andrew L.B,Isaac S.K,哈佛医学院生物医学信息系 大数据和机器学习在某种程度上改变了现代生活的几乎所有方面。Netflix知道人们喜欢看什么电影,而Google根据他们的搜索历史知道人们想知道什么。实际上,谷歌最近已开始用机器学习算法替换其现有的许多非机器学习技术,并且人们非常乐观地认为这些技术可以在许多领域提供类似的改进。 毫无疑问,医学已经由于机器学习在大型医疗保健数据的应用而发生广泛的变革。最近的例子表明,大数据和机器学习可以创建与人类医师相媲美的算法。尽管起初机器学习和大数据似乎看起来很神秘,但实际上它们与临床医生都可以识别的大多数的传统统计模型密切相关。我们希望通过本文,阐明这些联系,将这些技术浅显易懂化,并对机器学习和大数据在医疗中的作用进行分析和展望。 机器学习最初被描述为一个程序,该程序学习如何根据数据自动执行任务或做出决定,而不是明确地对行为进行编程。但是,此定义非常广泛,几乎可以涵盖任何形式的数据驱动方法。 例如,考虑弗雷明翰(Framingham)心血管风险评分,该评分为各种因素分配分数总和,在此基础上可预测10年心血管风险的数字。这应该算是机器学习的一个例子吗?答案似乎不是。但是,对弗雷明翰风险评分的仔细检查表明,答案可能并不像最初看起来的那样。该分数最初是通过比例风险模型(COX回归)拟合5300多个患者的数据创建的,因此,弗雷明翰血管风险评分实际上完全是从数据中学到了"规则",将风险评分指定为机器学习算法可能看起来很奇怪,但是它确实是一种算法,也算机器学习一种。因此,这个例子说明了机器学习原始定义的不确定性。 将机器学习的算法想象为在完全人工指导的数据分析与完全机器指导的数据分析之间连续存在的过程,可能会更有用。要了解一个预测或诊断算法是机器学习方法的程度,需要了解人类在整个过程预定了多少结构或参数。人工指定预测算法的属性与从数据中学习这些属性之间的权衡就是所谓的机器学习一个广泛范围(或者成为机器学习算法谱)。 回到Framingham研究,创建原始的风险评分统计学家和临床专家共同做出许多重要决定,例如模型中包括哪些变量,因变量和自变量之间的关系以及变量转换和相互作用。由于要花费大量的人力来定义这些属性,因此本案例在机器学习领域的地位不高,不属于一个高程度的机器学习方法(在下图和补编中排名第19)。许多基于证据的临床实践都基于这种统计模型,因此在机器学习领域实际上存在许多临床决策(下图的左中)。在机器学习领域的最低端是启发式和经验法则,它们不直接涉及使用任何明确地从数据派生的规则或模型(图左下方)。 传统统计模型与深度学习都是机器学习方法。传统的临床研究使用精心设计的统计模型来分析来自成百上千患者的数据,因此在机器学习领域属于低水平机器学习。深度学习模型是top机器学习方法,最顶层是生成对抗网络,它可以通过检查现有图像的大型数据库来学习生成新图像。有关详细信息,请参见补编,包括支持的参考文献和缩写的扩展。 现在假设我们创建了一个新的心血管风险评分,这是包括对原始模型的可能扩展。例如,如果不直接添加风险因素,而将其相乘或除,或者如果存在着一个特别重要的风险因素,则应将整个分数平方。此外,如果事先不知道哪个变量将很重要,但是已经收集了数千个单独的测量值,那么如何从无限可能中识别出一个好的模型呢? 这正是高级机器学习算法尝试执行的操作。随着人类对算法的假设减少,机器算法在机器学习领域的地位进一步提高。但是,从来没有一个特定的阈值可以使统计模型突然变成"机器学习"。相反,所有这些方法都沿着一个连续体存在,该连续体由在算法上放置多少人工假设来确定。 最近,深度学习模型占据了机器学习领域占高级地位。深度学习模型是一种令人难以置信的复杂的人工神经元网络,旨在直接从原始数据创建准确的模型。研究人员最近展示了一种深度学习算法,该算法能够以等于或大于眼科医生的灵敏度从视网膜照片中检测出糖尿病性视网膜病变(上图中的顶部居中,序号4)。该模型直接从原始像素中学习了诊断过程。在一组由眼科医生组成的团队中,这些团队无需人工干预即可对图像进行正确的诊断。因为他们能够在很少的人工指导或事先假设的情况下学习任务,所以这些深度学习算法在机器学习领域的排名很高(上图,浅蓝色圆圈)。 尽管它们需要较少的人工指导,但用于图像识别的深度学习算法仍需要大量数据才能捕获现实世界图像固有的全部复杂性、多样性和细微差别。因此,这些算法通常需要数十万个示例来提取与感兴趣的结果相关的图像特征。机器学习领域的更高地位并不意味着优势,因为不同的任务需要不同程度的人员参与。尽管高级的算法通常非常灵活并且可以学习许多任务,但它们通常难以解释,并且大多充当"黑匣子"。相反,处于机器算法谱低的算法通常会产生易于人类理解和解释的输出。而且,频谱高端所提供的灵活性要求必须使用大量的计算资源来开发和部署这些算法, 正是由于在过去十年中可以使用更大的临床数据源和更快的计算机,机器学习领域的高端算法才变得实用和有用。医疗保健数据可以来自各种来源,包括电子医疗保健记录(包括实验室结果,影像学检查和诊断代码),健身追踪器,基因检测等。大数据代表着机会,对于医疗保健应用尤其如此。机器学习就是这样一种工具,可以在这种大规模规模上整合和理解医疗保健数据。 机器学习并不是可以将数据转化为黄金的神奇武器,相反它是对传统统计方法的自然扩展。机器学习是现代医疗保健系统的一种有价值且日益必要的工具。考虑到医生可能需要评估的大量信息,例如患者的个人病史,家族性疾病,基因组序列,药物治疗,社交媒体上的活动,到其他医院的住院治疗,获得指导临床决策的见识可能是一项艰巨的任务。随着对算法的赋予更多的控制权,重要的是要注意,这些新的算法决策工具无法保证公平性,公平性甚至准确性。尽管我们不愿重复这种陈词滥调,但即使采用最佳的机器学习算法,"垃圾进,垃圾出"的格言仍然是正确的。无论算法在机器学习方面是高是低,都必须使用最佳分析实践来确保最终结果可靠且有效。在医疗保健中尤其如此,因为这些算法有可能影响数百万患者的生命。 文献:Beam AL, Kohane IS. Big Data and Machine Learning in Health Care.JAMA. 2018; 319(13): 1317–1318. doi:10.1001/jama.2017.18391