近几十年,心脏病是导致美国人死亡的主要因素,所以患有心脏衰竭(HeartFailure)的美国人越来越多一点也不奇怪。预计到年,确诊患有心脏衰竭的美国成年人将会增加46%,这意味着患病人数将达到八百万,一半左右的人在确诊五年内死亡。
(AI科技评论按:心力衰竭简称心衰,是指由于心脏的收缩功能和/或舒张功能发生障碍,不能将静脉回心血量充分排出心脏,导致静脉系统血液淤积,动脉系统血液灌注不足,从而引起心脏循环障碍症候群)
心脏衰竭很难早确诊,在美国国家卫生研究院(NationalInstitutesofHealth)帮助下,IBMResearch的一个科学家团队联合SutterHealth的科学家与GeisingerHealthSystem的临床专家,利用基于电子病历(ElectronicHealthRecords)背后可能隐藏的信息,研究和预测心力衰竭。在过去三年里,利用自然语言处理、机器学习和大数据分析等AI最新进展,该团队训练了一个比现今典型诊断早一至两年确诊心力衰竭的模型。这项研究提出了关于训练模型所需数据以及实际权衡等方面的重要见解,并开发了更容易应用在未来模型的新应用方法。
正常心脏和衰竭心脏
来源:美国心脏协会
现在的医生通常会对病人安排心力衰竭测试,并在病历中记录患者心力衰竭的体征和症状。尽管已经做出了最大的努力,但是患者通常是在急性事件接受住院治疗之后,才被诊断出心力衰竭,此时疾病已经对身体造成了不可逆转的渐进性器官损伤。
该团队的研究重点是,在典型临床诊断的前一年或前几年,通过利用电子病历系统中包含的数据,检测和预测出病人患有心力衰竭的风险有多大。
为了实现他们的目标,应用自然语言处理和机器学习方法,该团队开发和应用了几种认知计算和AI技术来分析项目中的患者数据。
在项目过程中,团队致力于实现一系列目标,得到了一些意想不到的发现,其中包括:
1.第一个目的是了解FraminghamHeartFailureSignsandSymptoms(FHFSS)用于早期检测的有效性,FHFSS是临床医生通常用来诊断心力衰竭的传统风险因素。研究者使用自然语言处理技术(NLP),通过解析信息和识别概念(包括富氏风险标准(Framinghamriskcriteria)或其他类型的症状),从非结构化数据(如医生笔记)中提取信息。有趣的是,研究结果显示,28例原始FHFSS体征和症状中,只有6例确定是未来呈现心力衰竭的可靠预测因子。
2.第二个目的是,通过将医生笔记的非结构化数据与结构化电子病历数据相结合,确定能否更准确地预测心力衰竭。为此,团队应用机器学习方法来构建考虑变量组合的预测模型。研究结果显示,与FHFSS联合使用时,收集在电子病历中的其他常规数据类型(如疾病诊断,药物处方和实验室检查)可能是预测患者心力衰竭发作更有用的预测因素。
以上显示了心力衰竭预测研究的模型图,该模型可比当前手段早一到两年确定心力衰竭。
使用纵向电子病历数据(EHR),研究者在观察期中提取和分析了各种结构化和非结构化数据类型,其中索引日期代表可以进行预测的最早日期,预测期(predictionwindow)指的是传统手段诊断前,模型能够做出预测的一个时间段。
在帮助检测个体心力衰竭的可能性方面,研究还使团队深入认识到特定数据类型与实用性之间的权衡。例如,当使用更多样化的数据类型时,模型的性能得到了改善,其中诊断、用药遗嘱和住院数据三者之间的两两组合是最重要的数据类型。利用知识驱动的药物和诊断本体,将变量概括为更高层次的概念,并开发出数据驱动的方法来识别和选择最显着的变量,创建出更小和更强大的变量子集。最终,团队开发出性能和实用性都优良的预测模型。
这从临床的角度来看至关重要,因为模型中使用的患者因素可能超过了个,但是没有医疗保健专业人员希望输入如此多的变量。对于训练有效预测疾病模型所需数据的最低数量和类型,这些研究成果提出了可实现的指导方针。去年11月,发表在Circulation:CardiovascularQualityandOut白癜风多长时间能好白癜风发病原因