健康医疗大数据建模方法与应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

序言

当生命医学研究经历了艰辛劳动和不懈努力后,总渴望有新的发现、新的收获及新的希望。对生命医学的认识、探索及创造一直都伴随着认识和改造世界的方法学、方法论的发展和提升。信息技术的蓬勃发展使得健康医疗领域出现规模巨大、传递迅速、形式复杂多样、非结构化程度高的海量数据。数据来源包括居民健康档案、临床诊疗、健康/疾病监测、健康医疗保险、可穿戴设备移动监测、代谢组学(基因组、转录组、蛋白组、糖基组、代谢组等)等,形式可以是统计报表、空间数据、文字、声音、图像、超文本等各种数据信息。海量数据的出现促使健康医疗领域进入新的时代,如何利用统计模型将海量数据进行整合分析,进而实现个性化医疗、疾病预防和健康管理,是健康医疗领域当下面临的一个重要挑战。通过大数据对患者个人身体状况的分析,可为患者制订个性化治疗方案,起到更好的治疗效果;通过大数据对健康人群进行追踪,可得到疾病风险评估与预测模型,为早期识别疾病、实施干预奠定基础。从全新视角挖掘与应用的健康医疗大数据是国家重要的基础性战略资源和重要的生产要素,将给人类带来新财富,对科技创新、人才培养和产业发展等都具有重大意义。

健康医疗大数据是无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的健康数据集合,是需要新处理模式才能得到具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。健康医疗大数据领域包含不同维度获取、分析和利用大数据,其中如何基于模型驱动与数据驱动,采用先进、适宜的建模方法对健康医疗大数据进行分析,是本领域的关键核心问题,也是瓶颈技术问题。健康医疗大数据需要相关领域的专业人士与统计建模专家一起对数据进行有针对性地分析与信息挖掘,这种跨学科、跨领域合作能够实现对健康医疗大数据的有效利用与转化。

迄今为止,国内已有近700所本科院校设立了“数据科学与大数据技术”专业、近20所高校成立了健康医疗大数据或数据科学研究院,并招收大批博士生、硕士生。然而目前我国尚缺乏健康医疗大数据分析方法方面的教材及专著。顺应时势,首都医科大学郭秀花教授和李文斌教授组织全国10余所高校20余名专家共同撰写了这本具有鲜明特色的教材。本教材从健康医疗大数据的基本概念出发,按照健康医疗大数据的类型,介绍非结构化大数据的结构化处理方法、大数据的获取与管理方法、多种大数据建模的数据挖掘方法以及多种先进的深度学习方法。本教材注重分析方法的适用性与通用性,并将之与现代大数据处理的理论相结合,在确保教材科学性、严谨性、系统性的基础上,强调通俗易懂,突显实用、便于学习的特点。因此,本书可作为各医学院校数据科学与医学大数据等专业的教材,亦为从事健康医疗科学研究工作者的有益方法学书籍。有理由相信,本教材的出版将有益于推动健康医疗领域科技创新、人才培养和产业发展。

中国科学院院士

首都医科大学副校长

首都医科大学健康医疗大数据研究院院长

2022年6月于北京