专栏专题

专栏专题

专栏专题

当前位置:首页 > 专栏专题 > 专栏专题
  • 医疗大数据简介

  • 来源:昆明市官渡区人民医院   发布时间:2022/06/16   点击:456次

 

医疗大数据概念

狭义上的医疗大数据指的是医疗机构产生的数据,这是最主要的医疗大数据,产生于医院常规临床诊治、科研和管理过程,包括各种门急诊记录、住院记录、影像记录、实验室记录、用药记录、手术记录、随访记录和医保数据等。

广义上的医疗大数据涵盖来自于区域卫生服务平台大数据、医学研究或疾病监测大数据、自我量化大数据、互联网上与医学相关的网络大数据、生物标本和基因测序的生物信息大數据。

医疗大数据是个很宽泛的概念,他有很多详细的分类,包括:电子病历数据,这是患者就医过程中所产生的数据,包括患者基本信息、疾病主诉、检验数据、影像数据、诊断数据、治疗数据等,这类数据一般产生及存储在医疗机构的电子病历中,这也是医疗数据最主要的产生地。电子化的医疗病历方便了病历的存储和传输,但是并未达到进行数据分析的要求。大约80%的医疗数据是自由文本构成的非结构化数据,其中不仅包括大段的文字描述,也包括包含非统一文字的表格字段。通过医学自然语言理解技术,将非结构化医疗数据转化为适合计算机分析的结构化形式是医疗大数据分析的基础。电子病历中所采集的数据是数据量最多、最有价值的医疗数据。通过和临床信息系统的整合,内容涵盖了医院内的方方面面的临床数据集,数据互通互联。

大数据在医疗领域中的应用正在被逐渐铺开,其好处也将日益凸显,当前主要的意义在于:

1、通过对临床数据的分析,对患者进行更有前瞻性的治疗和照护,提高疾病的治疗效果

2、通过对最新的数据库的分析提高对临床决策的支持

3、通过对统计工具和算法的使用来改善临床试验的设计

4、通过对大数据集的分析为个性化医疗提供支持

5、通过优化业务决策支持,以确保医疗资源的适当分配

医疗大数据除了具有传统大数据的大量性、多样性、快速性之外,由于医疗行业的特殊性,使其还具有海量性、复杂性、精确性及安全性,同时由于医疗信息化建设的历史导致了异构性和封闭性。

海量性

医疗卫生机构除了传统临床和检验中产生的数据之外,随着物联网技术的发展,能够实现所有物物相连,比如便携式医疗设备上二维码标签所产生的数据,这些物品的数据相比传统的数据量要大的多。加之各种健身、健康可穿戴设备的出现,使得血压、心率、体重、血糖、心电图(EKG)等的监测都变为现实和可能,信息获取和分析的速度已从原来的按“天”计算,发展到按“小时”,按“秒”计算。此外,基因数据也是庞大的存在,一次全面的基因测序,产生的个人数据达到300 GB。平台数据量巨大,通常包含很多个人用户的各种医疗健康数据。

复杂性

一方面医疗领域包含了大量的医学专业用语,仅疾病名称就包括3万多种,另外还有数以万计的诊断、手术和药物名称,以及大量影像、医嘱等非结构化数据。由于医疗数据是不同临床诊疗服务过程中的产物,因此数据之间关系复杂,且易受到不同因素的影响,致使某些数据带有偏倚性。医院之间也存在诸多差别,如病人的个体特性和疾病程度、医院的诊断和治疗水平、医疗数据的记录和编码水平等。即使是同一个描述形式,其语法和语义上也不尽相同,更加导致了数据的复杂性。

精确性

医疗行业数据与人的健康、疾病和生命息息相关,任何失误都可能导致错误结论,并进一步误导临床诊治工作,对临床实践造成巨大损害。因此在数据处理时必须保证数据完整性和约束完整性。数据完整性指数据的正确性、一致性和相容性;约束完整性指数据与数据之间的关联关系,是表征数据间逻辑的唯一特征。保证约束完整性是数据发布和数据交换的前提,可方便数据处理过程,提高效率。

安全性

医疗数据除了包含病人隐私信息,也包含了大量关于医院运转、诊疗方法、药物疗效等信息。这些信息一般都较敏感,某些可能会涉及商业利益,因此目前存在的问题主要是医疗机构不愿意公开数据,而某些可进行数据处理的部门没有数据。

异构性(多样性)

由异构问题导致了数据的多样。主要包括数据源的异构、管理系统的异构及所采用标准的异构。综合健康服务平台数据来源广泛,包括医院、独立体检机构、社区卫生服务机构、区域医疗信息平台、第三方检测机构、新农合、医保社保、个人用户和网络等,且主要产生自制药企业/生命科学,临床医疗/实验室数据,费用报销/利用率,健康管理/社交网络中;平台数据内容多样,包括病史、体格检查、理化检查、居民基本健康档案、各类个人信息和网页等,涉及到的数据源的类型多样,有结构化数据、半结构化和非结构化数据;管理系统的异构既有管理系统所运行的操作系统、采取的数据库的不同,还有不同的管理系统采用不同技术实现的异构;所采用的标准目前主要有CDA,HL7,DCOM接口等。

封闭性

由于各独立的信息系统导致了信息孤岛,进而所产生出的数据只适合在该系统内部,每个不同的医疗机构都自成一个体系,是一个独立运行的实体,导致数据无法共享。今后的工作需要制定统一的数据表示方式或是采用某种统一的方法对其进行封装,才能实现统一的处理,最终实现全国范围内系统之间的互联互通。所有这些特性使得医疗大数据工作者在具体实践中面临巨大的挑战。

医疗大数据促进了医疗行业的发展,大数据在医疗行业中的广泛应用,为多层次医疗决策者提供智能决策支持,为大数据驱动的医疗决策提供科学依据,为医疗行业发展和从事大数据工作的人员提供指导。