Advances in Mining Heterogeneous Healthcare Data
条评论EHR数据:
- 结构化:
- 人口统计资料(demographics):年龄、性别、经济状况、保险类型、语言、种族、居住条件、家庭结构、地理位置、工作
- 用药(medications):医药处方、非处方药、毒品、酒精
- 代码:NDC, RxNorm
- 实验室结果(laboratory results):血液、尿液、粪便、唾液、脊髓液、腹水、混合液、骨髓、肺
- 代码:LOINC
- 账单(billing):
- 诊断(diagnoses):ICD-9,10
- 程序(procedures):CPT, ICD
- 持续的监护数据(continuous monitoring data):心率、脉搏、呼吸率、体温、氧饱和度、血压
- 多种类型的医学代码(multi-typed medical codes)
- 非结构化:
- 临床笔记与报告(clinical notes and reports):出院小结,主治与住院,护士,专科(放射、病理、心电图、营养、呼吸),会诊医生、咨询医生、急诊科
- 医学图像(medical images):X-ray, CT, MRI, PET
任务(analytics tasks):
- 表型(phenotyping):心律不齐、肾衰竭、失眠
- 风险预测
- 用药建议
- 疾病分类
- 医学语言翻译
- 医学报告生成
- 临床试验挖掘
结构化健康数据(structured health data)
- 表型:从EHR数据中学习医学概念表示
- Med2Vec, dipole, GRAM, KAME, HAP, Integrating multimodal EHR,
- 疾病/风险预测
- RETAIN, LSAN, HAM, TAM, HiTANet, MedPath, MedRetriever
- 治疗建议
- LEAP, GAMENet
非结构化数据
- 自动ICD编码/疾病分类
- HyperCore, C-MemNN, CAML, Fusion
- 医学语言翻译
- 医学报告生成
- 临床试验挖掘