KDD’21 tutorial

EHR数据:

  • 结构化:
    • 人口统计资料(demographics):年龄、性别、经济状况、保险类型、语言、种族、居住条件、家庭结构、地理位置、工作
    • 用药(medications):医药处方、非处方药、毒品、酒精
      • 代码:NDC, RxNorm
    • 实验室结果(laboratory results):血液、尿液、粪便、唾液、脊髓液、腹水、混合液、骨髓、肺
      • 代码:LOINC
    • 账单(billing):
      • 诊断(diagnoses):ICD-9,10
      • 程序(procedures):CPT, ICD
    • 持续的监护数据(continuous monitoring data):心率、脉搏、呼吸率、体温、氧饱和度、血压
    • 多种类型的医学代码(multi-typed medical codes)
  • 非结构化:
    • 临床笔记与报告(clinical notes and reports):出院小结,主治与住院,护士,专科(放射、病理、心电图、营养、呼吸),会诊医生、咨询医生、急诊科
    • 医学图像(medical images):X-ray, CT, MRI, PET

任务(analytics tasks):

  • 表型(phenotyping):心律不齐、肾衰竭、失眠
  • 风险预测
  • 用药建议
  • 疾病分类
  • 医学语言翻译
  • 医学报告生成
  • 临床试验挖掘

结构化健康数据(structured health data)

  • 表型:从EHR数据中学习医学概念表示
    • Med2Vec, dipole, GRAM, KAME, HAP, Integrating multimodal EHR,
  • 疾病/风险预测
    • RETAIN, LSAN, HAM, TAM, HiTANet, MedPath, MedRetriever
  • 治疗建议
    • LEAP, GAMENet

非结构化数据

  • 自动ICD编码/疾病分类
    • HyperCore, C-MemNN, CAML, Fusion
  • 医学语言翻译
  • 医学报告生成
  • 临床试验挖掘