职业教育委员会
第一期 MIMIC临床数据库机器学习数据挖掘实战培训班
日期:2024-06-28

第一期MIMIC临床数据库机器学习数据挖掘实战培训班

各企事业单位、高等院校及科研院所

MIMIC数据库(重症医学数据库)Medical Information Mart for Intensive Care是面向全球科研人员的可免费获取的公共大型临床数据库,搜集了超过38万名患者、45万次住院记录的临床数据,其中记录了患者的人口统计学信息、实验室检查、用药情况、生命体征、手术操作、疾病诊断、药物管理、生存状态等详细信息,包含了多种类型ICU(外科监护室、内科监护室、创伤外科监护室、心脏病监护室、心外恢复监护室)的入住信息。数据库发布了许多重要的随访信息,大量的数据信息有待研究人员去挖掘,探索属于自己的idea,任何研究人员都可以使用MIMIC数据库开展相关研究,发表属于自己的高质量SCI论著。

重症医学数据库(MIMIC)是由计算生理学实验室开发的公开数据集,其中包括与数千个重症监护病房入院相关的去识别化健康数据,致力于推动临床信息学、流行病学和机器学习的研究。

没有时间,没有条件收集病例资料,怎么办?

收集起来太费时间,总是漏掉指标,怎么办?

做了两三年,样本量还是不够怎么办?

想用公开数据库只找到肿瘤的,没有临床数据库怎么办?

中国社科教育培训中心职业教育委员会http://www.cssttcec.org.cn )联合工业与信息化技术培训网http://www.itcc.ac.cn )特举办MIMIC临床数据库机器学习数据挖掘实战培训班”,本次培训从床实际工作中疑难问题出发,帮助临床工作者利用公共临床数据库、机器学习技术解决临床科研实际问题。

一、培训目标:

1,熟悉MIMIC数据库,掌握应用公共数据库机进行临床疾病数据的提取与处理方法、临床科研数据挖掘和数据分析,为临床科研提供思路和路径。

2,经典文献复现:从数据提取到成文,SCI 零基础写作、选刊与投稿方法案例。

3,掌握MIMIC数据库权限获取,多种临床大数据统计分析方法的上机实践操作。

4,基于Python机器学习方法,帮助临床医生实现“大数据+人工智能”的方法自由。

二、主讲专家:

来自清华大学、北京大学、首都医科大学、中国科学院等高校医学专业学科带头人。

擅长医学数据统计分析、人工智能算法、机器学习、MIMIC 数据库数据架构等生物医学大数据挖掘,发表数十篇专业领域内学术论文及SCI论文,主编或参与编写多部著作参与多家三甲医院临床科研项目的研究合作,科研及授课经验很丰富。

三、培训时间:    20240726— 20240729   远程在线培训

                         (第一天数据及操作软件调试,共授课三天)

四、国内学者已见刊文章:

1,文章题目:脑卒中患者的长期生存率:来自ICU数据的甘油三酯-葡萄糖体重指数。

数据来源:通过访问重症监护医学信息市场IV (MIMIC-IV 2.2)数据库检索患者数据,根据TyG-BMI分类将患者分为三组。


2,文章题目:利用药物信息对重症监护室再入院患者的长期住院进行早期预测。

数据来源:从MIMIC-IV数据库中选择了18,572例ICU患者的记录用于本研究。


3,文章题目:机器学习预测危重老年患者住院期间急性肾脏疾病的风险和预后:基于互联网和可解释的模型研究。

数据来源:从MIMIC-IV数据库中选择了老年AKI患者(n=3542)和AKD患者(n=2661)的数据用于本研究


4,文章题目:利用住院记录和临床表格数据提高心力衰竭医院预后评估精度:多模态深度学习模型。

数据来源:用于开发和验证多模式模型的数据回顾性地来自3个开放获取的美国数据库,包括2001年至2019年从一家教学医院收集的重症监护医学信息市场III v1.4 (MIMIC-III)和MIMIC-IV v1.0,以及2014年至2015年从208家医院收集的eICU合作研究数据库v1.2。研究队列包括所有危重心衰患者。

五、参加对象:

各省市、自治区从事临床医学、基础医学、生物医学工程等科室主任医师、副主任医师、住院医师等临床科研工作者相关人员;国内各重点大学、科研院所相关研究领域的博士、硕士相关研究生和学者等:

六、课程大纲

一、MIMIC数据库基础

1.MIMIC数据库获取

2.MIMIC数据表介绍、基础数据提取

3.MIMIC临床大数据挖掘

4.MIMIC临床预测模型

5.基于机器学习的临床公共数据库的高分SCI论文解析

二、MIMIC数据库案例操作演练

1.MIMIC数据的基本情况

2.MIMIC数据库注册与使用权限

3.MIMIC数据的本地安装

4.MIMIC数据的表格结构

5.MIMIC数据库模块、table

6.MIMIC数据库查询指令SQL基础

7.MIMIC提取数据:提取某种疾病下的实验室指标、患者人口学统计指标等

8.MIMIC数据库官方函数

9.MIMIC-IV物化试图

10.Python连接MIMIC-IV数据库并图表可视化

11.MIMIC-IV数据库衍生表格mimic_derived配置和使用

三、MIMIC数据库案例操作演练

1.如何筛选与提取数据?

2.如何从表格中找到自己想要的数据?

3.如何做数据处理前的准备?

4.如何整理与转换数据,合并为有效数据?

5.如何处理真实数据中的异常值、缺失值?

6.临床大数据最容易发表的观察性研究怎么做?

7.如何做连续性变量的队列研究?

案例:如何做分类变量的队列研究?

案例:如何建立死亡预测模型?

案例:如何选对统计分析方法?

四、Python语言基础(上机操作)

1.python编程环境安装与配置

2.python基本数据结构

3.python的编程

控制流、函数与文件操作

Numpy基础

4.数据分析工具pandas与批量处理Excelxlwings模块。

使用python 批量进行数据分析:批量排序、筛选、分类汇总、求和、最大最小值;

基本统计学分析(查看数据信息、数值型变量的统计描述、数值变量的假设检验、分类变量的列联表和独立性检验)

线性模型与广义线性模型(线性模型、Logistic回归、Posisson回归、生存分析与COX回归、生存率的Kaplan-Meier估计、COX回归)

数据可视化工具matplotlibseaborn

五、机器学习模型(上机操作)

1.机器学习概述

2.数据准备

数据质量校验

数据分布与趋势探查

数据清洗

3.特征工程

特征变换

特征选择

4.有监督学习与无监督学习

5.机器学习算法常用模型

逻辑回归、KNN、决策树、随机森林、支持向量机、朴素贝叶斯、catboost

6.模型调参与模型验证

六、MIMIC高分SCI论文机器学习方法复现实战

1.胸腔心脏超声与败血症死亡率:MIMIC-III数据库分析

2.   基于列线图的无神经损伤的胸部骨折患者在重症监护室期间的死亡率:MIMIC-III临床数据库分析

3.血管升压药物启动时机与感染性休克患者死亡率的关系:MIMIC-IIIMIMIC-IV数据库分析

4. 解释性机器学习在预测重症心衰合并高血压患者28天内全因院内死亡率中的应用:

基于重症监护数据库-IVeICU数据库的回顾性队列研究

5.急性肾损伤与心脏手术患者预后的关联:MIMIC-III数据库分析

6.使用MIMIC III数据库中的静态和动态信息预测创伤患者的风险

7.使用未分级肝素抗凝治疗脓毒症诱导的凝血病的有利结果:对MIMIC-III数据库的回顾性分析

8.压力性溃疡预防、镇静剂和他汀类药物对呼吸机相关性肺炎的影响:基于MIMIC数据库的回顾性分析

 七、SCI 写作、选刊与投稿方法

1.SCI结构化写作,7大写作模块详解

2.如何选对投稿期刊,一投即中?

3.如何顺利完成投稿,注意事项有哪些?

4.如何回复审稿人意见和修改稿件?

八、课后交流

1.交流、微信群、QQ群建立;

2.咨询、合作。

3专业技术团队深入探讨。

七、报名联系方式:

联系人期老师                  手机(微信同号):15210196261

电话:010-56129268                官方咨询QQ513692711

E_mailcashq_ict@vip.163.com     网址 http://www.cssttcec.org.cn  

工业与信息化技术培训网:http://www.itcc.ac.cn