第十八期 医学生物信息学公共数据深度挖掘 临床应用培训班
各企事业单位、高等院校及科研院所:
当前,我国临床医学数据资源丰富,但很多医学数据资源并未充分利用,医学数据资源也未能充分解读,造成医院医学数据资源利用率低。然而,一系列问题基础诸问题对于广大医务工作者来说,是影响其进一步学习和科研应用的瓶颈。
没有实验怎么发表SCI论文?
手头有很多数据,不知道该怎么进一步挖掘分析?
如何寻找关键靶点?
不精通挖掘GEO、TCGA数据库怎么办?
怎样才能做出高大上的医学图表?
中国社科教育培训中心职业教育委员会(http://www.cssttcec.org.cn )联合工业与信息化技术培训网(http://www.itcc.ac.cn )特举办“医学生物信息学公共数据深度挖掘临床应用培训班”。本次培训通过临床科研思路设计、医学统计分析和生物信息学在医学领域的应用培训,提高医生的科研设计及数据分析能力,提升医学资源利用率。
一、培训目标:
1,以短、平、快的培训方式,为基金申请保驾护航,发表paper如虎添翼;
2,掌握多组学数据分析核心技能,GEO、TCGA、SRA数据处理没有压力;
3,R语言科研绘图,以一敌百,高端大气,私人订制;
4,结合临床案例,一套数据多角度演练,更易掌握分析思路。
二、主讲专家:
来自清华大学、上海交通大学、中国科学院等高校医学生物信息学学科带头人、擅长各类型医学数据统计分析、生物医学大数据挖掘。发表数十篇专业领域内学术论文及SCI论文,主编或参与编写多部著作,参与多家三甲医院临床生物信息学的研究合作,科研及授课经验很丰富。
三、培训时间: 2024年07月26日— 2024年07月29日 远程在线培训
(第一天数据及操作软件调试,共授课三天)
四、参加对象:
从事生物医学研究的临床医生、转化研究科研人员;
课题经费不足,无法进行大规模测序,但需要发表SCI论文的相关研究人员;
已获得转录组、基因组等多组学数据,需要进一步挖掘分析人员;
对生物医学大数据分析与挖掘感兴趣的其他人员。
五、课程大纲
一、公共数据库挖掘热点介绍 |
1、生物标志分子(单基因、多基因) 2、可变剪切 3、肿瘤免疫 4、多组学 5. 选择性多聚腺苷酸化(APA) 6、泛癌分析 7、铁死亡 8、细胞焦亡 9、缺氧 10.自噬 11.网络药理学及分子对接 12.代谢 13.单细胞测序 14.m6A 15.环状RNA 16.突变 17.WGCNA分析 18.ceRNA网络 19.RBP(RNA结合蛋白) 20.DNA甲基化 21、人工智能研究在病理切片识别上的应用 22、人工智能多组学数据整合分析 |
二、常用生物医学数据库实操演练 |
1、 常用数据库介绍 1)综合数据库 TCGA、EGA、SRA、dbGAP、ICGC、CCLE、UCSC、cBioPortal 2)转录谱数据库 GEO、Oncomine、ArrayExpress、miRCaner 3)突变数据库 COSMIC、OMIM、ClinVar、SNP 4)表观数据库 ENCODE 5)注释数据库 DAVID、STRING、KEGG 2、 可以直接生成发表级图表的数据库 1)差异分析:ONCOMINE,TIMER,GEPIA,HPA 2)临床意义:KM plotter,prognoscan,TISIDB 3)机制研究: 基因组学:cBio-portal; 甲基化:UALCAN 互作分析:STRING 功能分析:DAVID |
三、R语言基础(上机操作及案例分析) |
1、R语言简介 2、R语言安装及配置 3、R语言数据结构 4、R语言数据处理 5、R语言绘图 |
四、生物信息数据库SCI实操(Biomarker筛选类) |
1.数据下载: 1)GDC Data Transfer Tool的使用 2)edgeR包使用 2.差异基因筛选 1)limma包的使用 2)GEO2R的使用 3)火山图的绘制 3.功能富集分析 1)Gene Ontology基因本体论富集分析 2)KEGG通路富集分析 3)topGO,Gostat,Rgraphviz包的使用 4)DAVID,Pather,Gostat在线工具的使用 5)GSEA的使用 6)BiNGO,ClueGO,CluePedia插件的使用 4.聚类分析 1)gplots包的使用 2)pheatmap包的使用 3)聚类图的绘制 5.网络分析 1)Interaction网络 2)Co-expression网络 3)常用分子互作数据库:String,HPRD,BIND等 4)常用共表达分析工具:cBioPortal,WGCNA 5)网络可视化工具:Cytoscap,VisANT 6)网络拓扑结构分析、关键基因识别 6.临床信息关联分析 1)相关性检验 2)生存分析 3)线性回归:单因素,多因素,lasso分析 |
五、分子生物信息SCI实操(诊断预后模型类) |
1.数据下载和整理(表达数据和临床数据) 2.提取科学问题相关基因表达量 3.差异分析 4.GO和KEGG分析 5.共表达预测科学问题相关分子 6.预后相关分子筛选 7.构建预后模型 8.生存曲线和ROC曲线的绘制 9.独立预后分析 10.决策曲线(DCA)的绘制 11.列线图的绘制 12.其他关联分析 |
六、多组学数据联合分析演练 |
1.甲基化与转录组整合分析思路演练 1)甲基化数据预处理 2)差异甲基化位点及区域识别 3)甲基化与转录组数据联合分析 4)公共表观数据库:ENCODE、regulomeDB 2. lncRNA-miRNA-mRNA全转录组整合分析思路演练 1)lncRNA表达谱数据获取 2)miRNA靶基因分析 3)lncRNA与mRNA表达相关性分析 4)ceRNA网络构建及结果可视化 |
七、文章写作与投稿 |
1.生信类SCI的写作 1)Backgroud/Introduction的写法(5个要素) 2)Methods的写法(7个方面) 3)Results的写法(6个分项) 4)Discussion的写法(7个层次) 2.生信类文章的选题 立题前需要考虑的10个问题 3.投稿建议 1)4个忠告 2)5个档次 |
八、辅助课程 |
1.学后交流、微信群、QQ群建立; 2.咨询、合作。专业技术团队深入探讨。 |
六、报名联系方式:
联系人: 期老师 手机(微信同号):15210196261
电话:010-56129268 官方咨询QQ:513692711
E_mail:cashq_ict@vip.163.com 网址: http://www.cssttcec.org.cn
工业与信息化技术培训网:http://www.itcc.ac.cn