文章目录
- 参考文章
- HCC项目流程
- 数据地址
- 基础知识
- 数据准备
- 差异分析
- 功能分析
- 浸润分析
- 标记筛选
- 关联分析
- 单细胞分析
- 撰写文章
参考文章
在生物信息学的助力下,科研人员不断探索着癌症转录组学的奥秘,以期发现能够早期诊断、指导治疗和预测疾病进程的生物标志物。本教程参考已发表的文章[@yang2023revealing]的研究方法,该文章深入探讨了慢性阻塞性肺病(COPD)晚期的潜在诊断基因生物标志物,为科研人员提供了宝贵的经验和启示。它的研究框架和结果见:
分析框架:
-
数据收集与下载:从GEO数据库中下载了GSE38974、GSE69818和GSE54837这三个COPD基因表达数据集。
-
定义I和II期为COPD早期,III和IV期为COPD晚期。
-
差异表达基因(DEGs)的筛选:通过sva包分析数据,筛选出157个差异表达基因(DEGs)。使用LASSO和SVM-RFE两种机器学习算法从DEGs中筛选出关键基因EXPH5。
-
功能富集分析:使用Metascape数据库进行GO和GSEA分析,探索DEGs的生物学功能和关键信号通路。
-
免疫细胞浸润评估:使用CIBERSORT算法分析不同阶段COPD样本中免疫细胞的浸润情况。 通过相关性分析,探索EXPH5基因与显著变化的免疫细胞之间的关系。
<