欢迎点赞 收藏 关注[给你小心心]
多组学联合分析和机器学习是小云墙裂推荐的生信提分秘诀,小伙伴们还记得吗?
不记得的朋友,可以回顾一下小云之前分享的文献哦!(ps:点击文末链接就可以观看啦)
机器学习是最近2年比较火的分析方法,用的好了提分效果毋庸置疑,那多组学分析为什么也有那么大的提分威力呢?那是它可以达到1 1>2的效果!
今天小云再用一篇文章展示一下多组学和机器学习的高端玩法!
这篇文章首先利用10种多组学聚类算法进行肿瘤分型分析,然后再利用10种机器学习算法建立预后模型,这种高端联合分析瞬间把原来的肿瘤分型 预后套路的level给提升了一大截,所以这篇纯生信能发到8.8分 的能力也是毋庸置疑的(ps:这篇文章接收的时候杂志还是10分 ,虽然最新影响因子下降到了8.8分 ,但其实这个思路是有冲击10分 的能力,还是相当值得学习哦)!如果你也对这个思路感兴趣的话,就赶快用起来吧~ ~
题目:综合多组学分析和机器学习改善肌浸润性尿路上皮癌的分子亚型和预后
杂志:Mol Ther Nucleic Acids
影响因子:IF=8.8
发表时间:2023年6月
研究背景
以高侵袭性和显著异质性为特征的肌层浸润性尿路上皮癌(MUC)目前缺乏高度精确的个体化治疗方案。考虑到与免疫疗法相关的巨大成本和严重不良反应的可能性,迫切需要利用大规模多组学数据和先进的机器学习算法来识别能够促进MUC患者有效预后预测和免疫疗法管理的生物标志物。
数据信息
研究思路
作者整合了mRNA、lncRNA和miRNA表达谱、基因组突变和表观基因组DNA甲基化数据,使用10种多组学集成聚类算法开发了一种整合的MUC共识亚型。随后分析三种亚型之间不同的生存结果,利用ssGSEA算法分析亚型间不同分子信号的富集情况,以及亚型间的免疫浸润情况。然后作者整合IMvigor 210 -MUC、TCGA-MUC(亚型间差异基因)和META-MUC队列,通过单变量Cox回归分析从队列一致性基因中筛选出32个稳定预后相关基因(SPRGs )。在IMvigor-MUC训练队列中采用基于10种机器学习算法的99个算法组合构建了共识机器学习驱动的模型(CMLS),并计算了所有队列中每个模型的平均C指数,评估所有模型的预测能力,筛选出最佳模型。比较CMLS与其他预后模型的性能,并建立列线图。分析CMLS相关的免疫特征以及对免疫治疗反应的预测能力,筛选潜在治疗药物。
主要结果
1.多组学共识聚类鉴定MUC预后相关分子亚型
首先从各维度的组学数据中筛选出变异程度最大的前1500个基因,然后选择与预后相关的基因作为基于Cox回归分析的聚类候选基因。对于突变数据,作者根据突变频率筛选候选基因。综合参考聚类预测指数、差距统计分析、轮廓系数和以往的研究经验,使用10种多组学聚类算法 (CIMLR、ConsensusClustering、SNF、iClusterBayes、PINSPlus、moCluster、NEMO、IntNMF、COCA和LRA) 通过共识聚类获得3个稳定的MUC预后亚型(图1A-C)。
利用KM曲线比较亚型间的生存结果,发现癌症亚型2 (CS2)表现出最有利的OS生存结果(图1D)。随后作者为了探索这些CSs间的不同分子特征,利用ssGSEA算法测量样品中不同分子信号的富集,发现腔分化和尿路上皮分化等途径在CS2中显著富集,而基底分化和免疫分化等途径在CS3中显著富集,表明CS2更倾向于腔样亚型,而CS3更倾向于基底样亚型(图2A)。
此外,分析了与癌症染色质重塑相关的潜在调节因子和MUC的23个转录因子(图2B)。然后,比较了这些亚组中免疫检查点基因的分布,并使用“ESTIMATE”R包来估计肿瘤组织的免疫/基质评分,计算肿瘤浸润淋巴细胞(MeTIL)的DNA甲基化评分,还通过GSVA评价了24种肿瘤免疫微环境细胞的富集情况,显示CS1和CS3中免疫细胞浸润显著增加,但CS2中相对较低(图2C)。
图1 多组学共识聚类鉴定 MUC 预后相关分子亚型
图2 亚型间的分子特征分析
2.预后模型的建立
作者在IMvigor-MUC、TCGA-MUC和META-MUC队列中进行了单变量Cox分析,所有队列中p < 0.05且风险比(HR)方向相同的基因被认为是SPRGs,共筛选出32个与OS显著相关的SPRGs。随后,在训练集IMvigor-MUC队列中集成了10种机器学习算法(CoxBoost、stepwise Cox、Lasso、Ridge、Enet、survival-SVMs、 GBMs、SuperPC、 plsRcox 和 RSF)的99种组合建立了共识机器学习驱动的模型(CMLS),并测试了所有验证队列,计算了每个模型的平均C指数,其中具有最高值的模型被认为是最优模型(图3A)。发现由CoxBoost和逐步Cox(方向=向前)组成的算法保持最高的平均C指数以构建最终模型,CoxBoost算法识别最有价值的SPRGs,逐步Cox算法过滤最有价值的模型,该模型由12个hub基因组成(图3B, C)。
然后,作者计算了所有队列的每个样本的CMLS分数,利用KM曲线分析各队列种高CMLS和低CMLS MUC患者的生存差异(图3D-G)。
(ps:机器学习算法筛选特征基因或建模也可以用小云新开发的零代码生信分析小工具实现,云生信分析工具平台包含超多零代码小工具,上传数据一键出图,感兴趣的小伙伴欢迎来参观哟,网址:http://www.biocloudservice.com/home.html)。
图3 CMLS的建立
3.CMLS与MUC其他预后模型的比较
作者对过去5年内发表的相关文献进行了系统搜索并纳入22个预后模型,在TCGA-MUC、IMvigor-MUC和META-MUC队列中分别比较CMLS和其他预后模型的C指数,结果显示CMLS 的 C 指数表现几乎优于其他所有模型(图4A-C)。随后作者整合独立预后因素(CMLS、TMB、IC level)构建一个网络计算器形式的综合列线图(图3B)。校准曲线证明列线图具有与实际情况一致的精度(图4E)。决策曲线分析(DCA)表明,列线图对患者的临床益处明显高于单独使用CMLS(图4F, G),随时间变化的C指数进一步证明了列线图具有更好的预测性能(图4H)。
图4 CMLS与MUC其他预后模型的比较
4.CLMS相关的免疫特征和免疫治疗反应分析
作者采用免疫肿瘤生物学研究(IOBR) R包,对MUC的肿瘤微环境进行了综合分析,并观察到免疫细胞浸润水平,包括T细胞、B细胞和巨噬细胞,在低CMLS患者中明显高于高CMLS患者,表明免疫激活状态(图5A)。随后,分析了高和低CMLS患者之间免疫抑制特征(图5B)、免疫排斥信号(图5C)和免疫治疗生物标记(图5D)的分布,结果表明表明,低CMLS水平的MUCs更倾向于“热肿瘤”, 表现为免疫激活状态;而高CMLS 的MUC更倾向于 “冷肿瘤”, 表现为免疫抑制状态。
此外,还分析了高CMLS患者和低患者之间肿瘤突变负荷(TMB)、肿瘤新抗原负荷(TNB)和M1巨噬细胞的分布评价患者对免疫治疗反应,发现低CMLS组具有较高的TMB、TNB和M1巨噬细胞富集度,这意味着低CMLS组可能具有较高的免疫原性(图5E-H)。结合了CMLS与TMB、TNB和M1巨噬细胞后进行生存分析,较低的CMLS和较高的TMB、TNB或M1巨噬细胞浸润倾向于对MUC患者有更好的生存预后(图5I-K)。
图5 免疫特征分析
为了全面评估CMLS在MUC免疫疗法中的作用,作者对IMvigor-MUC队列进行了详细分析。通过比较两组在6个月和12个月时的限制性平均生存期(RMS ),同时评估治疗3个月后患者之间的长期生存期(LTS)差异,以说明免疫治疗的延迟临床效应,低CMLS组显示出较好的预后结果(图6A、B)。CMLS在不同缓解程度患者中的分布也显示,缓解组的CMLS评分(CR/PR)明显低于无缓解组(PD/SD)(图6C)。此外,作者计算了追踪肿瘤免疫表型(TIP)以探索与CMLS相关的潜在生物学机制,发现低CMLS组主要在第4步(肿瘤免疫浸润细胞募集)、第5步(免疫细胞浸润)和第7步(癌细胞*伤)显示出显著差异(图6D)。利用肿瘤免疫功能障碍和排除(TIDE)算法评估患者对免疫疗法的反应,发现在低CMLS组中显示更好的反应性(图6E)。
图6 免疫治疗反应分析
5.潜在治疗药物的筛选
鉴于高CMLS患者对免疫疗法的反应不佳,作者使用CTRP和PRISM来筛选高CMLS患者的潜在治疗药物。根据以前的研究系统地探索了用于高CMLS患者的潜在药物(图7C),从CTRP中筛选到一种衍生药物达沙替尼(图7D),从PRISM筛选到2种衍生药物romidepsin和ispinesib(图7E)。最后评估了肿瘤组织和正常组织中候选药物作用的靶基因表达水平的差异(图7F)。
图7 潜在治疗药物的筛选
小结
这个文章利用首先利用10种多组学聚类算法进行肿瘤分型分析,然后再利用10种机器学习算法建立预后模型。在常规预后 分型的套路中添加新颖的分析手段以大幅提高思路创新性,并且这个分析内容比较能显示研究者的生信功底,能力展现的杠杠滴,所以可以直接用纯生信发表8分 !想做高创新性分析的小伙伴,不要犹豫啦,用上这个思路行动起来吧!
小云持续为大家带来最新生信思路,更多创新分析思路请点击链接。需要复现或了解更多分析思路的朋友欢迎call小云,风里雨里小云等你!
1.,创新性超赞!!
2. 不看可就亏大了!
3. 文章就是小意思!
4. ,性价比太惊人了!
5. 发文途径快上车!
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved