近期微生物组研究软件 方法小合集

近期微生物组研究软件 方法小合集

首页模拟经营细菌模拟生存游戏更新时间:2024-04-28

6 月 13 日的《热心肠日报》,我们解读了 9 篇文献,分别关注:功能预测、整合分析、生长速率估计、网络、关联分析、分箱、稳定同位素、宏基因组和病毒组。


Nature子刊:PICRUSt2实现任意16S序列的宏基因组功能预测

Nature Biotechnology——[31.864]

① PICRUSt2 可直接对标记基因的OTU或ASV序列进行的功能预测,利用Castor R的隐藏状态预测算法增加了运算速度;② 基于IMG的数据库包括41,926个细菌和古菌基因组和2万个16S rRNA基因序列,比PICRUSt1扩大了20倍;③ 门、属和种水平的多样性分别增加了1.6、2.2和5.3倍,KEGG数据库的KOs增加了1.5倍;④ 利用MetaCyc数据库进行通路预测,可与宏基因组结果比较;⑤ 不足之处包括功能预测依赖于现有的参考基因组和不能提供菌株水平的功能预测结果。

【主编评语】

截止2020年6月5日,功能预测软件PICRUSt1已被引用近4千次。这个成绩是相当惊艳,而且仅2019年就引用过千,且持续增长。近期《Nature Biotechnology》发表了更新的PICRUSt2版本,值得专业人士关注。(@刘永鑫-中科院-宏基因组)

【原文信息】

PICRUSt2 for prediction of metagenome functions

2020-06-01, doi: 10.1038/s41587-020-0548-6


可跨地区和不同研究的宏基因组整合分析和功能比较流程

Genome Biology——[14.028]

① Carnelian是一种可直接比较跨样本研究的宏基因组代谢功能流程,有助于寻找功能趋势并区分现有方法学遗漏的酶学委员会命名;② 流程整合了多种数据库处理、概率基因发现、无比对功能宏基因组分箱、丰度估计及比较分析统计工具;③ 在2型糖尿病、克罗恩病、帕金森及工业化和非工业化地区肠道微生物组队列中,此流程分析发现跨疾病研究中新型和共享的功能性微生态失调,验证了其有效性;④ 流程已模块化,各模块可独立分析,灵活应用。

【主编评语】

来自麻省理工大学Bonnie Berger课题组(近2万引用的生物大佬)最近在《Genome Biology》(IF > 14)杂志上发表整合宏基因组功能注释和比较流程,可实现跨地区、不同实验差异较大研究的整合分析,同时比现有工具功能注释更全面,对开展宏基因组数据整合分析的用户,值得关注。(@刘永鑫-中科院-宏基因组)

【原文信息】

Carnelian uncovers hidden functional patterns across diverse study populations from whole metagenome sequencing reads

2020-02-24, doi: 10.1186/s13059-020-1933-7


Science子刊:基于宏基因组推断菌株原位的生长速率

Science advances——[12.804]

① 本研究开发了一种从宏基因组数据中估算特异菌株生长速率的方法SMEG;② SMEG流程包括两个主要步骤,首先对目标物种建立特异菌株的SNP数据库,然后使用从头分析或基于参考的方法评估菌株生长速率;③ 通过模拟和真实宏基因组数据集的分析,证实SMEG能准确识别和预测不同疾病相关的菌株的增长率;④ SMEG无法同时估算多个物种菌株的生长动态,且依赖于已知菌株或相关菌株的参考基因组;⑤ 该方法可为暴发流行病学中监测病原菌株感染动态的工具。

【主编评语】

细菌生长速率的计算是宏基因组研究中的热点问题,之前报导过2018年《Nature Communication》发表的GRiD方法(查看文章)和《Nature Methods》发表的DEMIC方法(查看文章),最近Science子刊提出的SMEG方法 https://github.com/ohlab/SMEG 可以更好的计算菌株的原位生长速度,软件提供Github源代码和Bioconda的安装方式,方便用户使用。(@刘永鑫-中科院-宏基因组)

【原文信息】

Metagenomic growth rate inferences of strains in situ

2020-04-22, doi: 10.1126/sciadv.aaz2299


功能全面的微生物组及多组学数据网络分析平台MetagenoNets

Nucleic Acids Research——[11.147]

① 冗长的网络分析流程、组学数据与其内部的复杂性是目前微生物网络分析的限制和挑战;② MetagenoNets接受所有类型微生物数据表和多层次数据,提供常用的数据标准化、转换与过滤方式;③ 提供多种相关分析方式,可自动将指标与组学数据关联;④ 有多种网络生成方式,提供交互性可视化,便于网络比较;⑤ MetagenoNets有助于终端用户同时推断、统计分析和比较相关性驱动的微生物关联网络,自动化生成大量直观的自解释可视化输出图表直接用于发表。

【主编评语】

微生物组网络分析是数据的常用解读方式,但现在软件和方法复杂、使用不方便等因素限制了网络分析的应用。本文作者建立了一个在线提供交互式网络分析的网站 https://web.rniapps.net/metagenonets ,可实现多种相关分析和网络图、热图的可视化方案,以及网络属性的计算、比较和可视化。本平台的发布,将极大地帮助无生物信息背景的生物学家开展网络分析。(@刘永鑫-中科院-宏基因组)

【原文信息】

MetagenoNets: comprehensive inference and meta-insights for microbial correlation networks

2020-04-27, doi: 10.1093/nar/gkaa254


新算法改进稀疏型微生物组数据与表型的关联分析

Microbiome——[10.465]

① 微生物组数据种系相关及高稀疏性导致微生物之间的相关性不准确,因此,开发出一种可解决种系相关和高稀疏性分析工具:MiHC;② MiHC是一种综合数据驱动的检测方法,考虑了微生物种系信息、稀疏水平(极高稀疏水平下采用simes检验调节);③ 数据模拟分析表明在随机种系相关和稀疏水平下MiHC比其它几种工具功效要好;④ MiHC运用到四种真实数据中也证明其在未知种系相关和稀疏度下检验的结果更加稳定,MiHC也可运用于生存分析、中介分析等;

【主编评语】

探索微生物组与宿主表型的关联,以及揭示微生物与宿主的互作机制是整个领域关注的重大科学问题。然而由于微生物组数据通常稀疏性较强,现在关联分析工具一般无法得到理想的结果。本文提出了一种新型算法MiHC有效改善微生物组数据与表型的关联结果,该软件采用R语言编写,可访问 https://github.com/hk1785/MiHC 安装,使用方便;相信该软件的应用可对本领域有一定推动作用。(@刘永鑫-中科院-宏基因组)

【原文信息】

A powerful microbial group association test based on the higher criticism analysis for sparse microbial association signals

2020-05-12, doi: 10.1186/s40168-020-00834-9


广东生态所:稳定同位素示踪-宏基因组分箱联用,揭示砷污染土壤中的厌氧砷氧化微生物代谢途径

Environmental Science & Technology——[7.149]

① 土壤中微生物驱动的厌氧砷氧化过程与反硝化过程具有耦合关系;② 通过DNA-SIP技术,发现Azoarcus, Rhodanobacter, Pseudomonas和Burkholderiales相关细菌等种群在土壤自养厌氧砷氧化过程中占据主导地位;③ 通过利用宏基因组分箱技术,证明了上述自养型厌氧砷氧化微生物包含有厌氧砷氧化过程中涉及到的关键功能基因,包括砷氧化基因、反硝化基因以及固碳基因,为这些微生物的厌氧砷氧化功能在分子生物学上提供了佐证。

【主编评语】

近日,广东省生态环境技术研究所孙蔚旻研究员课题组在环境领域顶级期刊《Environmental Science & Technology》上发表文章利用稳定同位素示踪技术,锚定了砷污染土壤中的关键砷氧化微生物。并结合宏基因组分箱联用技术,揭示了这些功能微生物的代谢途径,进一步拓展了我们关于砷氧化微生物的多样性的认知。该课题组自组建以来,一直致力于开发稳定同位素示踪-宏基因组分箱联用平台。该文章的发表代表着此技术平台迈出了重要的一步,首次在学术杂志上公开发表,后续该技术将逐步走向成熟与完善。(@刘永鑫-中科院-宏基因组)

【原文信息】

Characterization of Nitrate-Dependent As(III)-Oxidizing Communities in Arsenic-Contaminated Soil and Investigation of Their Metabolic Potentials by the Combination of DNA-Stable Isotope Probing and Metagenomics

2020-05-21, doi: 10.1021/acs.est.0c01601


广东生态所:微生物如何适应尾矿极端环境?

Environmental Science & Technology——[7.149]

① 尾矿中固氮基因的分布与固碳基因,硫氧化基因,以及砷氧化基因高度相关,在土壤中却不存在这种相关性;② 实验室验证尾矿中固氮菌更倾向于利用无机硫作为电子供体,而土壤中固氮菌更喜欢有机物为电子供体;③ 本文不仅利用环境组学来描述微生物群落,并且通过ARA培养实验,通过监测相关地球化学过程来佐证环境组学获得的发现,为环境基因组学与地球化学研究的结合提供了新思路。

【主编评语】

近日,广东省生态环境技术研究所孙蔚旻研究员课题组在环境领域顶级期刊《Environmental Science & Technology》上发表了题为“Chemolithoautotropic Diazotrophy Dominates the Nitrogen Fixation Process in Mine Tailings”的备选封面文章。本研究在之前解析了尾矿极端环境对微生物群落的影响,基于尾矿微生物三大生存策略的基础之上,进一步开展了对于这些生存策略的深入研究。本文通过对我国南方6处尾矿及其周边土壤进行类比,深入探讨了尾矿微生物固氮过程的重要意义,证实了化能自养型固氮菌是尾矿中产生可利用态氮素的主要贡献者,进一步拓展了我们关于微生物为适应尾矿极端环境而采取的生存策略的认知。(@刘永鑫-中科院-宏基因组)

【原文信息】

Chemolithoautotropic Diazotrophy Dominates the Nitrogen Fixation Process in Mine Tailings

2020-03-27, doi: 10.1021/acs.est.9b07835


广东生态所:宏基因组分析揭示碱性尾矿中细菌的生存策略和优势型机制

Environmental Science & Technology——[7.149]

① 尾矿微生物普遍具有固碳、固氮、金属抗性等相关基因,这些基因是尾矿中微生物生存所必须的;② 自养固碳过程不仅可以利用无机物作为底物,从而克服尾矿中有机物含量少的制约,还可以通过固碳过程为环境中提供必要碳源;③ 固氮过程可以将大气中的氮气转化为生物可利用态氮,从而为尾矿提供氮源;④ 金属抗性则可以通过氧化、还原、甲基化等过程减少尾矿中重(类)金属的毒性对微生物代谢过程的影响,保证其存活。

【主编评语】

广东省生态环境技术研究所孙蔚旻研究员课题组在环境领域顶级期刊《Environmental Science & Technology》上发表文章,揭示了碱性尾矿中细菌的生存策略和优势型的生理机制,其采用分析地球化学解析了尾矿及其土壤中多种生源要素及金属污染物的分布特点,并将其与宏基因组以及基因草图组装等多种方法结合,系统解析了尾矿极端环境对微生物群落的影响,提出了尾矿微生物所必须的生存策略。(@刘永鑫-中科院-宏基因组)

【原文信息】

Bacterial Survival Strategies in an Alkaline Tailing Site and the Physiological Mechanisms of Dominant Phylotypes As Revealed by Metagenomic Analyses

2018-10-22, doi: 10.1021/acs.est.8b03853


基于深度学习的病毒序列识别

Quantitative Biology——[N/A]

① 作者开发了一个基于深度学习识别病毒序列的方法-DeepVirFinder;② 对基因序列搭建了基于卷积神经网络的模型,利用大量已知的病毒序列和细菌序列进行训练,得到了最优的二元分类器;③ 模型利用已知序列学到了病毒的一般性特征,因此比基于序列比对的传统方法在识别未知病毒上更加灵活有效;④ DeepVirFinder在不同序列长度上均优于VirFinder;⑤ 利用从宏基因组中收集到的数百万条病毒序列扩大数据集后,罕见病毒的准确性显著提高。

【主编评语】

最新的宏基因组测序技术可以对包括病毒基因组在内的微生物基因组进行大规模测序,大大加快了病毒的研究。为了快速识别宏基因组数据中的病毒序列,美国南加州大学定量计算生物学中心孙丰珠教授课题组在《Quantitative Biology》期刊上发表了题为“Identifying viruses from metagenomic data using deep learning”的文章,在该课题组2017年开发并广泛应用的VirFinder基础上进一步发展了一个基于深度学习识别病毒序列的方法-DeepVirFinder。 此方法利用了深度学习和大数据的优势,无需与参考序列比对,显著提高了病毒识别的速度和准确性,将有助于在宏基因组学时代下对病毒的研究。(@刘永鑫-中科院-宏基因组)

【原文信息】

Identifying viruses from metagenomic data using deep learning

2020-01-22, doi: 10.1007/s40484-019-0187-4


感谢本期日报的创作者:米见对,爱吃番茄的Mona,段段,Echo Quasimodo,大月半,刘永鑫-中科院-宏基因组

点击阅读过去10天的日报:

查看全文
大家还看了
也许喜欢
更多游戏

Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved