用MEGA构建进化树,不会还有人不会吧!

用MEGA构建进化树,不会还有人不会吧!

首页战争策略植物超进化游戏更新时间:2024-04-29
尔云间 一个专门做科研的团队

原创 小果 生信果

欢迎点赞 收藏 关注[给你小心心]

通过进化树我们可以揭示生物进化历史、推断分类学关系、预测生物学特征等,在生物学中很常用,今天小果来分享一下用MEGA构建进化树的方法。

构建进化树的过程可以分为三个主要步骤:收集序列数据、进行多序列比对、利用比对结果建立进化树。以下是基于MEGA11.0.13软件的详细步骤:.

1.收集序列数据

本文以SOCS1基因为例,通过NCBIhttps://www.ncbi.nlm.nih.gov/获取尼罗罗非鱼(Oreochromis niloticus)、斑点雀鳝(Lepisosteus oculatus)、青鳉(Oryzias latipes)、红鳍东方鲀(Takifugu rubripes)、斑马鱼(Danio rerio)、小鼠(Mus musculus)和人(Homo sapiens)的SOCS1基因fasta序列来进行进化树的构建。

点击fasta加载出序列

此时可以从>开始直接选中所有序列复制粘贴到文本文档中,其他物种的序列也同样操作,粘贴到同一个文本文档,保存后然后修改文档后缀为.fasta就可以了。

另一种方式可以点击右上方的send to,直接从网页下载fasta格式的文件,最后将下载的序列放到同一个文件里就可以了。

获取所需序列后可以直接在文件中修改序列的名称,不要删除>,也可以在树的构建完成后在MEGA中修改,如下,小果改为物种名加基因名的形式。

2.多序列比对

打开MEGA➡Open A File/Session➡Align

选择Align后会弹出新的窗口,我们比对的序列就加载进来了

接下来进行序列比对

看到这么多选择不要慌,如果比对的序列比较少,直接选择第一项就可以了,如果序列很多可以用MUSCL,比对速度比较快。

这里小果选择Align by ClustalW

弹出对话框选择select all即可或者也可以手动选择要比对的序列

选择OK默认即可

等一会后序列就比对完了,将结果保存下来。

内容有限,未完待续,小果下期继续分享~

如果有绘制进化树的需求,小果强烈安利本公司的云生信平台,打开链接,在云生信·迎新春一栏找到“进化树”,动动手指直接上传自己的数据就出图啦!下图是用平台示例数据做的图哟~

怎么样是不是很简单呢!快来注册账号吧~

生信人R语言学习必备

立刻拥有一个Rstudio账号

开启升级模式吧

(56线程,256G内存,个人存储1T)

往期代码:

【1】lncRNA的拷贝数变异下游相关分析

【2】R可视化:ggstatsplot包—科研界的美图秀秀

【3】随机森林算法用于分类预测和筛选诊断标志物

【4】基于本地Java版GSEA的输出结果整合多个通路到一张图

【5】基于岭回归模型和基因表达矩阵估算样本对药物反应的敏感性

【6】基于R包NMF对样本进行分型分析

【7】DALEX包用于探索、解释和评估模型;分析不同特征变量对响应变量的影响

【8】根据肿瘤突变负荷TMB进行KM生存分析寻找最佳的cutoff

【9】基于单样本富集分析算法评估组织中的免疫细胞浸润水平

【10】代码分享│什么?你还在用散点图来可视化数据之间的相关性

【11】代码分享│诊断列线图、校准曲线、决策曲线和临床影响曲线的构建

【12】代码分享│你了解基因的动态变化模式吗

【13】代码分享│生物信息分析之SCI热门图表-复杂热图

【14】代码分享│生物信息分析之SCI热门图表-火山图

【15】代码分享│生物信息分析之SCI热门图表-箱型图和小提琴图

【16】代码分享│深度学习-人工神经网络(ANN)的构建

【17】代码分享│R可视化:高分文章绘图之基于RCircos包的多类型圈图绘制

【18】代码分享│R可视化:基因与功能之间的关系--GO功能富集网络图绘制

【19】代码分享│生物信息分析之SCI热门图表—KM曲线和tROC曲线

【20】代码分享│R可视化:肿瘤预后模型之Cox回归分析后用R语言绘制森林图

【21】代码分享│生物信息分析之SCI热门图表—相关性热图和散点图

【22】代码分享│生信分析之R语言分析相关性及可视化的N种风格

【23】代码分享│TCGA数据获取有困难,不会预处理,学习起来

【24】代码分享│机器学习-支持向量机递归特征消除(SVM-RFE)的构建

【25】代码分享│R可视化:对两个矩阵进行相关性可视化分析

【26】GEO数据库多数据集差异分析整合利器RRA,再也不用纠结去除批次效应

【27】你与生信大佬的距离,只差2分钟搞定预后模型构建和性能评估

【28】9 SCI纯生信,模型构建中的“流量明星”,你不得不知的LASSO

【29】手把手教你画美观大气的lasso回归模型图,为你的SCI增砖添瓦

【30】R可视化:clusterProfiler包做组间比较GO富集图

【31】代码分享|R可视化:复杂热图绘制技巧之热图中添加柱状图

【32】代码分享——基于基因突变信息分析肿瘤突变负荷

【33】代码分享│富集不到想要的通路?别放弃呀,试试GSEA

【34】代码分享│还在用PCA做降维聚类吗?最强降维模型tSNE--你值得拥有

【35】代码分享│GSVA:原来功能通路也能做差异分析!

【36】代码分享│Slingshot:你不知道的单细胞拟时序分析还有它

【37】基于基因功能注释信息挖掘关键作用基因

【38】基于癌症分类预测的标志物特征提取的SVM-RFE分析代码

【39】依据表型数据基于无监督聚类算法对研究群体进行分层聚类分析

【40】基于稳健排序整合算法对多数据集进行整合及可视化

【41】基于基因表达谱估算样本免疫基质评分和肿瘤纯度

【42】自动化绘制LASSO算法回归模型图

【43】用于临床诊断和临床决策影响的DCA分析

【44】基于样本预后生存信息和临床因素用于评价不同模型的一致性指数软件

【45】用于探索、解释和评估模型的DALEX残差分析软件

【46】基于细菌群落功能丰度结果进行差异功能分析及可视化

【47】基于基因差异分析结果绘制其在染色体上的分布

【48】利用逐步回归法筛选特征基因构建Cox风险模型分析

【49】基于Immune Subtype Classifier进行肿瘤免疫亚型分类

【50】不同物种之间的同源基因名称转换分析

【51】基于逐步多因素cox回归筛选预后标记基因并构建风险评分模型

【52】基于表达信息挖掘与关注基因密切相关的基因

【53】基因组学基因名称修正分析

【54】基于Spearman算法构建关联网络

【55】基于线性建模方法对代谢组和转录组数据整合分析

【56】基于lasso回归模型方法筛选特征基因

【57】基于线性建模方法对代谢组和转录组数据整合分析

【58】基于参数型经验贝叶斯算法和支持向量机(SVM)筛选疾病亚型特征基因

【59】基于LDA(线性判别分析)算法的微生物biomarker的筛选

【60】基于R包xCell计算64种免疫细胞相对含量及下游可视化

【61】基于甲基化数据评估肿瘤纯度及下游可视化

【62】基于DiffCorr包识别不同表型下的差异共表达关系对

【63】基于逆累计分布函数识别显著偏差通路

【64】基于差异基因对通路的影响挖掘关键通路

【65】基于高通量数据的样本相似性分析

需要以上代码私信小果哦

生信果”,生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程,以及基于R的分析和可视化等原创内容,一起见证小白和大佬的成长。

查看全文
大家还看了
也许喜欢
更多游戏

Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved