实验篇——Ka/Ks分析

21 篇文章 24 订阅
订阅专栏
本文详细介绍了如何使用ParaAT2.0+KaKs_Calculator和TBtools软件进行Ka/Ks分析,以评估基因的进化速度。通过实操步骤,包括软件安装、文件准备和分析过程,读者能掌握如何获取基因复制模式的共线性数据并计算出Ka/Ks比值。
摘要由CSDN通过智能技术生成

实验篇——Ka/Ks分析


前言

鉴定不同基因的复制模式
本文得到的共线性基因对文件 来自于上一篇文章中的LIN.collinearity共线性文件

参考文章:
https://www.jianshu.com/p/a3a39b2f341b


一、名词解释

Ka/Ks分析是一种用于评估基因进化速度的方法。较高的Ka/Ks比值可能表明基因在进化过程中经历了功能上的重要变化,而较低的Ka/Ks比值可能表明基因在进化过程中具有保守的功能。

更多相关的解释信息

二、实操

1. 安装软件

安装ParaAT、KaKs_Calculator2.0以及muscle(或者其它序列比对软件) 软件,并配置环境
或者在TBtools软件中操作

2. 准备文件

准备存储共线性基因对的文件 homolog、cds文件、pep文件(注意,cds及pep为fasta格式,“>”后面只接基因ID号)

以LIN.collinearity共线性文件为例

得到homolog文件

cat LIN.collinearity | grep "Lagg" | awk '{print $3"\t"$4}' >LIN.homolog

在这里插入图片描述
得到cds文件
原来的文件格式:

在这里插入图片描述

sed 's/^>\([^\t]*\)\t.*/>\1/' Lagg.gene.cds >Lagg.cds

要求的文件格式:

在这里插入图片描述

得到pep文件
原来的文件格式
在这里插入图片描述

sed 's/^\(>[^ ]*\).*/\1/' Lindera_aggregata.gene.pep >Lagg.pep
sed -i 's/\*//g' Lagg.pep

要求的文件格式:
在这里插入图片描述

或者也可以用别的编程语言实现,如python

import re
with open("D:\yuceji\shili.pep", 'r') as file:
    lines = file.readlines()
output_file = 'output.fasta'

with open(output_file, 'w') as file:
    for i in range(len(lines)):
        line = lines[i].strip()
        if re.match(r'^>', line):
            gene_id = line.split()[0]
            seq = ''
            j = i + 1
            while j < len(lines) and not re.match(r'^>', lines[j].strip()):
                seq += lines[j].strip()
                j += 1
            file.write(gene_id + '\n')
            file.write(seq + '\n')

在这里插入图片描述

3. 使用ParaAT2.0 + KaKs_Calculator2.0

ParaAT.pl -h test.homologs -n test.cds -a test.pep -p proc -m muscle -f axt -g -k -o output 2> ParaAT.log &

-h test.homologs:指定包含同源序列的文件

-n test.cds:指定包含核苷酸序列的文件

-a test.pep:指定包含蛋白质序列的文件

-p proc:指定并行处理的进程数, (proc 可以自行设置)

-m muscle:指定用于多序列比对的软件,这里使用的是muscle

-f axt:指定输出文件的格式,这里使用的是axt格式

-g:启用gap stripping功能,即移除比对序列中的缺失片段。

-k:启用Ka/Ks比值的计算

-o output:指定输出文件的名称

2> ParaAT.log:将标准错误输出重定向到名为"ParaAT.log"的日志文件中。

&:将命令放入后台运行。

4. 使用TBtools软件

基于TBtools软件,可以使用" Sinple Ka/Ks Calculator" 程序

同样依然要准备那三个文件
在这里插入图片描述

在这里插入图片描述

从左到右每一列的介绍:

  1. Seq_1:表示序列对中第一个序列的标识符或名称。

  2. Seq_2:表示序列对中第二个序列的标识符或名称。

  3. Ka:表示非同义突变(氨基酸替换)的数量,也称为Ka值。

  4. Ks:表示同义突变(氨基酸保守替换)的数量,也称为Ks值。

  5. Ka/Ks:表示Ka值除以Ks值得到的比值。(Ka/Ks比值用于衡量非同义突变和同义突变的相对丰度,从而推断基因或序列的选择压力)

  6. EffectiveLen:表示序列对的有效长度,即用于计算Ka和Ks的比对序列的长度。

  7. AverageS-sites:表示平均同义突变位点的数量。

  8. AverageN-sites:这一列表示平均非同义突变位点的数量。

  9. cN:这一列表示非同义突变位点的校正计数。

  10. cS:这一列表示同义突变位点的校正计数。

  11. pN:表示非同义突变位点的概率。

  12. pS:这一列表示同义突变位点的概率。

其实得到的文件中除了这12列外,还有一列”Note",来记录一些“high sequence divergence value (ps>=0.75)” 这类的信息。

三、额外

总之,最主要的是得到了Ka/Ks的计算结果,达到了我们的目标,其余的也没必要全都了解。
另外,对于结果文件的每一列,我是这样记忆的:
对于Ka与Ks 的区分,可以Ks中的“s"来记忆,因为这可以很快与"same"这个单词联想起来。即相同的意思,故Ks就是同义突变。至于另一个Ka就是非同义突变了。
AverageS-sites 与AverageN-sites 的记忆也是如此。
cN 与 cS ,也是如此,另外"c"可表示"count",即计数
pN与pS,也是如此,另外"p" 可表示"probablity",即概率的意思


总结

本文主要讲述的是Ka/Ks 值的计算,其实无论是使用ParaAT2.0 + KaKs_Calculator2.0来计算,还是使用TBtools软件中的" Sinple Ka/Ks Calculator" 程序。都是为了得到结果。我个人还是比较推荐使用TBtools软件的,因为足够简单(不需要在Linux中再下载一些什么软件后再配置环境了,只要输入三个文件,就能得出结果文件)。当然或许它也会有一些其它问题。这样我们可以具体情况再具体分析。

无丝竹之乱耳,无案牍之劳形。

–2023-8-21 实验篇

python ks值计算_Kaks_calculator计算ka/ks
weixin_39662834的博客
12-10 1868
kaks_calculator可用来计算kaks值,后续可计算分化时间点等。安装安装ParaAT在安装kaks_calculator 之前安装比对软件paraAT,该软件是由中科院基因组所张章课题组开发,它整合了计算ka/ks所需的一整套分析的,包括:蛋白序列比对(可选clustalw2 | t_coffee | mat | muscle)根据蛋白比对结果回译成codon对应的核酸比对结果计算k...
有效数据包含额外数据_利用MCscanX分析Ka/Ks数据(包含错误更正)
weixin_39866963的博客
11-22 1147
利用MCscanX进行数据分析的文章已经有好几个了,大家可以看文末链接,里面比较详细。我主要是从自己的经验出发,把中间的错误都写出来,希望帮到有需要的朋友。 1 第一种情况是没有一个共线性基因对。 这种时候是blast文件和gff文件都不是正确格式(如下图所示)2 第二种情况是blast文件对的,但是gff文件错误,下图显示所有数据都被排除(下图的296144discarded)3 第三种情况,如...
超简单的比较基因组学Ka/Ks进化速率图绘制
Pangenes的博客
08-05 802
生信漫谈生信漫谈超简单的比较基因组学Ka/Ks进化速率图绘制。
利用MEGA计算π值和Ka/Ks
qq_50637636的博客
01-20 5348
π值的计算 将之前比好的序列并保存为.mas格式的文件拖拽到MEGA里,选择analysis。 计算Π值,需要使用CDS序列,选择yes。 选择DISTANCE -> Compute Pairwise Distances 将参数设置为上图所示,选择JC校正模型。 即可得到上图所示的结果,每个单元格中的值即为π值,该值介于0~1之间,该值越趋近于0,代表着该单元格对应的两条序列之间的核苷酸差异越小。 若单元格中的值超过1,说明该单元格对应的两条序列的核苷酸差异已经大于它们自身的
基因家族分析及SCI写作
最新发布
PhyliciaFelicia的博客
08-06 852
掌握基因组家族分析流程、提高学员数据分析技能、掌握基因家族SCI论文撰写思路和写作技巧,助力科研。
基因家族分析
a2505568381的博客
06-17 2516
#下载拟南芥基因组信息 #wget ftp://ftp.ensemblgenomes.org/pub/plants/release-41/fasta/arabidopsis_thaliana/dna/Arabidopsis_thaliana.TAIR10.dna.toplevel.fa.gz #wget ftp://ftp.ensemblgenomes.org/pub/plants/release-41/fasta/arabidopsis_thaliana/cds/Arabidopsis_thaliana.
Ka/Ks介绍和分析
qq_36608036的博客
07-05 3580
在遗传学中,Ka/Ks表示的是两个蛋白编码基因的非同义替换率(Ka)和同义替换率(Ks)之间的比例。这个比例可以判断是否有选择压力作用于这个蛋白质编码基因。如果你手头有两个不同物种的同一个基因的序列,比如人和小鼠的p53基因,然后把这两个基因的序列进行比对,你会发现这两段序列有差异(进化!再仔细观察,你会发现有些碱基的变化导致了编码氨基酸的变化(非同义替换),有些没有导致编码氨基酸的变化(同义替换)。这是由密码子的简并性造成的,因为3个碱基决定1个氨基酸,所以64种碱基组合决定20种氨基酸,会有冗余出现。
ka/ks
weixin_30332705的博客
09-30 248
1. If dN/dS = 1, amino-acid substitutions may be largely neutral. However, there is also the possibility that positive selection just cancels purifying selection, so that some amino- acid substituti...
Ka/Ks与分子进化常用软件
计算机随笔
09-15 5594
http://pubmlst.org/software/analysis/start/manual/dsdn.shtml 另外,请参数 分子进化基础-李维文   Ka/Ks     在遗传学中,Ka/Ks或者dN/dS表示的是异意替换(Ka)和同意替换(Ks)之间的比例。这个比例可以判断是否有选择压力作用于这个蛋白质编码基因。    不导致氨基酸改变的核苷酸变异我们称为同义突变,...
TBtools-生物信息分析
07-02
该软件主要用于生物信息相关分析。主要功能包括序列批量提取、转存、转录组富集分析
ImageJ插件:MULTIFRAC——用于2D和3D图像多尺度表征的软件
立陶宛d、e、faVicomtech基金会,巴斯克研究和技术联盟(BRTA),西班牙圣塞巴斯蒂安b西班牙巴塞罗那加泰罗尼亚理工大学计算科学系LARCA研究小组复杂性和定量语言学实验室c加拿大圭尔夫大学安大略农学院环境科学学院...
KaKs_Calculator2.0-开源
05-30
该软件是一个结合了伽马级数方法和滑动窗口策略的工具包。 使用 KaKs_Calculator2.0 时请引用以下参考文献:Da-Peng Wang、Hao-Lei Wan、Song Zhang 和 Jun Yu。 γ-MYN:一种考虑可变替代率的用于估计 KaKs 的新算法。 Biology Direct 2009,4:20。 王大鹏、张松、何福红、姜珠、胡松年、余军。 可变替代率如何影响 KaKs 计算?基因组学蛋白质组学生物信息学。 2009 年 9 月;7(3):116-27。 王大鹏、张玉斌、张张、姜珠、余军。 KaKs_Calculator 2.0:一个包含伽马系列方法和滑动窗口策略的工具包。基因组学蛋白质组学生物信息学。 2010 年 3 月;8(1):77-80。
LMAP:PAML中的轻量级多基因分析-开源
04-28
Maldonado E,Almeida D,Escalona T,Khan I,Vasconcelos V和Antunes A(2016)LMAP:PAML中的轻量多基因分析。 BMC Bioinformatics,17:354。 doi:https://doi.org/10.1186/s12859-016-1204-5
美景本天成,妙笔偶得之——“妙笔”是怎样炼成的?
百度大脑
02-11 361
项目背景 刚刚过去的冬奥会开幕式,可以说是一场美轮美奂的视觉盛宴。其中,科技与艺术的融合铸造了各种梦幻的视觉效果,让我们看到AI在艺术领域大有可为。而今天分享的项目也是AI+艺术的一个小方向,灵感来源于我的小女儿。 一天,我的小女儿说:“爸爸,我长大要当漫画家,今天我要画哆啦A梦!”。这让人很欣慰,她们这些孩子不必像我和我的父辈小时候那样,学好什么是为了走遍天下都“不怕”,她们学习只是因为“喜欢”。可是,喜欢也是没那么容易能喜欢的。经过半天的“挥墨行空”,“小漫画家”总是觉得自己画的哆啦A梦没有..
强化学习课程学习(2)——必备数学基础集锦
Cecilia
06-17 3751
在了解了深度学习的基本理论以后,可以开始不断的去深入了解背后的原理是什么。为什么图片能被计算机读取?为什么我们可以用CNN对成千上万中图片进行分类,这背后的原理是什么?在了解原理之前,因为无论是深度学习还是机器学习,背后都是有一些数学原理和公式推导的,所以掌握必备的数学知识必不可少,在加入百度AI Studio开展的强化学习的课程的过程中,百度大佬提供了这些以后需要用到的数学基础知识,正好罗列收藏整理下,以方便以后自己学习过程中需要的时候可以查看—— 数学基础知识 数据科学需要一定的数学基础,但仅仅做应..
虚幻4渲染编程(重写渲染管线)【第一卷:从零开始推导PBR渲染模型---上】...
cpongo10的博客~
10-19 275
我的专栏目录: 小IVan:专题概述及目录 章节概述: 作为一个美术,一般遇到渲染管线上的问题的时候往往会束手无策,因为整个c++层到shader层这么大一块的系统都是由图形程序大佬一手搭建起来的。这就会导致平凡地需要去打扰别人。为了加快工作效率,我觉得美术有必要能自己完成整套渲染管线的搭建,优化和游戏跨平台发布。 ...
可汗学院教学课程总目录
热门推荐
No_notion的博客
02-08 1万+
文章目录数学微分学积分学 数学 微分学 标题 网易链接 youtube链接 [第1集] 牛顿,莱布尼茨和尤塞恩·博尔特 http://open.163.com/movie/2011/4/G/F/M8R669LTT_M8RBAS6GF.html [第2集] 极限介绍1 http://open.163.com/movie/2011/4/K/U/M8R669LTT_M8RBAVJK...
GPB | KaKs_Calculator 3.0:计算编码与非编码序列的选择压力
刘永鑫的博客——宏基因组公众号
04-10 2465
近日,Genomics, Proteomics & Bioinformatics在线发表了中国科学院北京基因组研究所(国家生物信息中心)章张研究员题为“ KaKs_Calculator 3.0: Calculating Selective Pressure on Coding and Non-coding Sequences”的应用说明文章。我们的“要文译荐”...
!Help | 我又有一个有趣的想法!
abai0410的博客
03-03 1547
写在前面 Emmm,最近,说实话,确实是忙。基本没维护 TBtools 用户社群。好在老铁群管以及热心社群成员的无私付出,勉强应付得了林林总总的成员使用问题。 当然,前几天去跑去学校西园吃饭的时候,一个人也没事干,稍微刷了下历史消息,总结: 最近新手太多 问题绝大多数为新手问题,而且他们基本没看过《生信札记》推文 总的来说,绝大多数 TBtools 功能,我实现之后,多少是会写一个使用示例,然后推出来。同时,对于一些常见的使用问题,甚至结果解读,也会稍稍提及。对于用户来说,遇到问题,或许第一步就是翻翻《
写文章

热门文章

  • 机器学习——支持向量机(SVM) 16011
  • 机器学习——决策树与随机森林 13819
  • 实验篇—— 基因家族Motif 分析 9784
  • 实验篇——基因组共线性分析 8463
  • 百日筑基篇——差异基因分析Limma包(R语言初识七) 8160

分类专栏

  • 文献精读 3篇
  • 实验室——生信分析 21篇
  • 项目研究 3篇
  • 生物技术笔记 17篇
  • 其它 6篇
  • python篇 104篇
  • linux学习篇 6篇
  • 算法学习 5篇
  • R语言篇 11篇

最新评论

  • 文献精读【1】——对东亚一种关键森林树木的当地适应和未来气候导致的脆弱性的基因组研究

    星石传说: 我就是用的vs code插件Code Geex,或者通义灵码

  • 文献精读【1】——对东亚一种关键森林树木的当地适应和未来气候导致的脆弱性的基因组研究

    阳洋杨~扬: 做的特别好,学习了。想请教你用的是哪个AI翻译工具?

  • 在Flask中使用MySQL数据库

    °3: 可以发一下目录结构吗

  • 百日筑基篇—— Linux介绍(Linux入门一)

    MIhard160: 太优秀了 好有恒心 去哪读研啊

  • 以flask为后端的博客项目——星云小窝

    星石传说: 而且我在项目启动的博客里也放了GitHub链接表情包

大家在看

  • Leetcode 每日一题:Diameter of Binary Tree

最新文章

  • 文献精读【1】&& 补充 ——对于【1】的结合ppt进行的简要汇报
  • 文献精读【1】——对东亚一种关键森林树木的当地适应和未来气候导致的脆弱性的基因组研究
  • 群体遗传结构的分析并绘图
2024
07月 22篇
04月 4篇
03月 7篇
02月 10篇
01月 8篇
2023年122篇

目录

目录

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

星石传说

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家徐州商场装饰美陈泰州玻璃钢仿铜雕塑定做广州玻璃钢花盆销售泡沫玻璃钢雕塑制作过程成都玻璃钢雕塑加工厂家云南高质量玻璃钢雕塑批发曲阳玻璃钢造型雕塑厂家东莞公园玻璃钢雕塑公司主题商场美陈销售公司广西玻璃钢雕塑出售玻璃钢浮雕喷泉雕塑定做湖南玻璃钢雕塑订制台州玻璃钢雕塑定制北海玻璃钢泡沫雕塑价格范围沈阳玻璃钢卡通雕塑制作玻璃钢花盆花器哪家好杭州玻璃钢雕塑摆件供货商天津水果玻璃钢雕塑价位藁城区商场美陈湖州玻璃钢雕塑电话上饶玻璃钢门头雕塑玻璃钢雕塑工程产品介绍仿真玻璃钢卡通雕塑商家楼盘玻璃钢人物雕塑销售方法日照景区玻璃钢雕塑厂家广东主题公园玻璃钢卡通形象雕塑玻璃钢塑料雕塑常州动物玻璃钢雕塑公司贵州园林玻璃钢雕塑房产玻璃钢雕塑香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化