Blastp是啥玩意儿?
今儿个咱们唠唠这个叫blastp的东西,听着挺玄乎,其实也没啥大不了的。说白了,这玩意儿就是个比对蛋白质的工具,就像拿照片找人似的。你给它一张蛋白质的照片,它就帮你从一大堆照片里头找出长得像的。
这blastp有啥用呢?用处可大了去了!比如说,你发现个新蛋白质,不知道它是干啥的,就可以用blastp查查,看看它跟谁长得像。没准儿就发现,原来它跟那个谁谁谁是一家人,功能也差不多。
还有,这blastp还能帮你看看,你这蛋白质是不是变异了。有时候,蛋白质会因为各种原因变异,长得跟原来不一样了。用blastp一比对,就能看出来,哦,原来是这儿变了,那儿变了。
咋用blastp?
用blastp其实也不难,就跟查字典差不多。你把要查的蛋白质序列输进去,再选个数据库,就像选字典一样。然后,点一下“开始”按钮,blastp就吭哧吭哧地帮你找去了。
- 第一步: 准备好你的蛋白质序列,这玩意儿就像你的照片,得清楚才行。
- 第二步:找个蛋白质数据库,这数据库就像个照片库,里头有好多好多蛋白质的照片。
- 第三步:打开blastp这个工具,把你的蛋白质序列输进去,再选个数据库。
- 第四步:点一下“开始”按钮,等着blastp出结果。
blastp的结果咋看?
blastp跑完了,会给你一堆结果,密密麻麻的,看着就头晕。别慌,咱慢慢看。
看那个“命中数”,这玩意儿就是告诉你,找到了多少个长得像的蛋白质。命中数越多,说明你这蛋白质越常见。
然后,看那个“位分”,这玩意儿就是告诉你,两个蛋白质有多像。位分越高,说明越像,亲戚关系越近。
再然后,看那个“相似性百分比”,这玩意儿也是告诉你,两个蛋白质有多像。百分比越高,说明越像。
blastp还有一些参数,可以调整比对的严格程度。这些参数就像照相机的滤镜,可以让你看得更清楚,或者更模糊。
比如说,有个参数叫“e值”,这玩意儿是告诉你,比对结果的可信度。e值越小,说明结果越可信。一般来说,e值小于0.05,就比较可信了。
还有个参数叫“空位罚分”,这玩意儿是告诉你,对蛋白质序列中的空位怎么处理。空位就像照片上的污点,有时候会影响比对结果。
blastp这大家伙,还能干不少别的活儿呢。它有五种不同的比对方式,就像五把不同的刷子,可以刷不同的东西。
- blastp:这是最常用的方式,就是蛋白质和蛋白质直接比,看看谁跟谁长得像。
- blastx:这玩意儿是把核酸序列翻译成蛋白质序列,再跟蛋白质数据库比。适合你只有核酸序列,没有蛋白质序列的情况。
- tblastn:这玩意儿是把蛋白质序列跟核酸数据库比。适合你想知道某个蛋白质是由哪个基因产生的。
- tblastx:这玩意儿是把核酸序列翻译成蛋白质序列,再跟核酸数据库翻译成的蛋白质序列比。这最复杂,适合你啥也不知道,只想碰碰运气。
- blastn:这玩意儿是核酸序列和核酸序列直接比,看看谁跟谁长得像。
blastp的过滤功能
blastp比对的时候,还会自动过滤一些没用的信息。就像照相的时候,会把一些杂物挡住,只让你看到你想看的东西。
blastp会过滤掉一些低复杂度的序列,这些序列就像照片上的噪点,会干扰比对结果。还会过滤掉一些重复的序列,这些序列就像照片上的水印,也会干扰比对结果。
blastp这玩意儿,是个好东西,能帮咱们解决不少问题。虽然看着有点复杂,但只要你肯学,肯琢磨,就能掌握它。
Tags:[blastp, 蛋白质, 序列比对, 生物信息学, 数据库]