如何看blast的结果

Blast后的结果怎么看?
1.blast之后,看你的目标基因有没有对比 。一般出现在前一两个 。注意是否有突变 。
【如何看blast的结果】2.用blastx软件对比你的序列,看看有没有你的目的蛋白,编码的蛋白有没有突变 。
blast结果如何分析
在Blast比较结果中,得分越高,同源性越好 。期望值越小,比较结果越好,说明某些原因造成的误差越小;同一性就是同源性(相似性) 。例中比对的1588个碱基只有3个错配,其他99%相同,同源性相当好,几乎相同;缺口是指或多或少的碱基或缺失碱基的数量;Strand=plus/plus/plus表示两个序列方向相同 。如果是正/负,说明一个是5 “到3 “,一个是3 “到5 “,或者一个是正向,一个是反向 。一些具体指标的定义或计算方法可以参考相关的生物信息学教材 。||||由于Blast采用了另一种统计方法,其典型的输出结果不需要圆柱圆圈,但仍然包括相似序列的列表和平行分析的结果 。相似序列列表中的Highscore是这个相似序列中最相似区域的得分,与FastA有很大不同 。在FastA中,插入间隙来连接几个相似的区域(对角线),因此最相似的区域中的“一个”将被列在最后 。Blast不会试图连接相似的片段,换句话说,它不允许有间隙,所以它会计算每个相似区域的得分,并列出这个序列中得分最高的片段的得分 。HSP(High-scoringSegmentPair)只代表部分评分高的片段 。当它们单独存在时,可能无法通过统计检验,但当几个HSP连在一起时,就会通过检验 。列表中的“Smallestsumprobability”表示将几个HSP连接在一起后的统计数据 。其中N代表参与HSPs的数量,P(N)代表在给定搜索条件下找到与高分相同或更高分的片段的概率 。每种蛋白质的长度不同,即使得分相同,其概率也不同 。在相似序列的排序中,不是按分数排序,而是按概率排序,所以一些分数较高的序列反而排在后面 。对于蛋白质的比较,如果概率小于0.02,则认为它们是同源的 。因为程序默认保留250个序列,如果认为有意义的序列超过这个数,程序将自动警告您 。如果认为有意义的序列总数超过1000,可能是序列中存在一些重复序列,必须过滤掉,以免干扰搜索结果 。||||被认为是同源的 。因为程序默认保留250个序列,如果认为有意义的序列超过这个数,程序将自动警告您 。如果认为有意义的序列总数超过1000,可能是序列中存在一些重复序列,必须过滤掉,以免干扰搜索结果 。|||得分值越高,同源性越好;期望值越小,比较结果越好,说明某些原因造成的误差越小;同一性就是同源性(相似性) 。例中比对的1588个碱基只有3个错配,其他99%相同,同源性相当好,几乎相同;缺口是指或多或少的碱基或缺失碱基的数量;Strand=plus/plus/plus表示两个序列方向相同 。如果是正/负,说明一个是5 “到3 “,一个是3 “到5 “,或者一个是正向,一个是反向 。||||由于Blast采用了另一种统计方法,其典型的输出结果不需要圆柱圆圈,但仍然包括相似序列的列表和平行分析的结果 。
blast 结果如何看?
我完全基于查询覆盖率 。其实最上面的几个要么是你Blast的核苷酸序列,要么是这个序列的全长,要么是染色体上的DNA序列 。你可以通过看前几个位置的描述来确定你的细菌属于哪一种 。

如何看blast的结果

文章插图
本地blast序列比对结果怎么看
打开BLAST页面,http://www.ncbi.nlm.nih.gov/BLAST/会打开如图:对上面的页面做一个必要的介绍:BLAST的这个页面的主体部分(左边)包括三个部分:BLAST组装基因组、基础BLAST、专门BLAST 。我相信你能理解这三个短语的意思,我就不多说了 。我想说的是,可以认为是序列比对的三种方法,或者说是爆破的三种方式 。BLAST组装基因组的第一部分是让你选择想要比较的物种,然后点击对应的物种进入比较页面 。第二部分,基础爆破,包含五个常用爆破,每个都有简单介绍 。第三部分专门blast是一些特殊用途的BLAST,比如IG BLAST,SNP等 。这时候你就需要在专门的疾风板块做出适当的选择 。总之,这是一个导航页面,目的是让你根据自己的对比目的,选择相应的爆破路线 。先说BLAST与最基本的核酸序列比对的使用,期间我还会影射其他的序列比对方法 。2.单击基本blast部分中的核苷酸BLAST链接到新页面 。打开后,如图:介绍上图页面:输入查询序列部分让我们输入序列 。可以直接粘贴序列,上传序列,选择想要比较的序列的范围(留空表示比较想要输入的整个序列) 。职称部分也可以给这个工作起一个名字 。选择搜索集部分允许我们选择物种或序列类型(基因组DNA,mRNA等 。)与目标序列进行比较 。如果是人或者老鼠,如果是另一个物种可以直接选择“其他” 。这时网页会主动弹出下拉对话框和输入对话框 。你可以选择分别介绍上面的页面:输入查询序列部分让我们输入序列 。可以直接粘贴序列,上传序列,也可以选择想要比较的序列的范围(留空表示比较想要输入的整个序列) 。职称部分也可以给这个工作起一个名字 。选择搜索集部分允许我们选择物种或序列类型(genomeDNA,mRNA等 。)与目标序列进行比较 。如果是人或者老鼠,如果是其他物种可以直接选择“其他” 。这时网页会主动弹出一个下拉对话框和一个输入对话框,你可以选择输入要和你的序列进行比对的序列类型和物种 。可以比较下面的Entrez查询来适当地限制结果 。程序选择部分实际上让我们选择这种比较的准确性,种内和种间,等等 。BLAST按钮下面有一个“算法参数”,是一个参数设置选项 。一般用户不能使用这个选项,所以是隐藏的 。点击它,可以在原网页底部添加算法参数的内容 。这里大部分战友不需要改选项,我就不多说了 。有兴趣的朋友可以自己研究一下 。3.依次填写以上网页的所需部分,点击BLAST按钮后会出现如下界面(只会截取一部分):这个结果页面的信息量非常大,如果仔细观察还是可以发现一些主要指标的 。上面这张图也列出来给你看这些评价标准 。在描述部分,推荐大家详细看看 。此外,指标“E值”不同于其他指标 。其值越小,相似度越高 。其他指标(如总分)都有较高的相似性 。在这个图表的底部是特定的相似核酸序列,以及各种参数的分数 。
如何看懂NCBI BLAST输出结果
掌握以下概念后,你就可以理解NCBI爆炸的输出结果了 。Alignments代表比对中的两个序列 。hits代表两个序列比对中的片段分数 。如果序列匹配,得分不同,得分减少 。分数越高,两个序列的相似度越高,e值越小,可信度越高 。它是一个相对的统计值 。输入序列的长度恒等式是一致的,即两个序列有多少是相同的 。Query表示输入序列Sbjct表示数据库中的序列 。
如何看blast的结果

文章插图
blast结果如何分析
在Blast比较结果中,得分越高,同源性越好 。期望值越小,比较结果越好,说明某些原因造成的误差越小;同一性就是同源性(相似性) 。例中比对的1588个碱基只有3个错配,其他99%相同,同源性相当好,几乎相同;缺口是指或多或少的碱基或缺失碱基的数量;Strand=plus/plus/plus表示两个序列方向相同 。如果是正/负,说明一个是5 “到3 “,一个是3 “到5 “,或者一个是正向,一个是反向 。一些具体指标的定义或计算方法可以参考相关的生物信息学教材 。||||由于Blast采用了另一种统计方法,其典型的输出结果不需要圆柱圆圈,但仍然包括相似序列的列表和平行分析的结果 。相似序列列表中的Highscore是这个相似序列中最相似区域的得分,与FastA有很大不同 。在FastA中,插入间隙来连接几个相似的区域(对角线),因此最相似的区域中的“一个”将被列在最后 。Blast不会试图连接相似的片段,换句话说,它不允许有间隙,所以它会计算每个相似区域的得分,并列出这个序列中得分最高的片段的得分 。HSP(High-scoringSegmentPair)只代表部分评分高的片段 。当它们单独存在时,可能无法通过统计检验,但当几个HSP连在一起时,就会通过检验 。列表中的“Smallestsumprobability”表示将几个HSP连接在一起后的统计数据 。其中N代表参与HSPs的数量,P(N)代表在给定搜索条件下找到与高分相同或更高分的片段的概率 。每种蛋白质的长度不同,即使得分相同,其概率也不同 。在相似序列的排序中,不是按分数排序,而是按概率排序,所以一些分数较高的序列反而排在后面 。对于蛋白质的比较,如果概率小于0.02,则认为它们是同源的 。因为程序默认保留250个序列,如果认为有意义的序列超过这个数,程序将自动警告您 。如果认为有意义的序列总数超过1000,可能是序列中存在一些重复序列,必须过滤掉,以免干扰搜索结果 。||||被认为是同源的 。因为程序默认保留250个序列,如果认为有意义的序列超过这个数,程序将自动警告您 。如果认为有意义的序列总数超过1000,可能是序列中存在一些重复序列,必须过滤掉,以免干扰搜索结果 。|||得分值越高,同源性越好;期望值越小,比较结果越好,说明某些原因造成的误差越小;同一性就是同源性(相似性) 。例中比对的1588个碱基只有3个错配,其他99%相同,同源性相当好,几乎相同;缺口是指或多或少的碱基或缺失碱基的数量;Strand=plus/plus/plus表示两个序列方向相同 。如果是正/负,说明一个是5 “到3 “,一个是3 “到5 “,或者一个是正向,一个是反向 。||||由于Blast采用了另一种统计方法,其典型的输出结果不需要圆柱圆圈,但仍然包括相似序列的列表和平行分析的结果 。

    推荐阅读