GENES模块---批量的引物设计、批量的序列提取以及批量翻译
在测定基因表达量的过程中,如何设计合理的引物是需要解决的重要问题。当要对大量序列设计引物时(例如,对家族成员进行引物设计或者对转录组进行验证),该过程将变得非常繁琐且耗时。那么该如何进行批量的引物设计呢?在SPDE的genes模块,设计了相应功能完成该过程。
首先,需要将要设计的引物整理成fasta格式,如下所示:
文章图片
fasta格式 基本格式是大于号,基因ID一行,下一行是序列。考虑到有些同学的fasta文件可能一个基因的序列在不同行上,例如:
文章图片
常见的一种fasta格式 这个时候,需要对文件进行一个格式化的处理。该功能安排在:
文章图片
格式化fasta文件 这里①,仅仅只是将不在同一行的序列归到一行;②,除了将不在同一行的序列归到一行以外,还对基因ID进行处理,处理的结果是把一些额外的、并不需要的信息给它去除掉,如下:
文章图片
②号功能,将额外信息从基因ID中去除 ③,将已经准备好的fasta文件转变成需要进行引物设计的格式。所以,如果需要批量引物设计,①和②择其一,③必选。
文章图片
经③处理后,大致的样子 将文件格式化后,来到genes模块:
文章图片
批量引物设计需要填写的内容 其中,①是PCR产物的长度,需要是一个范围(例如150-300)。然后是放入格式化好的fasta文件,设置保存控制文件的路径及名称(为什么要有控制文件,可参见前一章节,GENE模块),设置生成结果的保存路径及名称。这些设置完成后,分别点击右侧面板的①和②,即可完成批量引物设计:
文章图片
批量引物设计需要点击的功能 会同时产生两个类型的文件,其一是你所命名的文件,内容如下:
文章图片
包含全部引物信息的结果文件 每条序列除最上面的推荐引物外,还为用户提供了另外四对备选引物。其二是只含有推荐引物的文件,该文件的名字含有“-only_primers”字样,内容如下:
文章图片
只含有推荐引物的另一个文件 当然,一般情况下大家只需要关注只含有推荐引物的这个文件就好。同时,F和R已经为大家标明,如果这个文件每一对引物都是特异的,那么,可以将该结果直接复制到引物合成单中,对引物进行合成。如果,这个文件有些基因的引物与其他基因引物相同(这种情况比较常见于家族分析以及同一基因的不同转录本,因为,会有一些序列很相似的基因存在),那么大家就只能到GENE模块对序列相似的基因进行单独设计了(因为GENE模块中的引物设计可以指定引物产生的区域,也可以考虑利用GENE模块提取UTR区来设计引物)。当然,还有另外一种情况是设计引物的结果没有给出任何引物,这种情况的原因是你所放入的序列都不适合产生合理的引物,这个时候可能要考虑是否更换序列以及其他一些方式。与前一模块引物设计类似,该模块的引物设计功能也已经经过实验验证。
除引物的批量设计外,该模块还安排了其他的批量功能,例如:
文章图片
GENES模块的其他功能 ①从fasta文件中批量提取基因ID;②根据ID从fasta文件中提取相应序列(注意,一个ID一行);③根据基因ID从gff类文件中提取与其相关的信息;④批量翻译;⑤批量去除终止子。最后的两个功能则是检测所放入的ID是否在fasta文件或者gff类文件中。应用规律是,应保证所输入的fasta文件是如上所述经过格式化的,大家只需要按照功能后的数字,找到相应的框,填入需要的文件即可,比如①功能的后面标注的是1和7,那么需要填入信息的是第一个框和第七个框,所以:
文章图片
框一和框七 当然,除了这些功能外,还可以将fastq文件转为fasta文件。
文章图片
fastq转fasta 【GENES模块---批量的引物设计、批量的序列提取以及批量翻译】总体来说,基本功能就是这样。但,能够将这些功能组合到什么程度,这个以个人的智慧以及对SPDE熟练程度而定位~
推荐阅读
- SpringBoot调用公共模块的自定义注解失效的解决
- Node.js中readline模块实现终端输入
- python自定义封装带颜色的logging模块
- 解决SpringBoot引用别的模块无法注入的问题
- Python爬虫|Python爬虫 --- 1.4 正则表达式(re库)
- Python(pathlib模块)
- Apache多路复用模块(MPMs)介绍
- 振兴中华---争做新时代的好少年
- 青春的恋习曲
- 《将来的你,一定会感谢现在战胜烦恼的自己-------第四章/第十一节/用逆向思维解除烦恼》