一.准备工作
下载TBtools
知乎-TBtools下载教程
参考教程,下载TBtools,并记住TBtools的安装目录路径在哪.
下载并正确放置fsta,gff3文件
先根据基因号打开序列浏览页面,然后下载对应的FASTA,GFF3文件.(图1)
然后把这两文件移动或复制到TBtools主目录下(也可以是它的子目录,建议在主目录新建文件夹,起个名字,把两文件装里面,便于后续翻找)(图2).很重要,若不在同一个主目录,后续运行会失败,提示找不到文件.
#主目录在哪?出现TBtools.exe程序的目录就是主目录.
图1.下载FASTA和GFF3
图2.你所看见的就是"主目录"
为了便于个人使用,我把两文件复制在了新建的"序列相关信息"子目录里.
二.进行筛选
打开序列提取界面
启动TBtools,左上角打开Sequence Toolkit(序列工具包)---GFF3/GTF Manipulate(GFF3与GTF操纵)---GXF Sequences Extract(GXF序列提取)
点击顺序
设置路径
在序列提取界面,在A/B行分别放置TBtools主目录或其子目录里的GFF3注释文件/FASTA序列信息.
注意,C行不但需要为输出结果设置路径,还需要给结果起名字(.fa后缀),这条路径不局限于主目录,可以是任意.
根据输入栏提示信息操作
运行
路径设置完毕后,先点击A行下方的Initialize(初始化).然后会弹出GFF3的相关信息,可无视.初始化成功后,在A行下方会出现Feature Tag:CDS(这是默认的,当然也可以选其他Tag).
最后,点击Start即可!运行成功时,会出现Extraction Finished(提取完毕)弹窗.
示例
这是一个示例.
A/B行路径很明显出现了TBtools\路径,表示这在主目录下.
注意C行,TB_Output\是路径,Output.fa是我设置输出文件名字,后缀是.fa,我所设置的这条路径并没局限于主目录.
示例
(网上其他方案并没指出并强调FASTA和GFF3必须在主目录下,我亲自排雷后整理出这一教程)