有参转录组分析 |基因组信息下载和FQ数据过滤教程
原文链接:参考基因组序列下载和转录组数据过滤
写在前面
这个教程也是前面《转录组上游分析》系列教程的中内容,我们今天单独的给作为一个章节来推送出来,因为,并不是所有人都是有这个系列教程有需求,可能你只是对某一个章节的内容感兴趣呢?
3.1 有独立的网站基因组文件下载
- 大部分的作物有自己基因组注释网址,我们需要自己的去寻找
模式植物中,拟南芥、番茄、 烟草等都有自己的基因组网址。
茄科类作物基因组:https://solgenomics.net/organism/solanum_lycopersicum/genome
我们点击,Tomato就可以进入到我们的网址界面,如下图所示。
这里显示了,Tomato最新的参考基因组序列和注释文件(SL 4.0和ITAG4.0),以及也有JBrowse等工具链接。进入对应的网址,即可下载参考基因fa文件和注释文件(gtf或gff格式)
- 基因组FA格式
-
注释文件
-
gff格式
- gff格式
3.2 NCBI 中下载基因组文件
- 如果自己的物种基因组没有单独的网址,如何做呢?
可以根据NCBI中进行下载
步骤:
- 进入NCBI官网(https://www.ncbi.nlm.nih.gov/)
- 输入需要寻找的基因组名称 (可以是作物名或是拉丁名)
- 在此界面就是我们的作物的基因组信息,有版本信息,geneome,transcript,protein,GFF,GenBank等信息。
点击即可下载,我们可以直接复制连接到服务器中下载,也可以本地直接下载,后上传到服务器中。
3.3 注释文件gtf格式和gff格式
…
…
原文链接:参考基因组序列下载和转录组数据过滤
往期文章:
1. 复现SCI文章系列专栏
2. 《生信知识库订阅须知》,同步更新,易于搜索与管理。
3. 最全WGCNA教程(替换数据即可出全部结果与图形)
-
WGCNA分析 | 全流程分析代码 | 代码一
-
WGCNA分析 | 全流程分析代码 | 代码二
-
WGCNA分析 | 全流程代码分享 | 代码三
-
WGCNA分析 | 全流程分析代码 | 代码四
-
WGCNA分析 | 全流程分析代码 | 代码五(最新版本)
4. 精美图形绘制教程
- 精美图形绘制教程
5. 转录组分析教程
转录组上游分析教程[零基础]
一个转录组上游分析流程 | Hisat2-Stringtie
小杜的生信筆記,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!!