当前位置: 首页 > article >正文

Fastq文件的获取

Fastq文件的获取

  • Fastq文件的获取
      • linux 下安装SRA Toolkit工具
      • 使用SRA Toolkit工具下载SRA数据

Fastq文件的获取

author:CYH-BI

date:2023.10.25

Fastq文件得获取 ,可以从NCBI获取,也可以自己测序得到结果,下面介绍从网上获取数据。

linux 下安装SRA Toolkit工具

2023.3.24

1、NCBI 官网查看工具地址,并下载安装包

具体操作步骤如下:

  • 打开NCBI 官网

    在这里插入图片描述

  • 点击Download Tools并进入

    在这里插入图片描述

  • 找到SRA Toolskit

在这里插入图片描述

  • 会转跳到github ,复制下载连接,后续使用Linux wget 命令下载

    在这里插入图片描述

  • 打开Linux 总端,使用wget 命令下载

    wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.7/sratoolkit.3.0.7-centos_linux64.tar.gz
    

2、解压sratoolkit.3.0.7 安装包.。注意包名称,我们的不一定一样(不同版本不一样)

tar xvf sratoolkit.3.0.7-centos_linux64.tar.gz

3、查看有无安装成功(如果软件含有bin目录,大多情况下配置环境时路径需要精确到bin)

cd /home/cyh/sratoolkit/sratoolkit.3.0.7-centos_linux64/bin #看看能不能打开bin

4、配置SRA Toolkit工具环境

nano ~/.bsahrc  #编辑.bashrc文件 或者是 vim /etc/.bashrc

export PATH="/home/cyh/sratoolkit/sratoolkit.3.0.7-linux64/bin:$PATH"  #最后一行输入
#编辑结束后按CTRL+C保存,按提示后按回车
# 格式:export PATH="<路径>:$PATH" ;路径要精确到bin
#注意:你的全路径。是你的,不是我的。
#注意:你的全路径。是你的,不是我的。
#注意:你的全路径。是你的,不是我的。
source ~/.bashrc  #重启文件

SRA Toolkit 工具的目的是下载NCBI未处理的SRA数据,还能将SRA文件处理成fastq文件

使用SRA Toolkit工具下载SRA数据

1、使用命令下载感兴趣的数据,SRA Toolkit 工具有个命令可以稳定下载数据,就是有点慢,但是稳定。

[root@localhost sra_data]# prefetch SRR12415658  ##以SRR12415658为例

以SRR12415658数据为例:

建议使用后台下载:(如果是服务器,后台下载不会因为连接中断而中断,除非服务器网断了)

nohup prefetch SRR12415658 &   

对于多个数据下载:(方法多种多样,可以自己写循环)

2、下载后,使用fastq-dump拆分sra数据,转变为fastq格式数据

fastq-dump --split-3 SRR12415658.sra

--split-3表示双端测序

加以加上 -o 参数,不加就会下到sra 里面(好像在SRA Toolkit里,忘记了,上次找了好久)。

fastq-dump --split-3 SRR12415658.sra -o /home/cyh/Desktop/sra

将结果输出到 /home/cyh/Desktop/fastq ,(文件你得先有)

3、还需了解其他参数,可以使用 -h参数。比如,如果你需要将文件输出到其他地方,加个 -o参数。

fastq-dump -h

后续可以得到两个fastq文件 ,用于后续FastQC 质控。


http://www.kler.cn/a/104162.html

相关文章:

  • 小学数学作业练习册出题网站源码_支持打印转成PDF
  • On Moving Object Segmentation from Monocular Video with Transformers 论文阅读
  • ajax请求的时候get 和post方式的区别?
  • 漏洞复现--用友 畅捷通T+ .net反序列化RCE
  • 【23种设计模式】里氏替换原则
  • (完全解决)如何输入一个图的邻接矩阵(每两个点的亲密度矩阵affinity),然后使用sklearn进行谱聚类
  • 华纳云:网络dns配置异常怎么处理
  • 驱动开发3 ioctl函数的使用+3个实例(不传递第三个参数、第三个参数为整型、第三个参数为地址)
  • Mac电脑窗口管理Magnet中文 for mac
  • JVM(一)
  • 【开源框架】Glide的图片加载流程
  • SpringCloud 微服务全栈体系(四)
  • 【C++】继承 ⑫ ( 继承的二义性 | virtual 虚继承 )
  • 51单片机KeyWard
  • 前端3D规划
  • 【C++】初阶模板
  • ORB-SLAM安装过程遇到问题记录整理
  • Look Back(cf div3 905)
  • GPT带我学-设计模式-10观察者模式
  • 字符设备驱动注册的本质及注册注销步骤,struct inode/file结构体作用