当前位置: 首页 > article >正文

Skewer v0.2.2安装与使用-生信工具43

01 Skewer 介绍

Skewer(来自于 SourceForge)实现了一种基于位掩码的 k-差异匹配算法,专门用于接头修剪,特别设计用于处理下一代测序(NGS)双端序列。

fastp安装及使用-fastp v0.23.4(bioinfomatics tools-002)-CSDN博客

特性

  • 检测并去除接头序列
  • 支持模式匹配中的插入和删除
  • 适用于单端、双端(PE)和长配对(LMP)读取
  • 对带条形码的测序结果进行去重
  • 支持多线程
  • 基于 Phred 质量分数进行修剪
  • 支持条形码和接头中的 IUPAC 字符
  • 支持压缩输入和输出
  • 支持从二进制文件安装
02 安装
2.1 从二进制文件安装
  1. 将 skewer 复制到你喜欢的 BIN 目录,并确保正确设置 PATH 环境变量。例如:

    $ mkdir -p ~/bin
    $ cp -p skewer ~/bin/
    $ echo 'export PATH=~/bin:$PATH' >> ~/.bashrc
    $ source ~/.bashrc
    
2.2 从源代码安装
  1. 进入源代码目录,然后运行以下命令:

    $ make
    $ sudo make install
    
03 Skewer 使用说明

Skewer(一个快速且精确的接头修剪工具,适用于双端读取)

使用方法:

skewer [options] <reads.fastq> [paired-reads.fastq]
    或者
skewer [options] - (从 STDIN 获取输入)

选项说明(括号中的数字为默认值):
接头:
-x <str>:接头序列/文件(默认:AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC)
-y <str>:双端读取的接头序列/文件(默认:AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTA),如果只指定 -x,则隐式使用。
-M, --matrix <str>:指示有效接头配对的文件(所有为 1 的矩阵)。
-j <str>:Nextera Mate Pair 读取的接头序列/文件(默认:CTGTCTCTTATACACATCTAGATGTGTATAAGAGACAG)。
-m, --mode <str>:修剪模式;
单端:head:5' 端;tail:3' 端;any:任何位置(默认:tail)
双端:pe:双端;mp:mate-pair;ap:amplicon(默认:pe)
-b, --barcode:根据接头/引物去重条形码(默认:no)
容错:
-r <num>:允许的最大错误率(标准化错误数/对齐区域长度)[0, 0.5](默认:0.1)
-d <num>:允许的最大插入/删除错误率(默认:0.03)
-k <int>:接头检测的最小重叠长度 [1, inf);(单端的最大值:max(1, int(4-10*r));mate-pair的值为<junction length>/2)
修剪:
-c, --cut <int>,<int>:强制修剪掉 5' 端引物作为条形码(在放大模式下)(默认:no)
-e, --cut3:如果读取长度大于指定的最大长度,则强制修剪掉 3' 端尾部碱基(默认:no)
过滤:
-q, --end-quality <int>:修剪 3' 端直到达到指定的质量值(默认:0)
-Q, --mean-quality <int>:修剪前允许的最低平均质量值(默认:0)
-l, --min <int>:修剪后允许的最小读取长度(默认:18)
-L, --max <int>:修剪后允许的最大读取长度(默认:no limit)
-n:是否过滤掉高度退化的(包含许多 N)读取(默认:no)
-u:是否过滤掉未确定的 mate-pair 读取(默认:no)
-N, --fillNs:是否将修剪的碱基替换为 N(在 b 或 -m mp 情况下无效)(默认:no)
输入/输出:
-f, --format <str>:FASTQ质量值的格式:sanger|solexa|auto(默认:auto)
-o, --output <str>:输出文件的基本名称(默认:<reads>.trimmed)
-z, --compress:以 GZIP 格式压缩输出(默认:no)
-1, --stdout:重定向输出到 STDOUT,禁止使用 -b、-o 和 -z 选项(默认:no)
--qiime:为 QIIME 处理准备“barcodes.fastq”和“mapping_file.txt”(默认:no)
--quiet:不显示进度更新(默认:not quiet)
-A, --masked-output:为修剪后的读取写输出文件(修剪后的碱基转换为小写)(默认:no)
-X, --excluded-output:为被排除的读取写输出文件(默认:no)
其他:
-i, --intelligent:在 mate-pair 模式下,是否根据接头信息重新分配读取(默认:no)
-t, --threads <int>:并发线程数 [1, 32](默认:1)
    04 常用示例
    skewer -Q 9 -t 2 -x adapters.fa sample.fastq -o trimmed
    skewer -x AGATCGGAAGAGC -q 3 sample-pair1.fq.gz sample-pair2.fq.gz
    skewer -x TCGTATGCCGTCTTCTGCTTGT -l 16 -L 30 -d 0 srna.fastq
    skewer -m mp -i lmp-pair1.fastq lmp-pair2.fastq
    skewer -m ap --cut 0,6 --qiime -x forward-primers.fa -y reverse-primers.fa mix-pair1.fastq mix-pair2.fastq
    
     05 引用

    Jiang, H., Lei, R., Ding, S.W. and Zhu, S. (2014) Skewer: a fast and accurate adapter trimmer for next-generation sequencing paired-end reads. BMC Bioinformatics15, 182.


    http://www.kler.cn/a/530336.html

    相关文章:

  • 【Block总结】完全注意力Fully Attentional,同时捕捉空间和通道的注意力|即插即用
  • DeepSeek V3 vs R1:大模型技术路径的“瑞士军刀“与“手术刀“进化
  • 梯度提升用于高效的分类与回归
  • 鸟哥Linux私房菜笔记(三)
  • TensorFlow 简单的二分类神经网络的训练和应用流程
  • 数据库对象
  • AlexNet论文代码阅读
  • OpenAI发布最新推理模型o3-mini
  • 1. 【.NET 8 实战--孢子记账--从单体到微服务--转向微服务】--前言
  • Nginx开发01:基础配置
  • AI模型平台之——ModelScope(魔搭)
  • 面试题-消失的数字-异或
  • 线性回归的损失和优化02
  • 小红的合数寻找
  • DeepSeek 详细使用教程
  • 笔灵ai写作技术浅析(三):深度学习
  • 携程Java开发面试题及参考答案 (200道-上)
  • 深度学习 DAY3:NLP发展史(全网最全)
  • 【Windows7和Windows10下从零搭建Qt+Leaflet开发环境】
  • doris:主键模型的更新并发控制
  • css三角图标
  • Linux的循环,bash的循环
  • 开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势(一)
  • 【C语言】结构体对齐规则
  • MySQL是怎么实现事务隔离的?
  • [权限提升] Windows 提权 维持 — 系统错误配置提权 - PATH 环境变量提权