Bonito
Bonito
Bonito 是一个用于牛津纳米孔测序读段的开源研究级碱基识别器。
对于除碱基识别器训练或方法开发之外的任何用途,请使用 dorado。
$ pip install --upgrade pip
$ pip install ont-bonito
$ bonito basecaller dna_r10.4.1_e8.2_400bps_hac@v5.0.0 /data/reads > basecalls.bam
Bonito 支持输出对齐/未对齐的 {fastq, sam, bam, cram}
文件。
$ bonito basecaller dna_r10.4.1_e8.2_400bps_hac@v5.0.0 --reference reference.mmi /data/reads > basecalls.bam
Bonito 会在首次使用时自动下载并缓存碱基识别模型,但所有模型也可以通过以下命令手动下载:
$ bonito download --models --show # 显示所有可用模型
$ bonito download --models # 下载所有可用模型
Transformer 模型
bonito.transformer
包需要 flash-attn。
由于 flash-attn
的打包系统阻止其被列为常规依赖项,因此必须手动安装。
设置 CUDA_HOME
为相关的库目录将有助于避免包之间的 CUDA 版本不匹配。