当前位置: 首页 > article >正文

IL-AD

IL-AD

我们利用机器学习方法来适应纳米孔测序基对齐器,用于核苷酸修饰检测。我们首先应用增量学习技术来改进富含修饰的序列的基对齐,这些序列通常具有高度的生物学兴趣。在解析序列主干后,我们进一步对单个核苷酸进行异常检测,以确定其修饰状态。通过这种方式,我们的管道承诺实现单分子、单核苷酸和序列上下文无关的修饰检测。

依赖项

samtools: https://github.com/samtools/samtools

taiyaki: https://github.com/nanoporetech/taiyaki/tree/master/taiyaki

使用方法

增量学习

训练过程

python ./scripts/train.py model_template.py pretained_model.checkpoint input.hdf5 --device cuda:0 --outdir path/to/output \
--save_every epochs --niteration niterations --lr_max lr_max --lambda lambda --min_sub_batch_size batchsize

model_template.py: 模型架构,例如 taiyaki templates

pretained_model.checkpoint: 要进行增量学习的模型,例如 taiyaki pretrained models

input.hdf5 : 由 taiyki workflow 生成的训练数据集

--device: 我们建议使用GPU进行增量学习训练

--output: 输出字典的路径

--save_every epochs: 每 epochs 次迭代保存一次检查点

--niterations niterations: 增量学习中的迭代次数

--lr_max lr_max: AdamW优化器中的默认学习率

--lambda lambda: 我们使用超参数 λ \lambda λ 平衡 L C T C L_{CTC} LCTC L


http://www.kler.cn/a/403511.html

相关文章:

  • Spring Batch 表结构
  • [Realtek sdk-3.4.14b] RTL8197FH-VG新增jffs2分区操作说明
  • OpenCV与AI深度学习|16个含源码和数据集的计算机视觉实战项目(建议收藏!)
  • STM32H7开发笔记(2)——H7外设之多路定时器中断
  • 【代码pycharm】动手学深度学习v2-04 数据操作 + 数据预处理
  • CSS中Flex布局应用实践总结
  • 付费会员数量统计错误修复
  • RabbitMQ 高级特性——延迟队列
  • vitess使用:从部署到go客户端连接查询
  • 深入解析PostgreSQL中的PL/pgSQL语法
  • React Native 全栈开发实战班 - 用户界面之手势系统应用
  • Android ConstraintLayout 基础
  • Day03_AJAX原理 (黑马笔记)
  • Python从0到100(七十三):Python OpenCV-OpenCV实现手势虚拟拖拽
  • 2025年软考初级【信息处理技术员】考试大纲
  • SELinux 的端口号权限以及使用 semanage 工具添加权限
  • 《TCP/IP网络编程》学习笔记 | Chapter 12:I/O 复用
  • Ubuntu 22.04 上快速搭建 Samba 文件共享服务器
  • 微信小程序的医院预约挂号系统
  • netcore Kafka
  • 【SQL 实现计算已历完整月份不同日期的场景】
  • JDK安装和Linux常见设置详细版教程
  • springboot第82集:消息队列kafka,kafka-map
  • VRT: 关于视频修复的模型
  • 佛山三水戴尔R740服务器黄灯故障处理
  • 使用docker compose安装部署gitlab