云高性能计算 CHPC :基因研究的加速器(二)使用Docker工作流示例
在当今科技迅速发展的时代,基因行业正面临前所未有的数据挑战和机遇。随着基因测序技术的不断进步和普及,生成的数据量急剧增加,传统的数据处理方法已难以满足现代基因学的需求。高性能计算(HPC)在此背景下显得尤为重要,它不仅能加速基因数据的处理速度,还能提高数据分析的准确性和效率。
百度智能云云高性能计算平台 CHPC 的基因分析平台广泛用于基因数据从样本到报告的分析过程。典型应用场景包括基因数据分析、测序生产自动化和基因云平台开发等。
在上文 云高性能计算 CHPC :基因研究的加速器(一)-CSDN博客 中,我们介绍了百度智能云 CHPC 基因分析平台中工作空间的使用方法,使用流程如下:
同时,我们也为大家举例使用网盘工作流的具体操作指南,本篇文章将为大家详细介绍百度智能云 CHPC 基因分析平台使用 Docker 工作流示例。
介绍百度智能云 CHPC 基因分析平台支持 Docker 运行作业。
WDL 支持 Docker 相关参数,如下表:
注意事项:
- Docker镜像目前支持百度CCR公有镜像
- 建议把自定义软件打包在Docker镜像中
示例 WDL 文件如下:
version 1.0
workflow myWorkflow {
call myTask
}
task myTask {
input {
String input_fasta
String output_fasta
}
command {
clustalo -i "${input_fasta}" -o "${output_fasta}"
}
runtime {
memory: "1 GB"
cpu: "1"
queue: "default_queue"
# docker镜像,目前仅支持内网或者公共镜像
docker: "registry.baidubce.com/kun-public/clustalomega:latest"
# 指定docker用户
docker_user: "root"
}
output {
String out = "${output_fasta}"
}
}
最后,使用工作流创建运行任务。
1、选择工作流
在工作空间的工作流列表中,点击“运行”
2、输入 input 参数,点击提交
3、查看运行状态
4、运行执行完毕后,查看结果
欢迎了解百度智能云云高性能计算平台 CHPC