当前位置: 首页 > article >正文

甲基化组学全流程生信分析教程

甲基化组学全流程分析和可视化教程

读取数据目录下的idat文件的甲基化全流程一键分析

功能简介

  1. 甲基化分析模块可以实现甲基化芯片450K, 870kEPIC数据的自动读取,可以读取idat文件,也可以读取beta甲基化矩阵文件
  2. 甲基化数据的缺失值插值
  3. 甲基化数据的质控分析
  4. 甲基化数据的归一化处理分析
  5. 甲基化数据的SVD分析
  6. 甲基化数据的Combat去除批次效应分析
  7. 甲基化数据的DMP差异甲基化位点分析
  8. 甲基化数据的DMR差异甲基化区域分析
  9. 甲基化数据的差异block分析
  10. 甲基化数据的GSEA分析
  11. 甲基化数据的CNA分析

参数解释

func_arraytype:可选450k或EPIC,EPIC是870K的甲基化芯片

func_resultsDir: 分析结果要保存的目录

func_compare__groups__str: 做DMP和DMR分析时候要指定的比较分组,多个分组间用;号隔开

func_runBlock:是否进行比较耗时的block分析,默认为FALSE

func_runGSEA: 是否进行比较耗时的GSEA分析,默认为FALSE

func_runCNA: 是否进行比较耗时的CNA分析,默认为FALSE

nested_function: 是否嵌套函数

run_file_path: 甲基化.idat格式的原始数据所在的目录

run_read_file:是否要读取文件

run_analysis_type_name: 分析项目名称

run_add__res__dir: 是否要创建res_dir结果目录

run_add_save_file_prefix: 是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

参数给定的默认值

func_arraytype: 450K ;

func_resultsDir: D:/omics_tools/demo_data/methylation/lung_results/ ;

func_compare__groups__str: T-C ; func_runBlock: FALSE ; func_runGSEA: FALSE ; func_runCNA: FALSE ; nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_raw/ ;

run_read_file: FALSE ; run_analysis_type_name: 10.met_analysis_from_idat ;

run_add__res__dir: FALSE ; run_add_save_file_prefix: FALSE ;

run_add__parent__dir: FALSE

窗口截图

91b02e38c0c62a26abdbc951a1658257.jpeg

运行中的显示信息

执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\10.met_analysis_from_idat_last_final_run_res_log.csv

运行完成的显示信息

结果展示

6f27660458d1dd399ea0cb9fb9954ee8.jpeg

读取甲基化beta矩阵文件的甲基化全流程一键分析

功能简介

  1. 甲基化分析模块可以实现甲基化芯片450K, 870kEPIC数据的自动读取,可以读取idat文件,也可以读取beta甲基化矩阵文件
  2. 甲基化数据的缺失值插值
  3. 甲基化数据的质控分析
  4. 甲基化数据的归一化处理分析
  5. 甲基化数据的SVD分析
  6. 甲基化数据的Combat去除批次效应分析
  7. 甲基化数据的DMP差异甲基化位点分析
  8. 甲基化数据的DMR差异甲基化区域分析
  9. 甲基化数据的差异block分析
  10. 甲基化数据的GSEA分析
  11. 甲基化数据的CNA分析

模块使用讲解

参数解释

func_arraytype: 可选450k或EPIC,EPIC是870K的甲基化芯片

func_met__probe__col:甲基化探针所在的列名,当从beta文件开始分析时,要提供

func_resultsDir:分析结果要保存的目录

func_sample__anno__file:样本注释信息的文件,默认是空,如果file_path给的是beta矩阵文件,则需要给出sample.anno.file

func_compare__groups__str:做DMP和DMR分析时候要指定的比较分组,多个分组间用;号隔开

func_runBlock: 是否进行比较耗时的block分析,默认为FALSE

func_runGSEA:是否进行比较耗时的GSEA分析,默认为FALSE

func_runCNA:是否进行比较耗时的CNA分析,默认为FALSE

nested_function:是否嵌套函数

run_file_path:甲基化beta矩阵的文件路径

run_read_file:是否要读取文件

run_analysis_type_name:分析项目名称

run_add__res__dir:是否要创建res_dir结果目录

run_add_save_file_prefix;是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

给定参数的默认值

func_arraytype: 450K ;

func_met__probe__col: V1 ;

func_resultsDir: D:/omics_tools/demo_data/methylation/lung_results/ ; func_sample__anno__file: D:/omics_tools/demo_data/methylation/lung_results/myImpute_pd.csv ; func_compare__groups__str: T-C ; func_runBlock: FALSE ;

func_runGSEA: FALSE ;

func_runCNA: FALSE ;

nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_results/myLoad_beta.csv ;

run_read_file: FALSE ;

run_analysis_type_name: 10.met_analysis_from_beta ;

run_add__res__dir: FALSE ;

run_add_save_file_prefix: FALSE ;

run_add__parent__dir: FALSE

窗口截图

021bcd2096c25d856cb502df21aee70f.jpeg

运行中的显示信息

分析正在执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation/lung_results; 运行结果日志保存的路径为: D:/omics_tools/demo_data/methylation/lung_results\10.met_analysis_from_beta_last_final_run_res_log.csv

结果展示

7cfa2ed0329789686355f0949837782a.jpeg

样本的PCA分群聚类分析和剔除异常样本

样本的PCA分群聚类分析

83267152c19dec6a2f0924948d4287f4.jpeg

34bbb9b326eeae549d12bb32da7de53d.jpeg

82a9f9f594995ac5c1db67e056d1daee.jpeg

e16d68d5d765100ad607e48d62b30077.jpeg

删除异常样本

f1da2eb257b540f130646dfec2f55597.jpeg

剔除异常样本后再次进行PCA分群聚类分析

b3d1353c995c2f6b044e79e26f304796.jpeg

cb81cd949a8032c43180296e7cab59d1.jpeg

9d77992ecadd3117e042cf197feef6da.jpeg

DMRs差异甲基化区域的基因组circos图

参数解释

func_chr__col: bed文件中染色体编号所在的列名

func_start__col: bed文件中起始位置所在的列名

func_end__col: bed文件中终止位置所在的列名

func_value__col: bed文件中结果数值所在的列名

func_use__value__threshold: 是否对value的阈值进行筛选,默认为TRUE

func_value__threshold: bed文件中结果数值的阈值,默认为0

func_p__value__col: bed文件中p值所在的列名

func_title:图表的标题

func_chr__track:是否绘制不同颜色的染色体轨道

func_species:物种的基因组版本号

nested_function:是否嵌套函数

run_file_path:甲基化DMRs结果的文件路径

run_read_file:是否要读取文件

run_analysis_type_name:分析项目名称

run_add__res__dir:是否要创建res_dir结果目录

run_add_save_file_prefix:是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

已给定参数的默认值

func_chr__col: seqnames ;

func_start__col: start ;

func_end__col: end ;

func_value__col: value ;

func_use__value__threshold: TRUE ;

func_value__threshold: 0 ;

func_p__value__col: p.value ;

func_title: DMRs genome plot ;

func_chr__track: FALSE ;

func_species: hg19 ;

nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_results/myDMR_BumphunterDMR.csv ; run_read_file: FALSE ;

run_analysis_type_name: 10.circlize_plot ;

run_add__res__dir: TRUE ;

run_add_save_file_prefix: TRUE ;

run_add__parent__dir: TRUE

运行中的显示信息

分析正在执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\10.circlize_plot; 运行结果日志保存的路径为: D:/omics_tools/demo_data/methylation\10.circlize_plot\10.circlize_plot_last_final_run_res_log.csv

窗口截图

8822b604a38446e6c5071b4f45a48d57.jpeg

运行完成的显示信息

执行已完成,运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\10.circlize_plot; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\10.circlize_plot\10.circlize_plot_last_final_run_res_log.csv

结果展示

结果文件列表

50b2221ce447c13cce94dd3eaecf1012.jpeg

Circos图

177f1f069bc329dcb422adec31f6ea89.jpeg

差异甲基化位点结果的棒棒糖图可视化

参数解释

func_data__type:数据类型选择methylation

func_sequence__type: 序列类型,是DNA还是protein

func_gtf__anno__file: hg19的基因组注释gtf文件,450K和EPIC都是用的hg19基因组

func_gene__list__str:选择绘制的基因,多个基因用分号分割来批量绘制

func_gene__col: DMP结果文件中基因名称的列名

func_pos__col: DMP甲基化位点位置所在的列名

func_pos__name__col: 甲基化探针名称所在的列名

func_value__col: DMP结果的组间甲基化差值所在的列名

func_pval__col: DMP结果的p值所在的列名

nested_function: 是否嵌套函数

run_file_path: 甲基化DMP结果的文件路径

run_read_file: 是否要读取文件

run_analysis_type_name: 分析项目名称

run_add__res__dir: 是否要创建res_dir结果目录

run_add_save_file_prefix: 是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

已给定的参数默认值

func_data__type: methylation ;

func_sequence__type: DNA ;

func_gtf__anno__file: E:/data/download/Homo_sapiens.GRCh37.75.genome_anno.csv ; func_gene__list__str: HOXB3;CLDN18 ;

func_gene__col: gene ;

func_pos__col: MAPINFO ;

func_pos__name__col: V1 ;

func_value__col: Diff.Value ;

func_pval__col: P.Value ;

nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_results/myDMP_C_to_T_with_gene_anno.csv ; run_read_file: FALSE ;

run_analysis_type_name: 9.met_lollipot_plot ;

run_add__res__dir: TRUE ;

run_add_save_file_prefix: TRUE ;

run_add__parent__dir: TRUE

窗口截图

b3f2ac9ae63c6f127d913ba303072d9d.jpeg

运行中的显示信息

执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot\9.met_lollipot_plot_last_final_run_res_log.csv

运行完成的显示信息

执行已完成,运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot\9.met_lollipot_plot_last_final_run_res_log.csv

结果展示

结果文件列表

2f7eeabc9078a960528138eea9303670.jpeg

结果图

89357794e0af09a13cba113b61d84202.jpeg65d15c7badee5f38dab8dc9d861b27d3.jpeg

差异甲基化DMPs的统计分析条形图可视化

b4190a4ffe100d5925bfa45837010e46.jpeg

ed01e32dde7e5bc1c6927c9266c28390.jpeg

0019b2e20e21c9c95da1aa447fad66b5.jpeg

差异甲基化基因的火山图绘制

e90d07faaa5dedafe5e1d453ed5e774e.jpeg

12db007bccdecb80e209283832b81220.jpeg

差异甲基化基因的GO,KEGG和GSEA富集分析

差异甲基化基因的GO和KEGG富集分析

576f0b6fe540e999e7e098daf0764074.jpeg

31e57b85349124e0979b230acd10c92d.jpeg

GO富集分析结果图

04f0748758b7ff5214ac31986490cdc0.jpeg

KEGG富集分析结果图

f1c6ec295c4e753dfd2a596381e27047.jpeg

GSEA富集分析

fd04c86eb3da6f57c8761d6dc8f63861.jpeg

02f80dbcf830a24835fd742ec37ee2c5.jpeg


http://www.kler.cn/a/282443.html

相关文章:

  • 工化企业内部能源能耗过大 落实能源管理
  • 【机器学习导引】ch6-支持向量机
  • hive alter table add columns 是否使用 cascade 的方案
  • 深入探索 Kubernetes 安全容器:Kata Containers 与 gVisor
  • 蓝桥杯每日真题 - 第14天
  • GitHub新手入门 - 从创建仓库到协作管理
  • 链游开发教学
  • 项目配置在nacos配置中心进行管理
  • SK Hynix明年将开发基于96/128 GB DDR5的CXL 2.0内存解决方案
  • 深入理解Python中的装饰器链(Chaining Decorators)
  • git pull时如何避免输入用户名和密码?
  • flowable源码解读——内存缓存设计
  • 探秘紫白洋桔梗花语:勇气、爱情、希望与清晰的象征解读
  • vue前端获取电脑本机的mac和ip地址
  • 国密起步2:GmSSL3使用SM4(对称加密)
  • C语言阴阳迷宫
  • 【Python机器学习】NLP词频背后的含义——隐性语义分析
  • java 读取json文件并写入Excel
  • 【功能自动化】使用测试套件运行测试函数
  • 如何上传NPM包:一步步指南
  • Java、python、php版 剧本杀拼团服务平台 剧本杀管理系统(源码、调试、LW、开题、PPT)
  • RAG Paper List - 检索增强生成论文汇总(2)
  • 一文了解内网穿透以及内网穿透工具 Sunny-Ngrok 的使用指南
  • Java的内存管理机制之(垃圾回收(GC)原理)
  • 【我的Android进阶之旅】 Android官方推荐的依赖注入框架:Dagger Hilt
  • foundation model