当前位置: 首页 > news >正文

GWAS_LD

局部LDblock 绘图

1. 查看显著位点附近基因情况

链接pvalue显著位点文件
 ln -s ~/yiyaoran/GWAS/my_GWAS_J/P3.GWAS/01.tassel/mlm_output.manht_figure.sigSite.out .
#也可以自己筛选awk '$2 == 9 && $4 <= 0.000028481' mlm_output.manht_input>368_GWAS.snp
snp两端延伸50000bp作为绘图窗口, 注意chr名称问题
awk '$3 ~ /[0-9]/{print $2"\t"$3-1"\t"$3}' 368_GWAS.snp | \
awk '{if($1<10){print "Chr0" $0 }else{print "Chr" $0 }}' > ./GWAS.snp.bed#准备gene_length文件  注意染色体名称
cp  ~/yiyaoran/01.ref/chrsize.txt .
awk 'NR > 1 {printf "Chr%02d\t%d\n", $1, $2}' chrsize.txt > new_chrsize.txt
#"Chr%02d\t%d\n":
#Chr 是固定的前缀。
#%02d 表示将第一个字段($1)格式化为两位数字,不足两位时前面补零(例如 1 变成 01)。
#\t 是制表符,用于分隔列。
#%d 表示第二个字段($2)。
#\n 是换行符。#bedtools slop 用于扩展或收缩 BED 文件中的每个区间。
bedtools slop -b 50000 -i GWAS.snp.bed -g new_chrsize.txt > GWAS.snp.50000.bed#bedtools merge 用于合并重叠或相邻的区间
bedtools merge -i GWAS.snp.50000.bed > GWAS.snp.merge.bed
准备基因位置信息文件gff3或gtf文件
 awk '$3=="gene"' Zea_mays.Zm-B73-REFERENCE-NAM-5.0.60.gtf >gene.gtf
提取窗口内基因信息以及与显著snp最近的基因

注意bed文件的染色体名称和gtf文件的染色体名称是否一致

#修改染色体名称chr09为9
awk '{gsub(/^Chr/, ""); gsub(/^0+/, ""); print}' GWAS.snp.merge.bed > GWAS.snp.merge.fixed.bed
#提取窗口内的基因信息:
bedtools intersect -wo -a GWAS.snp.merge.bed -b gene.gtf > GWAS.snp.merge.gene
#bedtools intersect:用于找出两个文件中重叠的区间。
#-wo:输出重叠的区间,并在输出中包含重叠的长度(overlap size)#修改染色体名称
awk '{gsub(/^Chr/, ""); gsub(/^0+/, ""); print}' GWAS.snp.bed >GWAS.snp.fixed.bed
#找出与显著 SNP 最近的基因:
bedtools closest -a GWAS.snp.fixed.bed -b gene.sorted.gtf -d >GWAS.snp.gene
#bedtools closest:用于找出每个区间最近的非重叠区间。
#-d:在输出中包含最近区间的距离。

2.显著位点附近区域进行LD block 计算及热图绘图

http://www.xdnf.cn/news/33319.html

相关文章:

  • TCP 总是禁用分片(IP_DF,Don‘t Fragment)吗?
  • 基于尚硅谷FreeRTOS视频笔记——9—上下文切换的时机与空闲任务
  • 第10期:Classifier-Free Guidance(CFG)——扩散模型的文本引导增强术
  • pycharm中怎么解决系统cuda版本高于pytorch可以支持的版本的问题?
  • Python 一等函数( 把函数视作对象)
  • 指针----------C语言经典题目(2)
  • 【Docker项目实战】使用Docker部署NotepadMX笔记本工具
  • Feign:调用方与被调用方集成的对比及Feign继承的应用
  • C语言内存管理
  • 6. 话题通信 ---- 使用自定义msg,发布方和订阅方cpp,python文件编写
  • 发动机悬置橡胶弹性体试验机
  • Dify快速入门之chatflow
  • 常见设计模式
  • 【对Linux文件权限的深入理解】
  • 针对MCP认证考试中的常见技术难题进行实战分析与解决方案分享
  • 清华《数据挖掘算法与应用》K-means聚类算法
  • 考研408操作系统文件管理——4.2目录系统详解
  • Java PrintStream 类深度解析
  • QT聊天项目DAY06
  • 什么是事件循环
  • 2025年渗透测试面试题总结-拷打题库05(题目+回答)
  • 大学第一次笔记本清灰
  • Zephyr、FreeRTOS、RT-Thread 邮箱(Mailbox)对比分析
  • 【信息系统项目管理师】高分论文:论信息系统项目的采购管理(“营业工单系统”项目)
  • MySql Innodb详细解读
  • 【预告】【k8s系列6】RKE搭建Kubernetes集群
  • Codeforces Educational Round 177 Div. 2 【B题,C待补
  • Elasticsearch:使用 ES|QL 进行搜索和过滤
  • 嵌入式linux系统中内存管理的方法与实现
  • EKF公式推导