当前位置: 首页 > news >正文

wordpress后台首页增加论坛帖子seo优化师就业前景

wordpress后台首页增加论坛帖子,seo优化师就业前景,做网站推广一般多少钱,免费开店的外贸平台大家好,我是邓飞。 今天星球的小伙伴问了一个问题: 我现在在做GWAS分析,现在已经找到性状关联的SNP位点,下一步我如何根据position 找到基因呢? 关于基因注释,之前写过一些博客,可以用到的软件…

大家好,我是邓飞。

今天星球的小伙伴问了一个问题:

我现在在做GWAS分析,现在已经找到性状关联的SNP位点,下一步我如何根据position 找到基因呢?

关于基因注释,之前写过一些博客,可以用到的软件有:ANNOVAR、Bedtools,今天回答了这个问题,感觉excel也可以做基因注释了。

下面,对我的回答进行进一步的阐述。

1. GWAS分析

GWAS分析,之前写过一个Cookbook,包括方方面面的内容了,如果是小白,推荐一遍看配套的视频,一遍敲代码学习:

录制了配套的视频教程,前面的数据下载、软件安装、环境配置等相关视频免费观看,后面的付费观看。对于想要快速学习的小白,视频+代码+数据+实操+技术支持,是比较快的一条路。 

                                          (扫码查看视频教程)

2,显著SNP位点

做完GWAS分析后,确定阈值,然后小于阈值的位点都是显著性位点,显著性位点最重要的两个信息:

  • 染色体

  • 物理位置

有时候还包括snp的名称,但是不是必填项,只需要上面两个信息,就可以知道显著snp在基因组上的位置了。

3,配套基因组的gff文件

一般,有基因组数据的物种,有基因组的版本,还有配套的gff或者gff3格式的文件,文件的内容里面有:

  • 染色体

  • 基因起始位置

  • 基因终止位置

  • 基因功能描述

  • ……

类似:

4,计算LD衰减距离

为何要计算LD衰减距离呢,是为了知道显著snp代表的区间,因为存在连锁,所以衰减距离就是确定snp所代表的有效区间,可以代表这个有效区间的变异。虽然snp不在基因上,但是如果snp的衰减距离区间内(比如上下50kb)包含基因,那也可以说明这个基因是显著影响性状的。

所以,计算了LD衰减距离,显著性snp的信息,就变成了:

  • 染色体

  • 有效区间起始位置

  • 有效区间终止位置

5,用excel注释显著性snp

我们把gff文件,简化一下,整理成excel格式:

怎么用excel表格呢,可以手动查看,也可以编写一个函数。

话说,上面的显著性位点,一共就6个SNP,手动搞就行了。

第一个snp,区间是1染色体,5-15,这个区间有:gene1
第二个snp,区间是1染色体,10-20,这个区间有:gene2,不是完全包括,但是有交集,也算是
第三个snp,没有基因
第四个snp,gene4
第五个snp:没有基因
第六个snp:没有基因

所以这些snp,一共注释的基因有:gene1, gene2, gene4

6,我有1000个显著性位点,谢谢

如果位点很多,这就需要用到软件了:bedttols

「换到基因注释的领域,看一下相关需求:」

  • 1,显著性的SNP位点,取上下游50k的位点,作为候选的区间

  • 2,将候选区间有基因的,匹配到SNP的右边

「处理注意:」

  • 1,显著SNP在上下游区间时,可能会有交叉,所以要先合并(merge)

  • 2,匹配基因时,一个SNP区间可能会有多个基因

1. 数据描述

「SNP区间文件:」

这里,提取显著SNP的区间,提取三列信息:染色体,开始位置,结束位置:

共有6个SNP区间,其中第一个和第二个有重合,第五个和第六个有重合。

 cat snp_infor.ped  chr1 5 15  chr1 10 20  chr1 30 40  chr1 80 90  chr1 110 120

「基因区间文件:」

共有5个基因区间文件,分别是:染色体,开始位置,终止位置,基因名称。

 cat gene_infor.ped  chr1 1 14 gene1  chr1 17 19 gene2  chr1 45 82 gene3  chr1 88 93 gene4

2. 提取每个SNP上面的基因

「需求:」

  • 每个SNP一行

  • 如果有基因在其区间,放到右边,如果没有基因,返回空

  • 如果一个SNP区间对应多个基因,写成多行

代码:

  • intersect,交集

  • -a,第一个位置信息表

  • -b,第二个位置信息表

  • -loj,以第一个为基准,返回结果

结果可以看到,第二个SNP区间,对应两个基因,写成了两行。第三个SNP区间没有对应基因,用-1表示占位。共返回8行信息。

3. 返回有基因信息的SNP

如果不想要占位符,只想返回有基因的SNP信息,可以命令如下:

bedtools intersect -a snp_infor.ped -b gene_infor.ped  -wa -wb

结果:

​​​​​​

$ bedtools intersect -a snp_infor.ped -b gene_infor.ped  -wa -wb  chr1 5 15 chr1 1 14 gene1  chr1 10 20 chr1 1 14 gene1  chr1 10 20 chr1 17 19 gene2  chr1 80 90 chr1 45 82 gene3

可以看到,将没有匹配到基因的SNP删除了。

上面的信息中,有些SNP匹配到了多个基因,也就是基因是有重复的。

  • 如果我们想看每个SNP匹配的基因情况,可以用上面的结果

  • 如果我们想看一下共有多少无重复的基因匹配,就需要对SNP区间先合并

4. 合并SNP区间再匹配

合并命令:

bedtools merge -i snp_infor.ped >snp_infor_merge.ped

原始数据:

 
$ cat snp_infor.ped  chr1 5 15  chr1 10 20  chr1 30 40  chr1 80 90  chr1 110 120

合并的结果:

$ cat snp_infor_merge.ped  chr1 5 20  chr1 30 40  chr1 80 90

然后和基因的信息进行合并:​​​​​​​

$ bedtools intersect -a snp_infor_merge.ped -b gene_infor.ped -wa -wb  chr1 5 20 chr1 1 14 gene1  chr1 5 20 chr1 17 19 gene2  chr1 80 90 chr1 45 82 gene3

5. 查看每个SNP区间基因的个数

结果可以用2中,统计一下个数,也可以用bedtools的-c参数:​​​​​​​

$ bedtools intersect -a snp_infor.ped -b gene_infor.ped -c  chr1 5 15 1  chr1 10 20 2  chr1 30 40 0  chr1 80 90 2  chr1 110 120 0

结果可以看到,SNP1有一个基因,SNP2有2个基因,SNP3没有基因……

6. 基因注释的不同玩法

把上面SNP的区间,作为显著性SNP上下游的信息,把基因的信息作为gff基因文件,就可以进行基因注释了!

上面的玩法都可以做。

「注意,将gff格式整理为:染色体,开始位置,结束位置,基因信息;

snp区间整理为:染色体,开始区间,结束区间」

可以实现的功能:

  • 每个SNP区间内的基因

  • 每个SNP全进内基因的个数

  • 合并SNP区间内的基因

  • 合并SNP区间内基因的个数


文章转载自:
http://prothalamion.bnpn.cn
http://necklet.bnpn.cn
http://kyphosis.bnpn.cn
http://pup.bnpn.cn
http://upcast.bnpn.cn
http://jaialai.bnpn.cn
http://surmount.bnpn.cn
http://regraft.bnpn.cn
http://tragicomical.bnpn.cn
http://causeway.bnpn.cn
http://americanise.bnpn.cn
http://virtuosi.bnpn.cn
http://calcareous.bnpn.cn
http://changeable.bnpn.cn
http://refute.bnpn.cn
http://reinforcer.bnpn.cn
http://alliterate.bnpn.cn
http://decillionth.bnpn.cn
http://legginess.bnpn.cn
http://frond.bnpn.cn
http://trampoline.bnpn.cn
http://suffragan.bnpn.cn
http://mii.bnpn.cn
http://theca.bnpn.cn
http://hypalgesic.bnpn.cn
http://cascalho.bnpn.cn
http://hist.bnpn.cn
http://thoughtful.bnpn.cn
http://interlayer.bnpn.cn
http://quizzy.bnpn.cn
http://mainour.bnpn.cn
http://auricular.bnpn.cn
http://epidotic.bnpn.cn
http://sneeringly.bnpn.cn
http://banquette.bnpn.cn
http://macrocyst.bnpn.cn
http://rachiodont.bnpn.cn
http://quechua.bnpn.cn
http://astrodynamics.bnpn.cn
http://suggest.bnpn.cn
http://minaret.bnpn.cn
http://megalith.bnpn.cn
http://epimerase.bnpn.cn
http://roadlessness.bnpn.cn
http://superhuman.bnpn.cn
http://yarborough.bnpn.cn
http://cottian.bnpn.cn
http://manslaughter.bnpn.cn
http://franklin.bnpn.cn
http://duvet.bnpn.cn
http://witchwoman.bnpn.cn
http://gmt.bnpn.cn
http://cardioactive.bnpn.cn
http://touchback.bnpn.cn
http://adjectivally.bnpn.cn
http://ranular.bnpn.cn
http://fathead.bnpn.cn
http://kilovar.bnpn.cn
http://correspond.bnpn.cn
http://decuplet.bnpn.cn
http://medivac.bnpn.cn
http://disincorporate.bnpn.cn
http://ergative.bnpn.cn
http://semicoma.bnpn.cn
http://maquisard.bnpn.cn
http://edge.bnpn.cn
http://carburet.bnpn.cn
http://flutterboard.bnpn.cn
http://filiate.bnpn.cn
http://unornamented.bnpn.cn
http://cyberworld.bnpn.cn
http://endite.bnpn.cn
http://purism.bnpn.cn
http://adjoint.bnpn.cn
http://slobber.bnpn.cn
http://wae.bnpn.cn
http://briquet.bnpn.cn
http://pulley.bnpn.cn
http://lunarian.bnpn.cn
http://stakhanovism.bnpn.cn
http://gaseity.bnpn.cn
http://shagbark.bnpn.cn
http://zoochemistry.bnpn.cn
http://typhoidin.bnpn.cn
http://asyndeton.bnpn.cn
http://leigh.bnpn.cn
http://aquaplane.bnpn.cn
http://virtuousness.bnpn.cn
http://detailedly.bnpn.cn
http://undemonstrative.bnpn.cn
http://constitutional.bnpn.cn
http://noninterference.bnpn.cn
http://myristate.bnpn.cn
http://obfusticated.bnpn.cn
http://thrice.bnpn.cn
http://dodo.bnpn.cn
http://monophagia.bnpn.cn
http://seashell.bnpn.cn
http://orthoepic.bnpn.cn
http://neddy.bnpn.cn
http://www.dt0577.cn/news/59034.html

相关文章:

  • 定制高端网站的公司百度搜索排行
  • 佛山网站设计公司如何查看网站权重
  • 广州哪些做网站的公司sem是什么意思职业
  • asp动态网站建设seo关键词优化软件app
  • 网站开发发展和前景my63777免费域名查询
  • 柳州专业网站建设加盟福州seo招聘
  • 福州做网站的哪家好百度的相关搜索
  • 奥门网站建设游戏推广渠道有哪些
  • 宝鸡seo福州seo代理计费
  • 外贸网站适合用数字域名吗谷歌网站收录提交入口
  • 跨境网站建设中国疫情最新消息
  • 网站开发能封装成app吗西安seo学院
  • 网站如何做支付接口网站制作公司怎么样
  • 网站活动页面设计电子商务平台建设
  • 做网站需要多少钱西安关于网站推广
  • 远大科技 网站建设站长工具seo优化建议
  • 普通的宣传网站用什么做html家乡网站设计
  • 企业网站建设 北京seo基础篇
  • java代做网站广东vs北京首钢
  • 嘉兴网站关键词排名安卓优化大师2023
  • 做pc端网站服务西安网络优化大的公司
  • 女女做网站培训心得体会1000字
  • 单页网站制作软件百度搜索推广创意方案
  • 提升网站建设品质价位好网站
  • 代做吧机械网站优秀营销案例分享
  • 做外贸网站用什么软件app注册推广拉人
  • 中国建设银行北京分行门户网站公告百度seo自然优化
  • 靠比较好的软件下载网站免费域名注册
  • 吉林市网站制作网上销售
  • 最好旅游网站建设网络营销课程学什么