介绍
本篇内容主要讲解”如何使用UPORA对峰进行注释”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习”如何使用UPORA对峰进行注释”吧!
UROPA是一个命令行工具,可以对基因组区域进行注释,这里的基因组区域要求是床上格式,比如芯片,ATAC_seq等数据产生的峰值区间。同时需要提供一个GTF格式的基因组注释信息,比如从UCSC,合奏,ncbi等数据库下载的参考基因组文件。在注释结果中不仅给出了峰值在基因组中的定位,还会给出对应的正负链,与基因的距离,对应的基因类型等较为全面的注释信息。官方文档网址如下
https://uropa-manual.readthedocs.io/introduction。html
引用>该软件根据峰值的中心与基因的相对位置,将峰值的基因组定位划分为以下几种类型,示意如下
<李>
GTF格式的注释文件
李> <李>床上格式的峰值文件
李> <李>JSON格式的配置文件
李>
用法也比较简便,我使用官方的是测试数据,步骤如下
1。下载GTF格式的基因组注释文件
<代码> wget ftp://ftp.ensembl.org/pub/release-75/gtf/homo_sapiens/Homo_sapiens.GRCh47.75.gtf.gz
gunzip Homo_sapiens.GRCh47.75.gtf.gz 代码>2。床下载格式的峰值区间文件
<代码> wget https://www.encodeproject.org/files/ENCFF966LMJ/@@download ENCFF966LMJ.bed.gz
gunzip ENCFF966LMJ.bed.gz 代码>3。,准备JSON格式的配置文件
配置文件内容如下
<代码> {
“queries": [
,,,,{“feature":“gene",“distance": 5000年,“feature.anchor":“时,“show.attributes":“gene_name"},
,,,,{“feature":“gene",“distance": 5000年,“feature.anchor":“center"}],
“priority":“False"
“gtf":“/home/软/uropa/Homo_sapiens.GRCh47.75.gtf"
“bed":“/home/软/研究/uropa/ENCFF966LMJ.bed"
} 代码>配置文件命名为配置。json,代码如下
<代码>码头工人运行\
- rm \
- v/:/home \
loosolab/uropa \
uropa \
-我/home/soft/uropa/config.json
\ - p/home/soft/uropa/uropa 代码><代码> - 代码>参数指定配置文件的路径,<代码> p> 代码指定输出文件的前缀。输出文件如下
<代码>├──uropa_allhits。txt
├──uropa_besthits。txt
└──uropa_finalhits。txt 代码>这三个文件内容相同,只是行数不同,内容示意如下
到此,相信大家对“如何使用UPORA对峰进行注释”有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
如何使用UPORA对峰进行注释