如何使用UPORA对峰进行注释

介绍

本篇内容主要讲解”如何使用UPORA对峰进行注释”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习”如何使用UPORA对峰进行注释”吧!

UROPA是一个命令行工具,可以对基因组区域进行注释,这里的基因组区域要求是床上格式,比如芯片,ATAC_seq等数据产生的峰值区间。同时需要提供一个GTF格式的基因组注释信息,比如从UCSC,合奏,ncbi等数据库下载的参考基因组文件。在注释结果中不仅给出了峰值在基因组中的定位,还会给出对应的正负链,与基因的距离,对应的基因类型等较为全面的注释信息。官方文档网址如下

https://uropa-manual.readthedocs.io/introduction。html

该软件根据峰值的中心与基因的相对位置,将峰值的基因组定位划分为以下几种类型,示意如下

如何使用UPORA对峰进行注释“> </p> <p>提供了多种安装方式,这里我采用的是直接拉取官方的码头工人镜像,用法如下</p> <pre> docker  pull  loosolab/uropa </pre> <p>该软件需要三个输入文件:<br/> </p> <ol类= <李>

GTF格式的注释文件

<李>

床上格式的峰值文件

<李>

JSON格式的配置文件


用法也比较简便,我使用官方的是测试数据,步骤如下

1。下载GTF格式的基因组注释文件
 <代码> wget ftp://ftp.ensembl.org/pub/release-75/gtf/homo_sapiens/Homo_sapiens.GRCh47.75.gtf.gz 
gunzip Homo_sapiens.GRCh47.75.gtf.gz
2。床下载格式的峰值区间文件
 <代码> wget https://www.encodeproject.org/files/ENCFF966LMJ/@@download ENCFF966LMJ.bed.gz 
gunzip ENCFF966LMJ.bed.gz
3。,准备JSON格式的配置文件

配置文件内容如下

 <代码> {
“queries": [
,,,,{“feature":“gene",“distance": 5000年,“feature.anchor":“时,“show.attributes":“gene_name"},
,,,,{“feature":“gene",“distance": 5000年,“feature.anchor":“center"}],
“priority":“False"
“gtf":“/home/软/uropa/Homo_sapiens.GRCh47.75.gtf"
“bed":“/home/软/研究/uropa/ENCFF966LMJ.bed"
}

配置文件命名为配置。json,代码如下

 <代码>码头工人运行\ 
- rm \
- v/:/home \
loosolab/uropa \
uropa \
-我/home/soft/uropa/config.json
\ - p/home/soft/uropa/uropa

<代码> - 参数指定配置文件的路径,<代码> p>

 <代码>├──uropa_allhits。txt 
├──uropa_besthits。txt
└──uropa_finalhits。txt

这三个文件内容相同,只是行数不同,内容示意如下

如何使用UPORA对峰进行注释“> </p> <p>软件会自动给每一个峰一个id,可以直观的看到峰值与基因之间的关系,更多用法和细节请参考官方文档。</p> <p class=到此,相信大家对“如何使用UPORA对峰进行注释”有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

如何使用UPORA对峰进行注释