如何使用ggseqlogo可视化主题

介绍

这篇文章主要讲解了“如何使用ggseqlogo可视化主题”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习”如何使用ggseqlogo可视化主题”吧!

ggseqlogo是一个主题可视化的R包,可以看做是seqLogo的加强版。除了基本的创建sequence 标志的功能,新增了许多自定义的选项,灵活性更强,项目网址如下

https://omarwagih.github。io/ggseqlogo/

接受两种格式的主题信息,第一种为序列数据,以下图为例

如何使用ggseqlogo可视化主题

在R中的表示方式如下

 <代码> motif_seq & lt; - c (
“CCCATTGTTCTC",
“TTTCTGGTTCTC",
“TCAATTGTTTAG",
“CTCATTGTTGTC",
“TCCATTGTTCTC",
“CCTATTGTTCTC",
“TCCATTGTTCGT",
“CCAATTGTTTTG"
)

第二种为主题的烤瓷矩阵,以下图为例

如何使用ggseqlogo可视化主题

在R中的表示方式如下

 <代码> motif_pfm & lt;——rbind (
c (0, 0, 2 7 0, 0, 0, 0, 0, 0, 1, 0),
c (4, 6, 4, 1, 0, 0, 0, 0, 0 5 0 5),
c (0, 0, 0, 0, 0, 1, 8, 0, 0, 1, 1, 2),
c(4 2 2 0 8 7 0 8 8, 2, 6日1)
)
rownames (motif_pfm) & lt; - c (“A",“C",“G",“T")

准备好任意一种符合格式的输入文件之后,就可以进行可视化了。对于序列格式的信息,绘图方式如下

 ggseqlogo (motif_seq) 

输出结果如下

如何使用ggseqlogo可视化主题

对于烤瓷矩阵,绘图方式如下

 ggseqlogo (motif_pfm) 

输出结果如下

如何使用ggseqlogo可视化主题

以上只是ggseqlogo的基本用法,除此之外,还有以下几种额外功能

1。调整配色方案

和webLogo类似,针对核酸和蛋白序列,内置了多种配色方案。对于DNA和RNA序列,支持以下两种配色防范

<李>

核苷酸

<李>

base_pairing


对于蛋白质序列,支持以下几种配色方案

<李>化学

<李>

疏水性

<李>

clustalx

<李>泰勒


默认情况下会自动根据输入的序列类型自动匹配配色方案,可以通过<代码> col_scheme 强制指定,用法如下

 ggseqlogo (motif_pfm, col_scheme=& # 39; base_pairing& # 39;) 

输出结果示意如下

如何使用ggseqlogo可视化主题

还支持自定义配色方案,具体细节请参考官方文档。

2。绘制多个序列标识

当有多个主题信息时,支持一键绘制多个主题的序列标识,用法如下

 <代码> motif_list & lt; -列表(
“A"=motif_pfm
“B"=motif_pfm
“C"=motif_pfm
“D"=motif_pfm)
ggseqlogo (motif_list ncol=2)

将多个主题信息存储在<代码> 中,直接操作这个列表对象即可,输出结果如下

如何使用ggseqlogo可视化主题

除了这些功能外,还提供了自定义字符集,字符高度,字体等各种功能,更多用法与细节请参阅帮助文档。

感谢各位的阅读,以上就是“如何使用ggseqlogo可视化主题”的内容了,经过本文的学习后,相信大家对如何使用ggseqlogo可视化主题这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!

如何使用ggseqlogo可视化主题