这篇文章主要讲解了“如何使用ggseqlogo可视化主题”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习”如何使用ggseqlogo可视化主题”吧!
ggseqlogo是一个主题可视化的R包,可以看做是seqLogo的加强版。除了基本的创建sequence 标志的功能,新增了许多自定义的选项,灵活性更强,项目网址如下
https://omarwagih.github。io/ggseqlogo/
引用>接受两种格式的主题信息,第一种为序列数据,以下图为例
在R中的表示方式如下
<代码> motif_seq & lt; - c (
“CCCATTGTTCTC",
“TTTCTGGTTCTC",
“TCAATTGTTTAG",
“CTCATTGTTGTC",
“TCCATTGTTCTC",
“CCTATTGTTCTC",
“TCCATTGTTCGT",
“CCAATTGTTTTG"
) 代码>第二种为主题的烤瓷矩阵,以下图为例
在R中的表示方式如下
<代码> motif_pfm & lt;——rbind (
c (0, 0, 2 7 0, 0, 0, 0, 0, 0, 1, 0),
c (4, 6, 4, 1, 0, 0, 0, 0, 0 5 0 5),
c (0, 0, 0, 0, 0, 1, 8, 0, 0, 1, 1, 2),
c(4 2 2 0 8 7 0 8 8, 2, 6日1)
)
rownames (motif_pfm) & lt; - c (“A",“C",“G",“T") 代码>准备好任意一种符合格式的输入文件之后,就可以进行可视化了。对于序列格式的信息,绘图方式如下
ggseqlogo (motif_seq)输出结果如下
对于烤瓷矩阵,绘图方式如下
ggseqlogo (motif_pfm)输出结果如下
以上只是ggseqlogo的基本用法,除此之外,还有以下几种额外功能
1。调整配色方案
和webLogo类似,针对核酸和蛋白序列,内置了多种配色方案。对于DNA和RNA序列,支持以下两种配色防范
<李>
核苷酸
李> <李>base_pairing
李>
对于蛋白质序列,支持以下几种配色方案
<李>化学
李> <李>
疏水性
李> <李>clustalx
李> <李>泰勒
李>
默认情况下会自动根据输入的序列类型自动匹配配色方案,可以通过<代码> col_scheme 代码>强制指定,用法如下
ggseqlogo (motif_pfm, col_scheme=& # 39; base_pairing& # 39;)输出结果示意如下
还支持自定义配色方案,具体细节请参考官方文档。
2。绘制多个序列标识
当有多个主题信息时,支持一键绘制多个主题的序列标识,用法如下
<代码> motif_list & lt; -列表(
“A"=motif_pfm
“B"=motif_pfm
“C"=motif_pfm
“D"=motif_pfm)
ggseqlogo (motif_list ncol=2) 代码>将多个主题信息存储在<代码> 代码>中,直接操作这个列表对象即可,输出结果如下
除了这些功能外,还提供了自定义字符集,字符高度,字体等各种功能,更多用法与细节请参阅帮助文档。
感谢各位的阅读,以上就是“如何使用ggseqlogo可视化主题”的内容了,经过本文的学习后,相信大家对如何使用ggseqlogo可视化主题这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!
如何使用ggseqlogo可视化主题