通过Python实现标签云算法的示例

  介绍

这篇文章主要介绍了通过Python实现标签云算法的示例,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获、下面让小编带着大家一起了解一下。

标签云(标签云)常见于各种博客站点中,标签有利于网站内容分类,还可以用于相关性内容推荐。近日笔者有空把个人的开源博客Django_blog添加了一个新功能,标签云。

<强>实现原理

标签云最终展现出来的效果其实是由两个HTML参数来控制的,分别是:字体大小和颜色,如:

& lt; a  https://www.yisu.com/zixun/href=" http://foofish.net/blog/tag/django " django rel="外部nofollow”>

标签关联的文章越多,表示这个标签被引用的次数越大,字体大小的值也越大,颜色的颜色越深。考虑到体验效果,字体大小不能随着的标签的引用次数的增大而无限增大,否则页面显得非常丑陋。因此会把字体大小控制在某个区间,同颜色也理是在一个区间中。

这里我把字体大小设置在12到33之间数组FONT_SIZES,标签的字体大小属性只能是里面的一个值,颜色是与FONT_SIZES对应的一个数组,12对应# ccc, 15对应# adadad,以此类推。

MIN_FONT_SIZE =,, 12 #,最小尺寸   MAX_FONT_SIZE =,, 33 #,最大尺寸   (MIN_FONT_SIZE FONT_SIZES =,,, 15日,18日,21日,24日,27日,30日,MAX_FONT_SIZE),   COLORS =, (& # 39; # ccc # 39;,,“# adadad",, & # 39; # 8 e8e8e& # 39;,, & # 39; # 6 f6f6f& # 39;,, & # 39; # 4 f4f4f& # 39;,, & # 39; # 303030 & # 39;,, & # 39; # 111 & # 39;,, & # 39; # 000 & # 39;]

现在关键问题就是如何根据标签的引用次数(tag_ref_count)来确定它的字体大小。一旦字体大小了,颜色也随之确定。要想标签的字体大小能够均匀分布在数组FONT_SIZES中,那么要遵循的一个原则就是,随着次数的增加其字体大小的取值也增加,而且引用次数最少的标签使用MIN_FONT_SIZE,引用次数最多的标签使用MAX_FONT_SIZE。

因此有一个公式,MIN_FONT_SIZE + n *=MAX_FONT_SIZE步,一步是步长,n是指引用次数最多的标签减去引用次数最少的标签,表示两者之间总共有多少步一步,根据此根式可以算出每一步的步进值是多少,知道了步长后,就可以计算出任意一个标签的字体大小了,任何一个标签到最小标签的步数是两者之差,因此每一个标签的字体大小为MIN_FONT_SIZE + (tag_ref_count-min_ref_count) *步骤

通过Python实现标签云算法的示例

源代码:

#,编码:utf - 8   时间=__author__  & # 39; liuzhijun& # 39;   class  TagCloud(对象):   MIN_FONT_SIZE =12   MAX_FONT_SIZE =33   (MIN_FONT_SIZE FONT_SIZES =,,, 15日,18日,21日,24日,27日,30日,MAX_FONT_SIZE]   COLORS =, (& # 39; # ccc # 39;,,“# adadad",, & # 39; # 8 e8e8e& # 39;,, & # 39; # 6 f6f6f& # 39;,, & # 39; # 4 f4f4f& # 39;,, & # 39; # 303030 & # 39;,, & # 39; # 111 & # 39;,, & # 39; # 000 & # 39;】   def  __init__ (min_ref_count,自我,还以为;max_ref_count):   TagCloud.min_ref_count =min_ref_count   #,如果最大标签和最小标签相等,那么认为两者的步长为0,所有标签取同样的字体大小。   if  max_ref_count ==, min_ref_count:   TagCloud.step =0   其他:   TagCloud.step =, (TagCloud.MAX_FONT_SIZE 作用;TagCloud.MIN_FONT_SIZE),/, (max_ref_count 作用;min_ref_count)   def  get_tag_font_size(自我,,tag_ref_count):   +=font_size  TagCloud.MIN_FONT_SIZE  (tag_ref_count 作用;TagCloud.min_ref_count), * TagCloud.step   #,上面计算出来的font_size并不一定刚好是FONT_SIZES中的某个元素,,可以能某两个元素之间的某个值   #,因此要取最接近FONT_SIZES中某个元素   font_size =, min (TagCloud.FONT_SIZES,关键=lambda  x:, abs (font_size 安康;x))   return  font_size   def  get_tag_color(自我,,tag_ref_count):   return  TagCloud.COLORS [(TagCloud.FONT_SIZES.index (self.get_tag_font_size (tag_ref_count))))

输出结果:

 12日,12日,12日,24日,18日,21日,27日,33岁的

通过Python实现标签云算法的示例