复述过期策略及实现原理

  

我们在使用复述时,一般会设置一个过期时间,当然也有不设置过期时间的,也就是永久不过期。

  

当我们设置了过期时间,复述是如何判断是否过期,以及根据什么策略来进行删除的。

  

复述,设置过期时间:
键到期时间(以秒为单位)——这是最常用的方式
setex(字符串键,int秒,字符串值),字符串独有的方式
注:

  

除了字符串自己独有设置过期时间的方法外,其他方法都需要依靠到期方法来设置时间

  

如果没有设置时间,那缓存就是永不过期

  

如果设置了过期时间,之后又想让缓存永不过期,使用坚持关键

  

三种过期策略:
定时删除
含义:在设置关键的过期时间的同时,为该关键创建一个定时器,让定时器在关键的过期时间来临时,对关键进行删除

  

优点:保证内存被尽快释放

  

缺点:
若过期关键很多,删除这些关键会占用很多的CPU时间,在CPU时间紧张的情况下,CPU不能把所有的时间用来做要紧的事儿,还需要去花时间删除这些关键
定时器的创建耗时,若为每一个设置过期时间的键创建一个定时器(将会有大量的定时器产生),性能影响严重
懒汉式式删除
含义:关键过期的时候不删除,每次通过关键获取值的时候去检查是否过期,若过期,则删除,返回零。

  

优点:删除操作只发生在通过关键取值的时候发生,而且只删除当前关键,所以对CPU时间的占用是比较少的,而且此时的删除是已经到了非做不可的地步(如果此时还不删除的话,我们就会获取到了已经过期的键了)

  

缺点:若大量的关键在超出超时时间后,很久一段时间内,都没有被获取过,那么可能发生内存泄露(无用的垃圾占用了大量的内存)

  

定期删除
含义:每隔一段时间执行一次删除过期关键操作

  

优点:
通过限制删除操作的时长和频率,来减少删除操作时对CPU间的占用——处理”定时删除”的缺点
定期删除过期关键——处理“懒汉式删除”的缺点
缺点:
在内存友好方面,不如“定时删除”(会造成一定的内存占用,但是没有懒汉式那么占用内存)在CPU时间友好方面,不如“懒汉式删除”(会定期的去进行比较和删除操作,CPU方面不如懒汉式,但是比定时好)

  

难点:合理设置删除操作的执行时长(每次删除执行多长时间)和执行频率(每隔多长时间做一次删除)(这个要根据服务器运行情况来定了),每次执行时间太长,或者执行频率太高对cpu都是一种压力。

  

每次进行定期删除操作执行之后,需要记录遍历循环到了哪个标志位,以便下一次定期时间来时,从上次位置开始进行循环遍历

  

说明:memcached只是用了惰性删除,而复述,同时使用了惰性删除与定期删除,这也是二者的一个不同点(可以看做是复述,优于memcached的一点),

  

对于懒汉式删除而言,并不是只有获取关键的时候才会检查关键是否过期,在某些设置关键的方法上也会检查(如。setnx key2 value2:该方法类似于memcached的添加方法,如果设置的key2已经存在,那么该方法返回假,什么都不做,如果设置的key2不存在,那么该方法设置缓存key2-value2。假设调用此方法的时候,发现复述中已经存在了key2,但是该key2已经过期了,如果此时不执行删除操作的话,setnx方法将会直接返回假,也就是说此时并没有重新设置key2-value2成功,所以对于一定要在setnx执行之前,对key2进行过期检查)。

  

复述,采用的过期策略
懒汉式删除+定期删除
懒汉式删除流程:
在进行得到或setnx等操作时,先检查关键是否过期;
若过期,删除键,然后执行相应操作,
若没过期,直接执行相应操作,
定期删除流程(简单而言,对指定个数个库的每一个库随机删除小于等于指定个数个过期键):
遍历每个数据库(就是redis.conf中配置的“数据库”数量,默认为16)
检查当前库中的指定个数个关键(默认是每个库检查20个关键,注意相当于该循环执行20次,循环体是下边的描述)
如果当前库中没有一个关键设置了过期时间,直接执行下一个库的遍历
随机获取一个设置了过期时间的钥匙,检查该关键是否过期,如果过期,删除关键
判断定期删除操作是否已经达到指定时长,若已经达到,直接退出定期删除。
对于定期删除,在程序中有一个全局变量current_db来记录下一个将要遍历的库,假设有16个库,我们这一次定期删除遍历了十个,那此时的current_db就是11日,下一次定期删除就从第11个库开始遍历,假设current_db等于15了,那么之后遍历就再从0号库开始(此时current_db==0)

复述过期策略及实现原理