Memcached内存数据库群集

  

Memcached概述

  
  

一套开源的高性能分布式内存对象缓存系统
所有的数据都存储在内存中
支持任意存储类型的数据
提高网址访问的速度

     

Memcached缓存机制

  
 <代码>当程序写入缓存数据请求时,Memcached的API接口将关键输入路由算法模块路由到集群中的一台服务,之后由API接口与服务器进行通信,完成一次分布式缓存写入
  关键索引建立在API中,值值数据存在后面的memcached中 
  

Memcached分布式

  
  

要依赖于Memcached的客户端来实现
多个Memcached服务器是独立的
分布式数据如何存储是路由算法所决定

     

Memcached路由算法

  
 <代码>求余数哈希算法
  先用关键做散列运算的到一个整数,再去做哈希算法,根据余数进行路由。不适合在动态变化的环境中
  一致性哈希算法
  按照哈希算法把对应主要通过一定哈希算法处理后映射形成一个首尾接闭合循环,然后通过使用与对象存储一样的哈希算法将机器也映射到环中,顺时针方向计算将所有对象存储到离自己最近的机器中,适合在动态变化中使用 
  
  

Memcached是danga.com(运营LiveJournal的技术团队)开发的一套分布式内存对象缓存系统,用于在动态系统中减少数据库负载,提升性能。关于这个东西,相信很多人都用过,本文意在通过对Memcached的实现及代码分析,获得对这个出色的开源软件更深入的了解,并可以根据我们的需要对其进行更进一步的优化。末了将通过对BSM_Memcache扩展的分析,加深对Memcached的使用方式理解。

     

Memcached是什么

  
 <代码>在阐述这个问题之前,我们首先要清楚它“不是什么”。很多人把它当作和SharedMemory那种形式的存储载体来使用,虽然memcached使用了同样的“关键=祝辞;价值”方式组织数据,但是它和共享内存、APC等本地缓存有非常大的区别.Memcached是分布式的,也就是说它不是本地的。它基于网络连接(当然它也可以使用localhost)方式完成服务,本身它是一个独立于应用的程序或守护进程(守护进程方式)。
  
  Memcached使用libevent库实现网络连接服务,理论上可以处理无限多的连接,但是它和Apache不同,它更多的时候是面向稳定的持续连接的,所以它实际的并发能力是有限制的。在保守情况下Memcached的最大同时连接数为200,这和Linux线程能力有关系,这个数值是可以调整的。关于libevent可以参考相关文档。Memcached内存使用方式也和APC不同.APC是基于共享内存和MMAP的,memcachd有自己的内存分配算法和管理方式,它和共享内存没有关系,也没有共享内存的限制,通常情况下,每个Memcached进程可以管理2 gb的内存空间,如果需要更多的空间,可以增加进程数。 
  

Memcached适合什么场合

  
  

在很多时候,memcached都被滥用了,这当然少不了对它的抱怨。我经常在论坛上看见有人发的贴,类似于“如何提高效率”,回复是“用memcached”,至于怎么用,用在哪里,用来干什么一句没有.memcached不是万能的,它也不是适用在所有场合。

  

Memcached是“分布式”的内存对象缓存系统,那么就是说,那些不需要“分布”的,不需要共享的,或者干脆规模小到只有一台服务器的应用,Memcached不会带来任何好处,相反还会拖慢系统效率,因为网络连接同样需要资源,即使是UNIX本地连接也一样。在我之前的测试数据中显示,Memcached本地读写速度要比直接PHP内存数组慢几十倍,而APC,共享内存方式都和直接数组差不多。可见,如果只是本地级缓存,使用Memcached是非常不划算的。

  

Memcached在很多时候都是作为数据库前端缓存使用的。因为它比数据库少了很多SQL解析,磁盘操作等开销,而且它是使用内存来管理数据的,所以它可以提供比直接读取数据库更好的性能,在大型系统中,访问同样的数据是很频繁的,Memcached可以大大降低数据库压力,使系统执行效率提升。另外,Memcached也经常作为服务器之间数据共享的存储媒介,例如在SSO系统中保存系统单点登陆状态的数据就可以保存在Memcached中,被多个应用共享。

  

需要注意的是,memcached使用内存管理数据,所以它是易失的,当服务器重启,或者memcached进程中止,数据便会丢失,所以memcached不能用来持久保存数据。很多人的错误理解,memcached的性能非常好,好到了内存和硬盘的对比程度,其实memcached使用内存并不会得到成百上千的读写速度提高,它的实际瓶颈在于网络连接,它和使用磁盘的数据库系统相比,好处在于它本身非常“轻”,因为没有过多的开销和直接的读写方式,它可以轻松应付非常大的数据交换量,所以经常会出现两条千兆网络带宽都满负荷了,memcached进程本身并不占用多少CPU资源的情况。

Memcached内存数据库群集