为什么单线程的复述,速度那么快 - 行业资讯 - 肥雀云

　　介绍

这篇文章主要讲解了“为什么单线程的复述,速度那么快”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“为什么单线程的复述,速度那么快”吧!

复述,单机每秒

<李>

为什么这么快

<李>

内存型数据库

<李>

简单的数据结构

<李>

单线程

<李>

输入输出多路复用

复述,单机每秒

。/redis-benchmark -t 集,lpush -n 100000 q 　　组:82101.80,requests per 其次　　LPUSH: 82440.23 requests per second

在自己的电脑上测试SET和LPUSH10万次，可以发现每秒SET和LPUSH大概在8w多，接近官方说的单机10w qps的写。

为什么这么快

内存型数据库

redis完全是基于内存的，绝大部分请求是纯粹的内存操作，所以非常快速。

简单的数据结构

redis目前支持5种数据类型（string、list、hash、set、zset），数据结构相对简单，操作起来也相对快速。

sds数据结构

对于string来说，redis采用SDS方式来组织数据：

为什么单线程的redis速度那么快

这种数据的核心思想就是空间换时间

空间预分配：当空间扩展时，不仅分配所需空间，还会分配额外的空间

分配后sds长度小于1M，那么也分配同样大小的额外空间，假设一个key修改后 len=13，那么也分配free=13，最后buf=13+13+1=27
如果分配后len大于等于1M，那么额外固定分配1M，假设修改后len=30M，分配free=1M，最后buf=30M+1M+1byte

惰性空间释放

假设有个len=13，free=13的字符串，这时候如果字符变短了len=10，那么额外的3个byte的空间也不会回收，先放在free里面，这时候free=16

通过这种分配方式，某些场景下可以减少内存申请的次数，从而达到一定的快速

跳跃表

redis的有序集合，采用的跳跃表的数据结构，通过层来加快访问其他节点

为什么单线程的redis速度那么快

每个节点会随机一个层高，比如o1节点可以通过L4层直接跳到o3,跨度是2，redis的有序集合就是通过这种方式来加快节点之间的访问的。

单线程

redis采用单线程模型，单线程的好处在于避免了多线程对数据竞争的问题，加锁的问题，上下文切换的问题。
据官方解释，redis的瓶颈不在cpu，而在内存或者网络的带宽，综合考虑然后就采用了单线程。这里说的单线程是指处理网络请求时只是用一个线程，redis本身在持久化的时候还是会用到额外的线程的。

redis4.0的多线程

redis4.0开始也支持了多线程，当然只是针对部分命令采用的是多线程，例如：UNLINK、FLUSHALL 、ASYNC、FLUSHDB。引入这些的目的是：在某些情况下，尽可能的提升效率，假设有一个key大到几十M，这时DEL这个key的时候，可能会短暂的阻塞，这时如果用unlink来删除，刚开始只是删除这个key，真正的value是后台线程去删除的。

IO多路复用

redis采用了非阻塞的IO多路复用技术。redis本身就是一个事件驱动程序，redis把socket抽象成文件事件。这里说的IO多路复用就是文件事件处理器以单线程的方式，来监听相关的套接字（accept、read、write、close）。

由于IO多路复用程序是一个单线程，那么当多个socket到来时，肯定要排队，它们总是以队列的方式顺序地处理。

C10K问题

在没有IO多路复用的时候，假设现在有10000个客户端连接（fd1-10000），但是只有1个客户端有发数据，然而计算机并不知道哪个fd有数据，只能遍历10000次，每次都要陷入内核，开销比较大，而且实际上9999次都是浪费的。

IO多路复用

IO多路复用的意思就是多个网路IO即为多个TCP连接复用一个进程或者线程，这种模型最大的好处就是不用为每个连接创建一个进程或者线程。比较经典的模型就是 select、poll、epoll。

select：select(fds)，一次性把fds交给内核，然后内核告诉哪些fd可读可写（内核自己遍历，而不用用户遍历，将多次的系统调用变成1次系统调用）。fds最大是1024，这也决定了select模型最大并发是1024。
为什么单线程的复述,速度那么快