一文探究 Redis 高性能的秘密

Redis 是一种基于键值对 (Key-Value) 的 NoSQL 数据库，Redis 的 Value 可以由 String，hash，list，set，zset，Bitmaps，HyperLogLog 等多种数据结构和算法组成。Redis 还提供了键过期，发布订阅，事务，Lua脚本，哨兵，Cluster 等功能。Redis 执行命令的速度非常快，根据官方给的性能可以达到 10w+ QPS。那么本文主要介绍到底 Redis 快在哪里，主要有以下几点：

开发语言

现在我们都用高级语言来编程，比如 Java、Python 等。也许你会觉得 C 语言很古老，但是它真的很有用，毕竟 Unix 系统就是用 C 实现的。所以 C 语言是非常贴近操作系统的语言。Redis 就是用 C 语言开发的，所以执行会比较快。

另外多说一句，大学生们好好学 C，会让你更好的理解计算机操作系统。别觉得学了高级语言就可以不用关注底层，欠的债总归要还的。此处推荐一本比较难啃的书《深入理解计算系统》。

纯内存访问

Redis 将所有数据放在内存中，非数据同步正常工作中，是不需要从磁盘读取数据的，0 次 IO。内存响应时间大约为 100 纳秒，这是 Redis 速度快的重要基础。先看看 CPU 的速度：

拿我的电脑来说，主频是 3.1G，也就是说每秒可以执行 3.1*10^9 个指令。所以说 CPU 看世界是非常非常慢的，内存比它慢百倍，磁盘比他慢百万倍，你说快不快？

借了一张《深入理解计算机系统》的图，展示了一个典型的存储器层次结构，在 L0 层，CPU 可以在一个时钟周期访问到，基于 SRAM 的高速缓存存续期，可以在几个 CPU 时钟周期访问到，然后是基于 DRAM 的主存，可以在几十到几百个时钟周期访问到他们。

单线程

单线程简化算法的实现，并发的数据结构实现不但困难且测试也麻烦。
单线程避免了线程切换以及加锁释放锁带来的消耗，对于服务端开发来说，锁和线程切换通常是性能杀手。当然了，单线程也会有它的缺点，也是 Redis 的噩梦：阻塞。如果执行一个命令过长，那么会造成其他命令的阻塞，对于 Redis 是十分致命的，所以 Redis 是面向快速执行场景的数据库。

除了 Redis 之外，Node.js 也是单线程，Nginx 也是单线程，但他们都是服务器高性能的典范。

非阻塞多路 I/O 复用机制

在这之前先要说一下传统的阻塞 I/O 是如何工作的：当使用 Read 或者 Write 对某一文件描述符（File Descriptor FD）进行读写的时候，如果数据没有收到，那么该线程会被挂起，直到收到数据。阻塞模型虽然易于理解，但是在需要处理多个客户端任务的时候，不会使用阻塞模型。

I/O 多路复用实际上是指多个连接的管理可以在同一进程。多路是指网络连接，复用只是同一个线程。在网络服务中，I/O 多路复用起的作用是一次性把多个连接的事件通知业务代码处理，处理的方式由业务代码来决定。在 I/O 多路复用模型中，最重要的函数调用就是 I/O 多路复用函数，该方法能同时监控多个文件描述符（FD）的读写情况，当其中的某些 FD 可读/写时，该方法就会返回可读/写的 FD 个数。

Redis 使用 epoll 作为 I/O 多路复用技术的实现，再加上 Redis 自身的事件处理模型将 epoll 的 Read、Write、Close 等都转换成事件，不在网络 I/O 上浪费过多的时间。实现对多个 FD 读写的监控，提高性能。

举个形象的例子吧，比如：一个 TCP 服务器处理 20 个客户端 Socket。

A 方案：顺序处理，如果第一个 Socket 因为网卡读数据处理慢了，一阻塞后面都玩蛋去。
B 方案：每个 Socket 请求都创建一个分身子进程来处理，不说每个进程消耗大量系统资源，光是进程切换就够操作系统累的了。
C 方案:（I/O 复用模型，epoll）：将用户 Socket 对应的 FD 注册进 epoll（实际上服务器和操作系统之间传递的不是 Socket 的 FD 而是 fd_set 的数据结构），然后 epoll 只告诉哪些需要读/写的 Socket，需要处理那些活跃的有变化的 Socket FD 就好了。这样，整个过程只在调用 epoll 的时候才会阻塞，收发客户消息是不会阻塞的。

来源：博客园

原文：http://t.cn/AiHoGjPk

题图：来自谷歌图片搜索

版权：本文版权归原作者所有

投稿：欢迎投稿，邮箱: editor@hi-linux.com

开发语言

纯内存访问

单线程

非阻塞多路 I/O 复用机制

FEATURED TAGS

FRIENDS