工程师手记-将Memcached内存管理机制移植至Redis

发表于2016 年 4 月 19 日由Zuocheng Liu

Idea 的提出

Redis 有其高效的异步网络框架
Memcached 有其高效的内存管理机制

将这两者结合在一起后，会如何呢？开始试验将Memcached内存管理机制移植至Redis。

本篇博客的姊妹篇链接：《工程师手记-将Redis异步网络框架移植至Memcached》

调研和选型

Redis内存管理的几个缺点：

使用tcmalloc 或者 jmalloc 库，这两个库封装较重，内部特性也较多。
tcmalloc 适合小空间分配，稍大的空间分配会有瓶颈。
Redis 主要是单线程运行（只在后台任务cache持久化功能处又启动了新线程）， tcmalloc 和 jmalloc 有保证线程安全，但对redis来说是不必要的功能。尤其是jmalloc，为线程安全做了很重的设计。

软件选型

并不是把 Memcached 的内存管理直接替换redis的内存分配，而是使用ae-memcached的内存分配方式。
ae-memcached 的内存分配和 Memcached在原理上毫无不同，仅是从软件架构上对其进行重构和优化。具体参考:《AE-Memcached 优化记录》
选择 Redis 2.8.24 作为移植受体

Redis代码修改和编译 / 移植方案

从ae-memcached中拿出mem_cache / slab 两个类，直接移植到Redis src 目录中
新建两个文件 mc_malloc.h mc_malloc.c，封装mem_cache，让其提供类似 malloc、 alloc、realloc、free的接口
修改 zmalloc.c zmalloc.h 这两个文件，让其支持mc_malloc
修改 Makefile ，默认MALLOC 使用 mc_malloc
修改bio.c 文件，把zmalloc 和 zfree用 libc的 malloc 和 free 代替，这么做主要考虑到线程安全
编译、运行

代码托管地址

给新的redis起了一个新名字mc-redis，源代码托管于Github上：

https://github.com/zuocheng-liu/mc-redis

性能测试实验

硬件

Redis-server 服务端 GenuineIntel 6 Common KVM processor 6 核 2.0GHZ 4G 内存
redis-benchmark 和服务端部署在同一台服务器上

测试方法

分别运行原本Redis 和 mc-redis, 分别作为实验和对照，参数为 redis-server –port 7777
启动Redis，运行redis-benchmark 测试三次。重复前面步骤，Redis共重启3次，redis-benchmark共测试9次。
mc-redis 的测试也使用上面方法
测试命令 ./redis-benchmark -h 127.0.0.1 -p 7778 -q -d 100
只观察set / get 命令的并发度

测试结果

启动一次redis，做了三组实验，数据如下：

mc-redis GET 62972.29 / 58275.06 / 55897.15 (requests per second)
redis GET 47281.32 / 62034.74 / 51759.83 (requests per second)
mc-redis SET 64808.82 / 59031.88 / 56915.20 (requests per second)
redis SET 51733.06 / 53676.86 / 56947.61 (requests per second)

结论

在刚启动时（预热阶段），mc-redis 的 set 和 get 操作，比原版redis 的并发处理能力高大约有 15%-20%。但是稳定运行后， mc-redis 和原版redis，性能相差较小。

AE-Memcached 优化记录

发表于2016 年 4 月 8 日由Zuocheng Liu

Contents

1 优化背景和目的
2 性能优化
3 软件架构优化

优化背景和目的

学习Memcached 代码
将 Memcached 的代码成为自己的技术积累
优化Memcache 代码，提高自己系统分析能力

源代码托管于Github上：

https://github.com/zuocheng-liu/ae-memcached

性能优化

网络模型的优化

网络IO多路复用 + 单线程
将 Redis 异步库移植至 Memcached

优化动态申请内存机制

使用预分配，减小系统调用 malloc、realloc、free的次数，主要出现在新建/关闭链接时，会有较多的系统调用

部分小的函数使用宏代替

优化Memcache协议命令的解析

调整各个命令的解析顺序，把get 和 set 命令放到最前面

软件架构优化

软件架构优化，保证关键代码性能不变

使用宏加强代码复用

重构verbose日志
重构网络库
重构slab

命令模式重构 Memcache 协议

创建command_service类，统一管理命令的解析、处理

更深层次的抽象

将 stats 、 settings 、 logger 和全局资源进行抽象

解耦

将各个模块接口化，减少模块间耦合，尤其是 slab item memcached之间的耦合
依赖注入原则，增强各个模块的复用，其中mem_cache模块 settings等可以形成框架。
logger
command service

安全的C/C++网络应用的开发流程

发表于2016 年 1 月 7 日由Zuocheng Liu

本文概要

简要介绍C/C++ 网络应用系统的特点、应用场景，简述适用于C/C++ 网络应用的开发流程。

C/C++ 网络应用系统特点

高性能
高吞吐量
节省内存
开发、测试用时多、开发效率慢
调式成本特别高

C/C++ 网络系统的应用场景

数据接口服务
计算密集型应用，比如搜索引擎、图像处理、统计学习等
特殊领域应用，只能由C/C++ 完成

开发流程的目标

由于上面提到的C/C++ 的特点和应用场景，因此开发流程要达到下面的目标：

安全
控制bug
保证收益

开发流程

需求

因为C/C++ 系统的自身特点，在网络应用中，它们常常担当后端系统、基础服务等。在整个产品的系统架构中，C/C++系统和业务系统常常被分离开来。C/C++ 系统不直接响应来自产品的需求，只响应业务系统提出的技术升级或改造。

设计

日志一定全面，Debug、info、warning、error、fetal
使用参数开关来控制新加的特性，对新的特性一定要追加日志
单例测试覆盖率要尽可能高
对输入的安全检查一定要做到位
可扩展性一定要高

编码

C/C++ 代码要遵守代码规范和代码标准
C/C++ 代码书写尽量遵从ANSI/ISO 标准
不要使用生僻的语法
代码可读性和可维护性一定要高
一定要书写单例测试

测试

A/B 测试

测试环境的搭建

必须多套测试环境

普通测试环境
压力测试环境
沙箱环境
线上小流量环境

必须在每一种测试环境都测试完成后，才能发布到生产环境或在生产环境上推全流量

发布

灰度发布

Nginx 和 PHP 的两种部署方式比较

发表于2015 年 10 月 28 日由Zuocheng Liu

2种部署方式简介

第一种

前置1台nginx服务器做HTTP反向代理和负载均衡
后面多态服务器部署Nginx Web服务和php-fpm提供的fast cgi服务

第二种

前置1台nginx服务器做Web服务
后面服务器只部署php-fpm服务，供nginx服务器调用
前置1台nginx服务器，在调用后面多例php-fpm服务时，也可以做到负载均衡

如下图：

2种部署方式

对比

从系统设计角度

第一种部署是常见部署方式，大中小规模网站都能适用。

第二种，web服务和php-fpm服务部署在不同服务器上，更加细致。但有几个问题：

前置nginx充当Web服务。对静态资源的访问、压缩传输、缓存设置等，也都集中在这台服务器上。一旦访问量变多，压力变大，容易成为瓶颈。
如果静态资源都存放于CDN，不需要HTTP 压缩传输，这种部署方式还算比较合理；
承接上面两点，还可以对这种部署方式进行优化。如前置nginx负载均衡和反向代理，中间是nginx Web服务，后面部署php-fpm服务。

从性能角度

相比第二种部署方式，第一种多走了一次进程间交互。

按照第一种部署，当一个http请求过来，先是nginx反向代理转发至nginx Web服务（通过网络），Web服务再通过fastcgi协议与php-fpm进行交互（进程间交互）；
按照第二种部署，当一个http请求过来，充当Web服务的nginx，直接通过网络与php-fpm进行交互

第一种部署，通过网络交互的是HTTP协议，第二种通过网络交互的是fast-cgi协议，这两种协议对比如何呢？

fast cgi 的数据包会比HTTP稍微大一些，fast cgi协议会比HTTP携带更多的参数信息、传输控制信息等等。
fast cgi 协议比HTTP协议格式化严格一些，解析起来速度更快一些。

从运维角度

第一种是最常见的部署方式，后面所有服务器上的服务都是同构的，简单粗放。
第二种则是将nginx和php-fpm单独分开部署，不同服务在服务器集群上的分布更加细致。通过统计Web服务中的压力分布，可以更加精细地利用硬件资源。运维成本也更高。

从开发测试角度

两种部署方式都不合适开发环境或测试环境，都仅适用于生产环境。

开发和测试环境把nginx和PHP部署到一台服务器上即可，也不需要反向代理和负载均衡。

总结

如果是LAMP环境的部署，第一种比较常见。

如果不是LAMP，是nginx和其他fastcgi服务交互，比如C/C++、java的fastcgi程序，在大规模的网络应用中，类似第二种的部署是常见的。做到不同服务之间分开部署，反而是简化了系统的网络结构，更加便于维护。

后记

此篇博文的内容，都来自于和百度前同事在QQ群里的讨论。

spawn-fcgi 源码分析

发表于2015 年 10 月 10 日由Zuocheng Liu

梗概

本文内容对Spawn-fcgi源码进行解读，简要说明其原理，并具体说明其实现方式。

Spawn-fcgi 源码虽然只有600多行，但是初次阅读起来依然需要花很多时间。为了节省读者的学习成本，提高学习Spawn-fcgi 的效果，作者对Spawn-fcgi的源码做了裁剪，保留最核心的功能和原有的代码结构，且能编译后正常运行。最后代码只有200多行。

源码地址在这里

必备知识

要阅读Spawn-fcgi，读者至少需要掌握以下几个方面的知识或技能：

了解CGI和FastCgi的概念，了解其使用场景
基础的Linux C 环境编程，会使用常见的库函数比如getopt、exec 等
基础的Linux C 的多进程编程，熟悉fork、waitpid、setsid等函数
基础的Linux C 网络编程，熟悉建立tcp连接、select非阻塞方式通信，多路复用I/O等

裁剪后Spawn-fcgi的执行过程

创建服务器socket
fork进程，子进程初始化会有两个主要操作：

把socket的文件描述符，复制到FCGI_LISTENSOCK_FILENO
会执行execl 函数，运行cgi程序，并让cgi程序拥有子进程的上下文环境

运行cgi程序后，使用FCGI_LISTENSOCK_FILENO这个描述符，来与webserver进行通信。

如何编译

gcc -o spawn-fcgi spawn-fcgi.c

一行命令即可

如何调用

./spawn-fcgi -f cgi -p 9001 -F 256

裁剪后也仅支持接收这三个参数

作者对于Spawn-fcgi的思考

fastcgi 协议规定，fcgi管理器中把网络描述符定为FCGI_LISTENSOCK_FILENO，为了一致CGI程序中复用FCGI_LISTENSOCK_FILENO的套接字，总感觉不是很完美。
Spawn-fcgi太简单，不需要单独做一个软件，完全可以集成到cgi程序中
Spawn-fcgi使用的是多进程，如果集成到cgi程序中，可以自由选择多进程模型、多线程模型
缺少进程守护监控，spawn-fcgi如果一个进程挂掉，不会被重启。
Spawn-fcgi 网络多路复用调用的是select，但现在最常用的是epoll

Spawn-fcgi 补充知识

与原版相比，裁剪后Spawn-fcgi的失去了哪些功能

使用linux套接字文件建立tcp连接功能
对IPv6的支持
对root、group 用户的检查
对windows、Solaris等编译环境的支持
通过进程pid文件获取cgi进程
去除对autoconf等编译工具的依赖
…

软件设计之缓存使用

发表于2015 年 7 月 15 日由Zuocheng Liu

本文主要讨论分布式环境下，缓存如何在软件设计作用、原理、实现方式及注意问题。

缓存的作用

减小原始数据访问压力
提高资源利用率

缓存的原理

局部性原理

缓存的实现方式

查询算法

散列算法，Hash 、 MD5 等
B数、二叉树、有序二分查找等

存储

只将访问量最高的部分数据放入缓存
将数据放到比原始IO速率更高的存储介质中

缓存资源回收

RUL 算法
定时清理
设置资源有效时间

缓存的存储介质

CPU 寄存器
内存
本地文件
分布式系统（Memcache 、 Redis）
数据库缓存数据表

缓存设计注意的问题

缓存的一致性，Cache coherence

避免数据脏读
多级缓存的一致性协议

系统的鲁棒性

在缓存系统停止服务，但仍能保证整体系统正常运行。因此在使用缓存之前，检查提供缓存系统的有效性。

单机缓存

单机缓存是指，将系统资源存放于每个单台服务器上，而不是集中存储与分布式缓存系统中。缺陷是，如果原数据发生更改，为保证一致性，则必须调用每一台服务器清理或更新缓存。

Service Locator Patten 总结

发表于2015 年 1 月 30 日由Zuocheng Liu

核心思想

将构建依赖的接口彻底与依赖者分离，并将此依赖作为“服务”绑定到一个标识符，而后依赖者则可通过这个标识符获取被绑定的依赖。

优点

上层逻辑不依赖于服务接口的具体实现，实现解耦
提高系统的可扩展性
逻辑分层更加简洁清晰，使不同层次的开发人员各司其职，提高团队开发效率

适用场景

与 (Abstract) Factory Patten 比较

Factory Patten 创建的所有结果对象多有统一的抽象接口的（更具一般性的）对象
Service Locator Patten 创建的服务，异构性程度比较大，接口缺少一般性
Factory Patten 单纯为创建对象
Service Locator Patten 职能更多些，包括创建服务、配置服务、注入服务的依赖等等

与 Dependence Injection Container 配合

Service Locator Patten 和 Dependence Injection并不互斥
Service Locator Patten 在定位服务时，创建服务、配置服务、注入服务的依赖通过Dependence Injection Container实现，可以进一步解耦

与 Proxy Patten 配合

对创建的服务进行抽象，增强服务的一般性（即抽象出统一接口）

与 Singleton Patten 配合

承担特定职责的Service Locator的对象无需多次实例化，节省开销
对Service Locator定位的服务缓存做集中存储，存储数据结构存于Service Locator的单例对象即可

优化和扩展

与多种设计模式配合使用
在Service Locator类里定义服务实例化对象的缓冲池，使服务只实例化1次，节省开销

代码示例

Yii 2 框架 Service Locator

后台自动任务设计和编码总结

发表于2015 年 1 月 16 日由Zuocheng Liu

资源预估

预估数据量、算法的时间、空间复杂度
依据预估的结果分配合理的资源(内存，CPU),避免资源不够用。

避免数据脏读

自动脚本处理大量数据速度快，尤其有写操作的任务，数据一致性在分布式环境下往往难以保证。这种情况下应该避免数据脏读，比如数据库会有主从复制同步延迟的现象，这时应该强制连接数据库主库。

幂等性

有写操作的脚本，需要考虑脚本执行的幂等性，即在输入相同参数多次运行与运行一次的结果相同。保证幂等性具体应该考虑一下几点：

逻辑上，检查待处理数据的状态，已经处理过的数据不再处理。
禁止并发运行，不允许运行多个进程同步运行同一任务。如何保证？信号量、Memcache加锁。

参数控制

在设计阶段，应该通过参数控制，限制脚本的操作范围。参数可以是时间，自动脚本周期运行，每次运行，只处理相应周期范围内的数据。
注意默认参数的参数值。

读并发

自动脚本处理速度快，在和其他系统进行交互时，会对其他系统产生大量而密集的请求。

要考虑其他系统的抗并发能力
合理限制单位时间对其他系统的访问次数
尽量将数据集中做批量请求，减少请求次数
在本地做缓存，消除重复的请求。

容错和错误处理

容错自动脚本往往批量处理大量数据，循环处理每条数据。在单次循环中的错误或异常，应该全部捕获，并记下日志，让脚本继续运行。
日志记录重要操作，包括info、warning、error等级所有日志，形式可以是文本记录或数据库，便于追查和报警。

备灾和数据修复

在不可抗拒因素（断电，其他原因宕机）等引起任务中途突然停止，应该依据日志定位、和追查处理到哪一阶段。修复错误数据。
在保证脚本幂等性的前提下，重复执行脚本可自动处理未完成的工作。

优化

随着业务增长，任务处理数据量越来越大，可能会出现，任务超时，内存不够用的情况，应该及时对自动任务进行优化，优化的方案可以从算法、业务架构上考虑。

4种系统间交互方式比较

发表于2013 年 6 月 5 日由Zuocheng Liu

4种系统间交互方式比较
指相对独立子系统间的交互
指标\方式	API	数据文件	共享数据库	（web系统）根域名cookie
实效性	高	低	最高	实时
时间效率	高	低	最高	低
实时空间效率	低	高	低	–
实时占用带宽	低	低	低	低
系统设计正交性	高	高	低	低
系统设计耦合度	低	低	高	高
实现方式	同步/异步	异步	异步	异步
协议	http request,socket,…	ftp,telnet,http,https,iSCSI，nfs…	redis,memcache,mysql,MongoDB…	http，https
数据结构	自定义	xml,yaml,csv,excel,txt,binany,…	database
适用场景	时效性要求高，请求次数多，请求频率很高	时效性要求低，数据量小或中，请求频率最低	时效性要求最高，系统中，某几个对数据请求次数很高，请求频率最高	需要记录在浏览器中的信息
举例	单点登录中，cas服务器和cas客户端之间的交互	财务系统和银行的对账文件	分布式数据库,共享session,异步api,计费系统的数据库	单点登录系统中的登陆信息（ticket等）