Nginx 和 PHP 的两种部署方式比较

发表于2015 年 10 月 28 日由Zuocheng Liu

2种部署方式简介

第一种

前置1台nginx服务器做HTTP反向代理和负载均衡
后面多态服务器部署Nginx Web服务和php-fpm提供的fast cgi服务

第二种

前置1台nginx服务器做Web服务
后面服务器只部署php-fpm服务，供nginx服务器调用
前置1台nginx服务器，在调用后面多例php-fpm服务时，也可以做到负载均衡

如下图：

2种部署方式

对比

从系统设计角度

第一种部署是常见部署方式，大中小规模网站都能适用。

第二种，web服务和php-fpm服务部署在不同服务器上，更加细致。但有几个问题：

前置nginx充当Web服务。对静态资源的访问、压缩传输、缓存设置等，也都集中在这台服务器上。一旦访问量变多，压力变大，容易成为瓶颈。
如果静态资源都存放于CDN，不需要HTTP 压缩传输，这种部署方式还算比较合理；
承接上面两点，还可以对这种部署方式进行优化。如前置nginx负载均衡和反向代理，中间是nginx Web服务，后面部署php-fpm服务。

从性能角度

相比第二种部署方式，第一种多走了一次进程间交互。

按照第一种部署，当一个http请求过来，先是nginx反向代理转发至nginx Web服务（通过网络），Web服务再通过fastcgi协议与php-fpm进行交互（进程间交互）；
按照第二种部署，当一个http请求过来，充当Web服务的nginx，直接通过网络与php-fpm进行交互

第一种部署，通过网络交互的是HTTP协议，第二种通过网络交互的是fast-cgi协议，这两种协议对比如何呢？

fast cgi 的数据包会比HTTP稍微大一些，fast cgi协议会比HTTP携带更多的参数信息、传输控制信息等等。
fast cgi 协议比HTTP协议格式化严格一些，解析起来速度更快一些。

从运维角度

第一种是最常见的部署方式，后面所有服务器上的服务都是同构的，简单粗放。
第二种则是将nginx和php-fpm单独分开部署，不同服务在服务器集群上的分布更加细致。通过统计Web服务中的压力分布，可以更加精细地利用硬件资源。运维成本也更高。

从开发测试角度

两种部署方式都不合适开发环境或测试环境，都仅适用于生产环境。

开发和测试环境把nginx和PHP部署到一台服务器上即可，也不需要反向代理和负载均衡。

总结

如果是LAMP环境的部署，第一种比较常见。

如果不是LAMP，是nginx和其他fastcgi服务交互，比如C/C++、java的fastcgi程序，在大规模的网络应用中，类似第二种的部署是常见的。做到不同服务之间分开部署，反而是简化了系统的网络结构，更加便于维护。

后记

此篇博文的内容，都来自于和百度前同事在QQ群里的讨论。

spawn-fcgi 源码分析

发表于2015 年 10 月 10 日由Zuocheng Liu

梗概

本文内容对Spawn-fcgi源码进行解读，简要说明其原理，并具体说明其实现方式。

Spawn-fcgi 源码虽然只有600多行，但是初次阅读起来依然需要花很多时间。为了节省读者的学习成本，提高学习Spawn-fcgi 的效果，作者对Spawn-fcgi的源码做了裁剪，保留最核心的功能和原有的代码结构，且能编译后正常运行。最后代码只有200多行。

源码地址在这里

必备知识

要阅读Spawn-fcgi，读者至少需要掌握以下几个方面的知识或技能：

了解CGI和FastCgi的概念，了解其使用场景
基础的Linux C 环境编程，会使用常见的库函数比如getopt、exec 等
基础的Linux C 的多进程编程，熟悉fork、waitpid、setsid等函数
基础的Linux C 网络编程，熟悉建立tcp连接、select非阻塞方式通信，多路复用I/O等

裁剪后Spawn-fcgi的执行过程

创建服务器socket
fork进程，子进程初始化会有两个主要操作：

把socket的文件描述符，复制到FCGI_LISTENSOCK_FILENO
会执行execl 函数，运行cgi程序，并让cgi程序拥有子进程的上下文环境

运行cgi程序后，使用FCGI_LISTENSOCK_FILENO这个描述符，来与webserver进行通信。

如何编译

gcc -o spawn-fcgi spawn-fcgi.c

一行命令即可

如何调用

./spawn-fcgi -f cgi -p 9001 -F 256

裁剪后也仅支持接收这三个参数

作者对于Spawn-fcgi的思考

fastcgi 协议规定，fcgi管理器中把网络描述符定为FCGI_LISTENSOCK_FILENO，为了一致CGI程序中复用FCGI_LISTENSOCK_FILENO的套接字，总感觉不是很完美。
Spawn-fcgi太简单，不需要单独做一个软件，完全可以集成到cgi程序中
Spawn-fcgi使用的是多进程，如果集成到cgi程序中，可以自由选择多进程模型、多线程模型
缺少进程守护监控，spawn-fcgi如果一个进程挂掉，不会被重启。
Spawn-fcgi 网络多路复用调用的是select，但现在最常用的是epoll

Spawn-fcgi 补充知识

与原版相比，裁剪后Spawn-fcgi的失去了哪些功能

使用linux套接字文件建立tcp连接功能
对IPv6的支持
对root、group 用户的检查
对windows、Solaris等编译环境的支持
通过进程pid文件获取cgi进程
去除对autoconf等编译工具的依赖
…

不同设计模式的适用场景总结

发表于2015 年 7 月 27 日由Zuocheng Liu

软件设计过程中，该选择那种设计模式，除了借鉴直接的经验，还可以从以下方面考虑：

领域对象模型中，类之间的关系是什么（继承、实现、关联、依赖、组合、聚合）
容易变化的部分是什么，即易于扩展的部分
不容易变化的部分是什么，即需要复用的部分

按照我们的思路，设计模式之所以多种多样，就是对应的领域模型中上面三个方面有很大不同。把握住以上几点，就能正确地选用设计模式

门面模式，Facade Pattern

门面类和被门面类封装的类之间是继承或者依赖关系
类的内部接口、内部逻辑经常变化；不被需要的对外接口容易变化；
类的对外部接口不容易变

适配器模式， Adapter Pattern

适配器类和被适配的类之间是继承或者依赖关系
需要适配的类，或者其接口容易变化
适配的类的接口不容易变化

原型模式， Adapter Pattern

不同类之间有共同的父类
类的部分属性、方法容易变化
类的另外一部分属性、方法不容易变化，且构建复杂，成本很高

单例模式，Singleton Pattern

类在全局唯一存在，其他类与单例类是
类的唯一性不会变化

多例模式，Multition Pattern

多例类的对象之间是聚合关系
多例类的对象的数量容易变化

策略模式，Strategy Pattern

对象和算法，是依赖关系
逻辑框架不容易变化
策略算法容易变化

代理模式，Proxy Pattern

代理和被代理的类之间是依赖关系
代理者的接口不容易变化
被代理者的接口具体实现容易变化

工厂模式，Factory Methond Pattern

工厂模式产生的对象一般有相同的父类（继承关系）
由工厂产生对象不会变
工厂产生对象所属的类的种类是不断变化（增多或减少）

抽象工厂模式，Abstract Factory Pattern

同工厂模式
变化的是，工厂创建对象所属的类的接口会不断变化

门面模式，Facade Pattern

封装类和被封装的类之间是依赖关系
接口类（封装类）的接口不容易变化
实现类（被封装的类）的接口容易变化

Adapter Pattern

同门面模式
适配器类更倾向于兼容现有系统的接口需求

模版模式，Template Method Pattern

建造者模式，Builder Pattern

构建、配置、注入依赖容易变化，且较复杂

桥梁模式，Bridge Pattern

命令模式，Command Pattern

装饰模式，Decorator Pattern

迭代器模式，Iterator Pattern

组合模式，Composite Pattern

观察者模式，Observer Pattern

观察者和被观察者是关联关系
被观察者的数量或种类容易变化

责任链模式，Chain of Responsibility Pattern

访问者模式，Visitor Pattern

状态模式，State Patter

原型模式，Prototype Pattern

中介者模式，Mediator Pattern

解释器模式，Interpreter Pattern

亨元模式，Flyweight Pattern

备忘录模式，Memento Pattern

软件设计之缓存使用

发表于2015 年 7 月 15 日由Zuocheng Liu

本文主要讨论分布式环境下，缓存如何在软件设计作用、原理、实现方式及注意问题。

缓存的作用

减小原始数据访问压力
提高资源利用率

缓存的原理

局部性原理

缓存的实现方式

查询算法

散列算法，Hash 、 MD5 等
B数、二叉树、有序二分查找等

存储

只将访问量最高的部分数据放入缓存
将数据放到比原始IO速率更高的存储介质中

缓存资源回收

RUL 算法
定时清理
设置资源有效时间

缓存的存储介质

CPU 寄存器
内存
本地文件
分布式系统（Memcache 、 Redis）
数据库缓存数据表

缓存设计注意的问题

缓存的一致性，Cache coherence

避免数据脏读
多级缓存的一致性协议

系统的鲁棒性

在缓存系统停止服务，但仍能保证整体系统正常运行。因此在使用缓存之前，检查提供缓存系统的有效性。

单机缓存

单机缓存是指，将系统资源存放于每个单台服务器上，而不是集中存储与分布式缓存系统中。缺陷是，如果原数据发生更改，为保证一致性，则必须调用每一台服务器清理或更新缓存。

后台自动任务设计和编码总结

发表于2015 年 1 月 16 日由Zuocheng Liu

资源预估

预估数据量、算法的时间、空间复杂度
依据预估的结果分配合理的资源(内存，CPU),避免资源不够用。

避免数据脏读

自动脚本处理大量数据速度快，尤其有写操作的任务，数据一致性在分布式环境下往往难以保证。这种情况下应该避免数据脏读，比如数据库会有主从复制同步延迟的现象，这时应该强制连接数据库主库。

幂等性

有写操作的脚本，需要考虑脚本执行的幂等性，即在输入相同参数多次运行与运行一次的结果相同。保证幂等性具体应该考虑一下几点：

逻辑上，检查待处理数据的状态，已经处理过的数据不再处理。
禁止并发运行，不允许运行多个进程同步运行同一任务。如何保证？信号量、Memcache加锁。

参数控制

在设计阶段，应该通过参数控制，限制脚本的操作范围。参数可以是时间，自动脚本周期运行，每次运行，只处理相应周期范围内的数据。
注意默认参数的参数值。

读并发

自动脚本处理速度快，在和其他系统进行交互时，会对其他系统产生大量而密集的请求。

要考虑其他系统的抗并发能力
合理限制单位时间对其他系统的访问次数
尽量将数据集中做批量请求，减少请求次数
在本地做缓存，消除重复的请求。

容错和错误处理

容错自动脚本往往批量处理大量数据，循环处理每条数据。在单次循环中的错误或异常，应该全部捕获，并记下日志，让脚本继续运行。
日志记录重要操作，包括info、warning、error等级所有日志，形式可以是文本记录或数据库，便于追查和报警。

备灾和数据修复

在不可抗拒因素（断电，其他原因宕机）等引起任务中途突然停止，应该依据日志定位、和追查处理到哪一阶段。修复错误数据。
在保证脚本幂等性的前提下，重复执行脚本可自动处理未完成的工作。

优化

随着业务增长，任务处理数据量越来越大，可能会出现，任务超时，内存不够用的情况，应该及时对自动任务进行优化，优化的方案可以从算法、业务架构上考虑。

4种系统间交互方式比较

发表于2013 年 6 月 5 日由Zuocheng Liu

4种系统间交互方式比较
指相对独立子系统间的交互
指标\方式	API	数据文件	共享数据库	（web系统）根域名cookie
实效性	高	低	最高	实时
时间效率	高	低	最高	低
实时空间效率	低	高	低	–
实时占用带宽	低	低	低	低
系统设计正交性	高	高	低	低
系统设计耦合度	低	低	高	高
实现方式	同步/异步	异步	异步	异步
协议	http request,socket,…	ftp,telnet,http,https,iSCSI，nfs…	redis,memcache,mysql,MongoDB…	http，https
数据结构	自定义	xml,yaml,csv,excel,txt,binany,…	database
适用场景	时效性要求高，请求次数多，请求频率很高	时效性要求低，数据量小或中，请求频率最低	时效性要求最高，系统中，某几个对数据请求次数很高，请求频率最高	需要记录在浏览器中的信息
举例	单点登录中，cas服务器和cas客户端之间的交互	财务系统和银行的对账文件	分布式数据库,共享session,异步api,计费系统的数据库	单点登录系统中的登陆信息（ticket等）

2种部署方式简介

第一种

第二种

对比

从系统设计角度

从性能角度

从运维角度

从开发测试角度

总结

后记

梗概

必备知识

裁剪后Spawn-fcgi的执行过程

如何编译

如何调用

作者对于Spawn-fcgi的思考

Spawn-fcgi 补充知识

与原版相比，裁剪后Spawn-fcgi的失去了哪些功能

门面模式，Facade Pattern

适配器模式， Adapter Pattern

原型模式， Adapter Pattern

单例模式，Singleton Pattern

多例模式，Multition Pattern

策略模式，Strategy Pattern

代理模式，Proxy Pattern

工厂模式，Factory Methond Pattern

抽象工厂模式，Abstract Factory Pattern

门面模式，Facade Pattern

Adapter Pattern

模版模式，Template Method Pattern

建造者模式，Builder Pattern

桥梁模式，Bridge Pattern

命令模式，Command Pattern

装饰模式，Decorator Pattern

迭代器模式，Iterator Pattern

组合模式，Composite Pattern

观察者模式，Observer Pattern

责任链模式，Chain of Responsibility Pattern

访问者模式，Visitor Pattern

状态模式，State Patter

原型模式，Prototype Pattern

中介者模式，Mediator Pattern

解释器模式，Interpreter Pattern

亨元模式，Flyweight Pattern

备忘录模式，Memento Pattern

缓存的作用

缓存的原理

局部性原理

缓存的实现方式

查询算法

存储

缓存资源回收

缓存的存储介质

缓存设计注意的问题

缓存的一致性，Cache coherence

系统的鲁棒性

单机缓存

资源预估

避免数据脏读

幂等性

参数控制

读并发

容错 和 错误处理

备灾和数据修复

优化

4种系统间交互方式比较

容错和错误处理