e-works数字化企业网  »  文章频道  »  基础信息化  »  终端和服务器

Nginx为什么比Apache性能好

2017/8/20    来源:TWT    作者:佚名      
关键字:Nginx  Apache  
Nginx才短短几年,就拿下了web服务器大笔江山,众所周知,Nginx在处理大并发静态请求方面,效率明显高于httpd,甚至能轻松解决C10K问题。下面我们就来聊聊Web服务器背后的一些原理。
    Nginx才短短几年,就拿下了web服务器大笔江山,众所周知,Nginx在处理大并发静态请求方面,效率明显高于httpd,甚至能轻松解决C10K问题。下面我们就来聊聊Web服务器背后的一些原理。
 
    一、进程、线程?
 
    进程是具有一定独立功能的,在计算机中已经运行的程序的实体。在早期系统中(如linux 2.4以前),进程是基本运作单位,在支持线程的系统中(如windows,linux2.6)中,线程才是基本的运作单位,而进程只是线程的容器。程序本身只是指令、数据及其组织形式的描述,进程才是程序(那些指令和数据)的真正运行实例。若干进程有可能与同一个程序相关系,且每个进程皆可以同步(循序)或异步(平行)的方式独立运行。现代计算机系统可在同一段时间内以进程的形式将多个程序加载到存储器中,并借由时间共享(或称时分复用),以在一个处理器上表现出同时(平行性)运行的感觉。同样的,使用多线程技术(多线程即每一个线程都代表一个进程内的一个独立执行上下文)的操作系统或计算机架构,同样程序的平行线程,可在多 CPU 主机或网络上真正同时运行(在不同的CPU上)。
 
    二、常见Web服务方式
 
    2.1 三种工作模型比较:
 
    Web服务器要为用户提供服务,必须以某种方式,工作在某个套接字上。一般Web服务器在处理用户请求是,一般有如下三种方式可选择:多进程方式、多线程方式、异步方式。
 
    Web服务器要为用户提供服务,必须以某种方式,工作在某个套接字上。一般Web服务器在处理用户请求是,一般有如下三种方式可选择:多进程方式、多线程方式、异步方式。
 
    多进程方式:
 
    为每个请求启动一个进程来处理。由于在操作系统中,生成进程、销毁进程、进程间切换都很消耗CPU和内存,当负载高是,性能会明显降低。
 
    优点: 稳定性!由于采用独立进程处理独立请求,而进程之间是独立的,单个进程问题不会影响其他进程,因此稳定性最好。
 
    缺点: 资源占用!当请求过大时,需要大量的进程处理请求,进程生成、切换开销很大,而且进程间资源是独立的,造成内存重复利用。
 
    多线程方式:
 
    一个进程中用多个线程处理用户请求。由于线程开销明显小于进程,而且部分资源还可以共享,因此效率较高。
 
    优点:开销较小!线程间部分数据是共享的,且线程生成与线程间的切换所需资源开销比进程间切换小得多。
 
    缺点:稳定性!线程切换过快可能造成线程抖动,且线程过多会造成服务器不稳定。
 
    异步方式:
 
    使用非阻塞方式处理请求,是三种方式中开销最小的。但异步方式虽然效率高,但要求也高,因为多任务之间的调度如果出现问题,就可能出现整体故障,因此使用异步工作的,一般是一些功能相对简单,但却符合服务器任务调度、且代码中没有影响调度的错误代码存在的程序。
 
    优点:性能最好!一个进程或线程处理多个请求,不需要额外开销,性能最好,资源占用最低。
 
    缺点:稳定性!某个进程或线程出错,可能导致大量请求无法处理,甚至导致整个服务宕机。
 
    2.2 一个Web请求的处理过程:
 
    1.客户发起情况到服务器网卡;
 
    2.服务器网卡接受到请求后转交给内核处理;
 
    3.内核根据请求对应的套接字,将请求交给工作在用户空间的Web服务器进程
 
    4.Web服务器进程根据用户请求,向内核进行系统调用,申请获取相应资源(如index.html)
 
    5.内核发现web服务器进程请求的是一个存放在硬盘上的资源,因此通过驱动程序连接磁盘
 
    6.内核调度磁盘,获取需要的资源
 
    7.内核将资源存放在自己的缓冲区中,并通知Web服务器进程
 
    8.Web服务器进程通过系统调用取得资源,并将其复制到进程自己的缓冲区中
 
    9.Web服务器进程形成响应,通过系统调用再次发给内核以响应用户请求
 
    10.内核将响应发送至网卡
 
    11.网卡发送响应给用户
 
    通过这样的一个复杂过程,一次请求就完成了。
 
    简单来说就是:
 
    用户请求-->送达到用户空间-->系统调用-->内核空间-->内核到磁盘上读取网页资源->返回到用户空间->响应给用户。
 
    上述简单的说明了一下,客户端向Web服务请求过程,在这个过程中,有两个I/O过程,一个就是客户端请求的网络I/O,另一个就是Web服务器请求页面的磁盘I/O。 下面我们就来说说Linux的I/O模型。
 
    三、各种I/O模型详解
 
    通过上面的对连接的处理分析,我们知道工作在用户空间的web服务器进程是无法直接操作IO的,需要通过系统调用进行,其关系如下:
 
    即进程向内核进行系统调用申请IO,内核将资源从IO调度到内核的buffer中(wait阶段),内核还需将数据从内核buffer中复制(copy阶段)到web服务器进程所在的用户空间,才算完成一次IO调度。这几个阶段都是需要时间的。根据wait和copy阶段的处理等待的机制不同,可将I/O动作分为如下五种模式:
 
  • 阻塞I/O
 
  • 非阻塞I/O
 
  • I/O复用(select和poll)
 
  • 信号(事件)驱动I/O(SIGIO)
 
  • 异步I/O(aio)
 
    3.1 I/O模型简介
 
    这里有必要先解释一下阻塞、非阻塞,同步、异步、I/O的概念。
 
    3.1.1 阻塞和非阻塞:
 
    阻塞和非阻塞指的是执行一个操作是等操作结束再返回,还是马上返回。
 
    比如餐馆的服务员为用户点菜,当有用户点完菜后,服务员将菜单给后台厨师,此时有两种方式:
 
    第一种:就在出菜窗口等待,直到厨师炒完菜后将菜送到窗口,然后服务员再将菜送到用户手中;
 
    第二种:等一会再到窗口来问厨师,某个菜好了没?如果没有先处理其他事情,等会再去问一次;
 
    第一种就是阻塞方式,第二种则是非阻塞的。
 
    3.1.2 同步和异步:
 
    同步和异步又是另外一个概念,它是事件本身的一个属性。还拿前面点菜为例,服务员直接跟厨师打交道,菜出来没出来,服务员直接指导,但只有当厨师将菜送到服务员手上,这个过程才算正常完成,这就是同步的事件。同样是点菜,有些餐馆有专门的传菜人员,当厨师炒好菜后,传菜员将菜送到传菜窗口,并通知服务员,这就变成异步的了。其实异步还可以分为两种:带通知的和不带通知的。前面说的那种属于带通知的。有些传菜员干活可能主动性不是很够,不会主动通知你,你就需要时不时的去关注一下状态。这种就是不带通知的异步。
 
    对于同步的事件,你只能以阻塞的方式去做。而对于异步的事件,阻塞和非阻塞都是可以的。非阻塞又有两种方式:主动查询和被动接收消息。被动不意味着一定不好,在这里它恰恰是效率更高的,因为在主动查询里绝大部分的查询是在做无用功。对于带通知的异步事件,两者皆可。而对于不带通知的,则只能用主动查询。
 
    3.1.3 全异步I/O
 
    回到I/O,不管是I还是O,对外设(磁盘)的访问都可以分成请求和执行两个阶段。请求就是看外设的状态信息(比如是否准备好了),执行才是真正的I/O操作。在Linux 2.6之前,只有“请求”是异步事件,2.6之后才引入AIO(asynchronous I/O )把“执行”异步化。别看Linux/Unix是用来做服务器的,这点上比Windows落后了好多,IOCP(Windows上的AIO,效率极高)在Win2000上就有了。所以学linux的别老觉得Windows这里不好那里不好(Windows的多线程机制也由于linux)。
 
    3.1.4 I/O的五种模型
 
    根据以上分析,I/O可分为五种模型:
 
  • 阻塞I/O:所有过程全阻塞
 
  • 非阻塞I/O:如果没有数据buffer,则立即返回EWOULDBLOCK
 
  • I/O复用(select和poll):在wait和copy阶段分别阻塞
 
  • 信号驱动I/O(SIGIO):在wait阶段不阻塞,但copy阶段阻塞(信号驱动I/O,即通知)
 
  • 异步I/O(aio):完全五阻塞方式,当I/O完成是提供信号
 

责任编辑:李欢
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。
e-works
官方微信
掌上
信息化
编辑推荐
新闻推荐
博客推荐
视频推荐