Nginx("engine-x")是一个 HTTP 和反向代理服务器,同时也是一个邮件代理服务器和通用的 TCP 代理服务器。作为一个免费开源的服务器, Nginx 具有高性能、稳定和较低的资源占用的特点。它拥有丰富的特征集,同时配置也很简单。
Nginx 是少数几个可以解决 C10K 问题的服务器之一。不同于传统服务器,它使用可扩展的时间驱动(异步)架构替代线程来处理请求。尤为重要的是,该架构占用负载下的内存小,且可预测。即便不需要同时处理数千的网络请求,你仍然能从 Nginx 的高性能和低内存占用中受益。从最小的 VPS 到大型集群服务器,Nginx 都能适用。
Nginx 还有一个商业版 Nginx Plus,功能更加丰富。
下表是 Nginx 提供的监控参数及其简单释义。
<table>
<thead>
<tr>
<th>参数名称</th>
<th>参数描述</th>
</tr>
</thead>
<tbody>
<tr>
<td>Active connections </td>
<td>当前活跃的用户连接(包含 Waiting 状态) </td>
</tr>
<tr>
<td>accepts </td>
<td>接收到的用户连接总数 </td>
</tr>
<tr>
<td>handled </td>
<td>Nginx 处理的用户连接总数 </td>
</tr>
<tr>
<td>requests </td>
<td>用户请求总数 </td>
</tr>
<tr>
<td>Reading </td>
<td>当前连接中 Nginx 读取请求首部的个数 </td>
</tr>
<tr>
<td>Writing </td>
<td>当前连接中 Nginx 写返回给用户的个数 </td>
</tr>
<tr>
<td>Waiting </td>
<td>当前没有请求的活跃用户连接数 </td>
</tr>
</tbody>
</table>
通过下面的图,可以清晰的看到参数的具体意义和作用。
当用户请求连接 Nginx 服务器时, accepts 计数器会加一。且当服务器处理该连接请求时, handled 计数器同样会加一。一般而言,两者的值是相等的,除非达到了某些资源极限(如 worker_connection 的限制)。
用户连接请求被处理,就会进入 active 状态。如果该连接没有其他 request ,则进入 waiting 的子状态;如果有 request , nginx 会读取 request 的 header ,计数器 request 加一,进入 reading 的子状态。 reading 状态持续时间非常短, header 被读取后就会进入 writing 状态。事实上,直到服务器将响应结果返回给用户之前,该连接会一直保持 writing 状态。所以说, writing 状态一般会被长时间占用。
下表是 Nginx Plus 提供的主要监控参数、说明以及和 Nginx 的差异。
<table>
<thead>
<tr>
<th>参数名称</th>
<th>参数描述</th>
<th>与 Nginx 差异</th>
</tr>
</thead>
<tbody>
<tr>
<td>Active </td>
<td>当前活跃的用户连接(不包含 Idel 状态) </td>
<td>等同 Active connections </td>
</tr>
<tr>
<td>Accepted </td>
<td>接收到的用户连接总数 </td>
<td>等同 accepts </td>
</tr>
<tr>
<td>Dropped </td>
<td>Nginx 丢弃的用户连接总数 </td>
<td>accepts - handled </td>
</tr>
<tr>
<td>Idle </td>
<td>当前没有请求的活跃用户连接数 </td>
<td>等同 Waiting </td>
</tr>
<tr>
<td>Total </td>
<td>用户请求总数 </td>
<td>等同 requests </td>
</tr>
<tr>
<td>Current(Requests) </td>
<td>当前有请求的活跃用户连接数(等同 Active)</td>
<td>Reading + Writing </td>
</tr>
<tr>
<td>Current(Connections) </td>
<td>当前在线用户数(Active + Idle) </td>
<td>Reading + Writing + Waiting </td>
</tr>
</tbody>
</table>
主要参数和开源的 Nginx 相比较,区别不大。主要就是换了名字,以及通过加减法的参数整合。同样,通过下面的图也能看清这些参数的作用。
具体运作和 Nginx 并无不同,故不赘述。当然,作为商业版,它提供的参数还有很多,可以在这里看。
开源的 Nginx 提供的原始参数中,实时性的会比较有用,如 Active connections 、 Reading 、 Writing 以及 Waiting 。这些数据能够反映当前 Nginx 的负载情况,方便在服务器出现问题时及时发现问题。而另一些数据由于不是状态量, Nginx 无法计算当前的量值而改做其统计数,如 accepts 、 handled 和 requests 。
对于维护网站人员, accepts 、 handled 和 requests 的统计值用处是不大的,值得参考的是短时间内这三者数值的增量。这个短时间可以是一秒,如 accepts_per_second 、 handled_per_second 和 requests_per_second 。一个简单的做法就是每秒都去读取这些参数,返回一个和上一秒的差值就行。当然, handled_per_second 替换成 dropped_per_second=accepts_per_second-handled_per_second 就更完美了。
通过这七个参数,就可以从连接到请求全方位的监控起 Nginx 的运行状态。为了方便检测,对每次获取的参数保留下来,然后按时间展现出来。下图展示了 Nginx 在运行时的参考数据。
开源的 Nginx 会提供一个子网页显示前文提到的监控参数。该网页默认时不开启的,需要开放 ngx_http_stub_status_module 来解锁。默认该模块是开放的,通过以下命令,可以快速确定该模块是否已被开放。
nginx -V 2>&1 | grep -o with-http_stub_status_module
如过返回 with-http_stub_status_module,则说明该模块已被开放,而什么都不返回的话就是没有被开放。需要通过原码构建 Nginx 加上配置参数 --with-http_stub_status_module:
./configure \
… \
--with-http_stub_status_module
make
sudo make install
以上步骤搞定后,还有需要一个配置 URL 来开启 Nginx 状态页。打开你的网站对应 Nginx 的配置文件,添加以下修改:
server{
listen your-website-port;
location /basic_status {
stub_status;
}
}
如果 Nginx 版本低于 1.7.5 ,则需要语法指令添加参数(任意参数):
server{
listen your-website-port;
location /basic_status {
stub_status on;
}
}
修改完成后,需要重新载入 Nginx ,键入命令 nginx -s reload,然后就能在状态页(127.0.0.1:your-website-port/basic_status)看见你的监控参数了。大概是这个样子:
Active connections: 1
server accepts handled requests
38 38 38
Reading: 0 Writing: 1 Waiting: 0
Nginx Plus 和 Nginx 在前面的设置差不多。配置状态页时,需要在配置文件中加上 server 模块:
```
server {
listen your-website-port;
location /status {
status;
}
location = /status.html {
}
}
```
重载一下 Nginx ,你会在状态页(127.0.0.1:your-website-port/status.html)看到大概这个样子:
顺便安利一下,装一个 Ci,就能看到前面关于 Nginx 基于时间的运行状态的图了。免费注册免费使用,还能设置报警策略。具体,戳这里。
Cloud Insight 集监控、管理、计算、协作、可视化于一身,帮助所有 IT 公司,减少在系统监控上的人力和时间成本投入,让运维工作更加高效、简单。
本文系国内 ITOM 行业领军企业 OneAPM 工程师原创。想阅读更多技术文章,请访问 OneAPM 官方技术博客。
本文转自 OneAPM 官方博客