热搜: 最后的问候
  • 总篇数 ()
  • 粉丝量 (3)

nginx+php-fpm故障排查

  • 2018-07-16 16:02
  • 来源:ctocode
  • 阅读量:2249
  • 收藏:0
  • 被赞:0
  • 作者:

用手机看

扫描二维码随身看资讯 使用手机 二维码应用 扫描右侧二维码,您可以
1.在手机上细细品读~
2.分享给你的微信好友或朋友圈~
广告位置

摘要

小明初到一家公司做运维的工作,刚来的第一天就开始部署LNMP(Linux+Nginx+MySQL+PHP)环境,结果出现了问题。 他来向我请教。具体问题现象、原因和解决思路如下:问题一nginx进程CPU和内存不均衡,某个进程占用资源特别高,如何解决?回答:我让小明绑定下CPU的亲缘性(设置nginx配置worker_cpu_affinity项为auto,auto这个特殊值(1.9.10版本)允许自动绑定工作进程到可用的CPU上。),绑定后CPU和内存使用就均衡了。问题二小明又问close系统调


参考文档:https://mp.weixin.qq.com/s?__biz=MzI1NjkzNDU4OQ==&mid=2247483924&idx=1&sn=dca8757db22d69f711de72a5689f722d&chksm=ea1e55c6dd69dcd0fd23be08875b68d58d17ffb1b50884d61cb18f7624a65bd6c3a42417a78b&mpshare=1&scene=23&srcid=0716MmBgCxcd0AprsX9MkHoB#rd

小明初到一家公司做运维的工作,刚来的第一天就开始部署LNMP(Linux+Nginx+MySQL+PHP)环境,结果出现了问题。 他来向我请教。

具体问题现象、原因和解决思路如下:



问题一
nginx进程CPU和内存不均衡,某个进程占用资源特别高,如何解决?


回答:我让小明绑定下CPU的亲缘性(设置nginx配置worker_cpu_affinity项为auto,auto这个特殊值(1.9.10版本)允许自动绑定工作进程到可用的CPU上。),绑定后CPU和内存使用就均衡了。



问题二
小明又问close系统调用消耗很高怎么解决?


回答:且听我娓娓道来,继续看下文。

$ strace -cp $(pgrep -n nginx)

$ top

系统32c的,top查看负载去到75.14,

查看过nginx和php-fpm的

错误日志也没有什么发现。

strace 跟踪close的系统调用,

都是以下的信息:

strace -T -ttp $(pgrep -n nginx) 2&>1 |grep -B 10 close > ./close.log


$ lsof | more


遂怀疑是连接创建关闭消耗了太多的资源,
便让小明加了台机器专门跑nginx,
前端挂了个nginx用长连接跟后端的nginx
连接。接了个nginx之后负载果然就下来了。



前端未挂nginx压测ab压测结果:



前端挂了nginx压测ab压测结果:


tps基本没变第一个Time per
requset快了87.52%。
接着继续排查tps上不去的原因,
继续strace后端的nginx。

$ strace -cp $(pgrep -n nginx)

发现现在是wrtiev占用高了,
strace 跟踪close的系统调用,
发现很多以下的输出:
connect(26, {sa_family=AF_INET, 
sin_port=htons(9000), 
sin_addr=inet_addr("127.0.0.1")},
 16) = -1 EINPROGRESS
 (Operation now in progress)

问题应该不是在nginx上,
应该是在php-fpm上了。

继续

$ strace -cp $(pgrep -n php-fpm)

显示下图所示:

access cpu时间消耗最多那就先
排查access
系统调用:
$ strace -T -ttp
$(pgrep -n php-fpm) 2&>1 |
grep -B 10 access >
./access.log


php-fpm进程频繁的去读取文件,整个操
作下来花费4ms的时间。

然后排查recvfrom:
$ strace -T -ttp $(pgrep -n
php-fpm) 2&>1 |
grep -B 10 recvfrom >
./recvfrom.log

频繁的去访问10.0.0.156的6379,端口,
明显就是访问redis读取数据的过程,
整个过程花费12ms。
让小明把上面两个strace信息发给开发,
第一个得到回复是老版本的流程,
新版本改了,但还是有些判断没有处理。
第二个问题让开发使用redis连接池,
无需频繁创建连接读取数据,
频繁创建连接开销很大的。


总结
当遇上性能问题时,排查日志无法解决时,
使用strace工具来查看一下系统调用,
看时间到底消耗在哪里了,
可以轻松的找到问题所在。


转载请注明本网站 https://www.10yun.com/     谢谢~

如有不懂得,可到底部【给我留言】联系站长QQ~

  • 上一篇:

  • 下一篇:

微信扫一扫,看资讯
aaa

扫二维码或搜索微信公众号“十云“关注
回复” 技术分享、职位、新闻、工作 “即可查看最新相关内容!
赶快扫一扫吧~

表羞涩嘛~喜欢就点我

0

分享吧~~:

祝给予赞赏的伙伴,2019年发大财!

相关阅读

举报