服务器故障处理



<李>

<李>

<李>

<李>

<李>

<强> CPU和内存

,,,,美元免费- m
,,,,正常运行时间美元
,,,,美元上方

,,,,美元htop

<李>

还有剩余的CPU吗?服务器是几核的?是否有某些CPU核负载过多了?

<李>

服务器最大的负载来自什么地方?平均负载是多少吗?

<李>

<强> IO性能 <强>

,,,,美元iostat kx 2
,,,, vmstat 2美元10
,,,, mpstat 2美元10

,,,,美元dstat——top-io top-bio,用它可以看到谁在进行IO

<李>

检查磁盘使用量:服务器硬盘是否已满?李李

<>

是否开启了交换交换模式(si/) ?

<李>

CPU被谁占用:系统进程?用户进程?虚拟机吗?


<李>

Apache,Nginx;查找访问和错误日志,直接找5 xx错误,再看看是否有limit_zone错误。

<李>

MySQL;在mysql。日志找错误消息,看看有没有结构损坏的表,是否有innodb修复进程在运行,是否有磁盘/索引/查询问题。

<李>

PHP-FPM;如果设定了php-slow日志,直接找错误信息(php、mysql memcache…),如果没设定,赶紧设定。

<李>

清漆;在varnishlog和varnishstat里,检查/小姐比。看看配置信息里是否遗漏了什么规则,使最终用户可以直接* * *你的后端?

<李>

HA-Proxy;后端的状况如何?健康状况检查是否成功?是前端还是后端的队列大小达到最大值了?

<强>

<李>

<李>

<李>

<李>

<李>

服务器故障处理