基于python的Linux系统指定进程性能监控思路详解

  

监控Linux服务器的工具,组件和程序网上有很多,但是一台服务器上会有很多进程同时运行,特别是做性能测试的时候,可能一台服务器上部署多个服务,如果只监控整个服务器的CPU和内存,当某个服务出现性能问题时,并不能有效准确的定位出(当然通过其他工具也可以实现),因此,很有必要只监控指定的进程。需求明确了,于是动手撸了一个性能监控脚本。

  

一、整体思路

  

1,为了方便的启动监控和停止监控,在想查看监控结果的时候随时查看监控结果,用瓶开启了一个服务,通过发送得到请求可以随时启停监控和查看监控结果。
  2,针对控制是否监控cpu、内存、IO、开启多线程监控。
  3、为了减少对其他组件的依赖,将监控结果写到日志中。
  4、为了方便查看监控结果,直接将结果以html方式返回。

  

基于python的Linux系统指定进程性能监控思路详解

  

二,配置文件

  

config.py         IP=' 127.0.0.1 '   端口=' 5555 '   水平='信息' #日志级别   BACKUP_COUNT=9 #计数器日志备份   LOG_PATH=罩尽?日志路径   间隔=1 #区间,区间运行命令。   SLEEPTIME=3 #间隔停止监控时,轮询开始监视当满足条件。   ERROR_TIMES=5 # *,运行命令。当相同的情况下,自动停止监控。   IS_JVM_ALERT=True #是否警报当完整GC的频率太高了。   IS_MONITOR_SYSTEM=True #是否监控系统的CPU和内存。   IS_MEM_ALERT=True #提醒当内存是否过低。通过发送电子邮件警报。   MIN_MEM=2 # Minxium内存,使用uint: G   # 0:不清楚缓存,1:明确的页面缓存,2:明确dentry简洁和inode缓存,3:包括1和2;   1 #回声在/proc/sys/vm/drop_caches   回声=0   SMTP_SERVER=' smtp.sina.com ' # SMTP服务器   SENDER_NAME='张三”#发送者的名字   SENDER_EMAIL=皕hangsan@qq.com”#发送者的电子邮件   密码=' UjBWYVJFZE9RbFpIV1QwOVBUMDlQUT09 ' #电子邮件密码,base64编码。   RECEIVER_NAME=' baidu_all ' #接收器的名字   RECEIVER_EMAIL=(“zhangsan@qq.com”、“zhangsi@qq.com”) #接收方的电子邮件=device1 #这磁盘应用程序运行   START_TIME='开始时间。txt #商店的时候开始监控。   FGC_TIMES=' FullGC。三种“#存储每个FullGC时间的时间。   # html   HTML=' & lt; html> & lt; body> {} & lt;/body> & lt; html>”   错误=' & lt; p在{}& lt;/p>”   头=' & lt; div id=巴贰痹? lt; h3对齐=爸行摹痹谛阅芗嗍悠?pid={}) & lt;/h3> & lt;/div>”   分析=' & lt; div id=叭萜鳌痹趝}& lt;/div>”      

IP和端口:开启服务的服务器IP和端口,必须和所监控的服务在同一台服务器上;
  BACKUP_COUNT:默认为9,即只保留最近9天监控结果;
  间隔:两次监控的时间间隔,默认为1 s,主要用于cpu和内存监控,当同时监控多个端口或进程时,请将该值设小一点;
  ERROR_TIMES:命令执行失败次数,当大于该次数时,则会自动停止监控;主要用于监控指定的进程,如果进程被杀掉,则必须自动停止监控,且必须手动触发再次开始监控,如果监控指定的端口,当端口的进程被杀掉后,也会停止监控,如果端口被重新启动,则自动开始监控;
  IS_JVM_ALERT:仅针对java应用,如果频繁FullGC,则邮件提醒,一般性能测试,FullGC的频率不得小于3600秒;
  IS_MONITOR_SYSTEM:是否监控系统总CPU使用率和剩余内存;
  IS_MEM_ALERT:当系统剩余内存过低时,是否邮件提醒;
  MIN_MEM:允许系统最小剩余内存,单位为G;
  回音:当系统剩余内存过低时,是否释放缓存;0为不释放,1为释放页面缓存,2为释放dentry简洁和inode缓存,3为释放1和2,
  磁盘:磁盘号,如果监控IO,需要输入磁盘号,通过df - h文件名查看当前文件挂在哪个磁盘下,
  START_TIME:记录每次手动触发开始监控的时间,
  FGC_TIMES:记录每次FullGC的时间,用于排查问题;

  

三,接口和服务

  

server.py         服务器=瓶(__name__)   permon=permon ()   #开启多线程   t=[threading.Thread(目标=permon。write_cpu_mem args=()),   threading.Thread(目标=permon。write_io args=()))   因为我在范围(len (t)):   t[我].start ()   #开始监控   # http://127.0.0.1:5555 runMonitor& # 63; isRun=1,类型=pid& num=23121, totalTime=3600   @server。路线(“/runMonitor”、方法=[的])   def runMonitor ():……   #画监控结果图   # http://127.0.0.1:5555 plotMonitor& # 63;类型=pid& num=23121   @server。路线(“/plotMonitor”、方法=[的])   def plotMonitor (): .......   server.run(端口=cfg.PORT debug=True,主机=cfg.IP) #开启服务

基于python的Linux系统指定进程性能监控思路详解