干货分享:容器PaaS新技术架构下的运维实践

  <>节   <>节   <>节   <>节   

  2018年11月16 - 17日,由InfoQ主办的运维,容器技术盛会CNUTCon全球运维技术大会在上海·光大会展中心成功举办,时速云联合创始人兼首席技术官王磊受邀参加此次大会,并发表主题演讲。   

  节   节   节   节   

  
  

  

  王磊此次演讲的题目为《容器PaaS新技术架构下的运维实践》,详细为大家讲解了在基于码头工人+ Kubernetes构建容器PaaS的过程中,如何以应用为中心,通过新的技术,工具对服务,节点,集群,平台等多个方面进行管理运维,提高系统的自动化运维能力。同时结合基于容器PaaS构建DevOps,微服务产品的实践经验,分享如何在简化DevOps工具和微服务框架本身的同时,提高其可用性和简化运维管理的成本。   
  

  

  
  

  

  王磊认为,随着容器技术的普及落地,容器PaaS平台成为了企业云计算战略或云平台建设中不可或缺的部分;同时,容器技术也推动了DevOps和微服务的逐步标准化和深入发展,容器PaaS已经成为这些新理念,新技术,新框架的理想支撑平台。但在容器PaaS新技术架构落地过程中,企业和运维人员还面临着如下挑战:   

  

  
  

     <李>   

  新技术、新理念带来的学习成本   

  李   <李>   

  技术生态的飞速发展带来的复杂性以及如何保证其稳定性   

  李   <李>   

  管理高密度,快速变化的运行时环境的复杂性   
  

  李   <李>   

  如何在新技术架构下提高自由度和创新能力   
  

  李   <李>   

  如何进行跨中心的开发协作——DevOps   
  

  李   <李>   

  微服务架构下的平台支撑及运维   
  

  李      

  
  

  

  我们先来看一下基于Kubernetes的容器PaaS平台有哪些运维的主要方式,这里从用户服务,节点,集群,平台自身运维几个角度分别介绍。   

  

  
  

  

  用户服务运维的手段,主要包含以下几点:   

  

  
  

     <李>   

  所在节点故障,自动迁移——设置合适的驱赶时间   
  

  李   <李>   

  设置探针,防止容器中服务无响应时带来的故障   
  

  李   <李>   

  合理设置探针各项参数,滚动升级时保障服务不中断   
  

  李   <李>   

  使用PodDisruptionBudget服务可用性,PodSecurityPolicy安全性,定义PriorityClass优先级   
  

  李   <李>   

  通过服务分布及各项资源使用情况,打散热点进行重新调度   
  

  李   <李>   

  根据服务的状态,重启次数等数据及持续时间告警   
  

  李   <李>   

  根据服务日志匹配策略,频率告警   
  

  李   <李>   

  结合ConfigMap与gitlab的配置版本控制   
  

  李   <李>   

  把调试工具交给用户   
  

  李   <李>   

  服务操作审计,事件统一管理   
  

  李      

  
  

  

  同时对于数据中间件的支撑,可以通过CRD和自定义运营商的方式来对不同的中间件集群进行部署运维等操作。包括集群的创建维护,数据的备份恢复,存储的扩容等,都可以通过不同的CRD及控制器的方式进行实现,既要保证服务的可用性,又要保证数据的安全性。   
  

  

  
  

  

  集群节点的运维,可以从以下几点考虑并灵活运用:   

  

  
  

     <李>   

  主要资源指标监控,告警   

  李   <李>   

  节点关联/污点   

  李   <李>   

  镜像,容器gc策略   

  李   <李>   

  扩展节点设备类型- ListAndWatch/分配   

  李   <李>   

  节点维护状态   

  李

干货分享:容器PaaS新技术架构下的运维实践