2018年11月16 - 17日,由InfoQ主办的运维,容器技术盛会CNUTCon全球运维技术大会在上海·光大会展中心成功举办,时速云联合创始人兼首席技术官王磊受邀参加此次大会,并发表主题演讲。
>节 >节 >节 >节
王磊此次演讲的题目为《容器PaaS新技术架构下的运维实践》,详细为大家讲解了在基于码头工人+ Kubernetes构建容器PaaS的过程中,如何以应用为中心,通过新的技术,工具对服务,节点,集群,平台等多个方面进行管理运维,提高系统的自动化运维能力。同时结合基于容器PaaS构建DevOps,微服务产品的实践经验,分享如何在简化DevOps工具和微服务框架本身的同时,提高其可用性和简化运维管理的成本。
王磊认为,随着容器技术的普及落地,容器PaaS平台成为了企业云计算战略或云平台建设中不可或缺的部分;同时,容器技术也推动了DevOps和微服务的逐步标准化和深入发展,容器PaaS已经成为这些新理念,新技术,新框架的理想支撑平台。但在容器PaaS新技术架构落地过程中,企业和运维人员还面临着如下挑战:
-
<李>
新技术、新理念带来的学习成本
李> <李>技术生态的飞速发展带来的复杂性以及如何保证其稳定性
李> <李>
管理高密度,快速变化的运行时环境的复杂性
如何在新技术架构下提高自由度和创新能力
如何进行跨中心的开发协作——DevOps
微服务架构下的平台支撑及运维
我们先来看一下基于Kubernetes的容器PaaS平台有哪些运维的主要方式,这里从用户服务,节点,集群,平台自身运维几个角度分别介绍。
用户服务运维的手段,主要包含以下几点:
-
<李>
所在节点故障,自动迁移——设置合适的驱赶时间
设置探针,防止容器中服务无响应时带来的故障
合理设置探针各项参数,滚动升级时保障服务不中断
使用PodDisruptionBudget服务可用性,PodSecurityPolicy安全性,定义PriorityClass优先级
通过服务分布及各项资源使用情况,打散热点进行重新调度
根据服务的状态,重启次数等数据及持续时间告警
根据服务日志匹配策略,频率告警
结合ConfigMap与gitlab的配置版本控制
把调试工具交给用户
服务操作审计,事件统一管理
同时对于数据中间件的支撑,可以通过CRD和自定义运营商的方式来对不同的中间件集群进行部署运维等操作。包括集群的创建维护,数据的备份恢复,存储的扩容等,都可以通过不同的CRD及控制器的方式进行实现,既要保证服务的可用性,又要保证数据的安全性。
集群节点的运维,可以从以下几点考虑并灵活运用:
-
<李>
主要资源指标监控,告警
李> <李>节点关联/污点
李> <李>镜像,容器gc策略
李> <李>扩展节点设备类型- ListAndWatch/分配
李> <李>节点维护状态
李