资讯专栏INFORMATION COLUMN

容器 PaaS 新技术架构下的运维实践

BaronZhang / 2276人阅读

摘要:王磊此次演讲的题目为容器新技术架构下的运维实践,详细为大家讲解了在基于构建容器的过程中,如何以应用为中心,通过新的技术工具对服务节点集群平台等多个方面进行管理运维,提高系统的自动化运维能力。

2018年11月16-17日,运维&容器技术盛会 CNUTCon 全球运维技术大会在上海·光大会展中心成功举办。时速云联合创始人兼 CTO 王磊受邀参加此次大会,并发表主题演讲。
王磊此次演讲的题目为《容器PaaS 新技术架构下的运维实践》,详细为大家讲解了在基于 Docker +Kubernetes 构建容器 PaaS 的过程中,如何以应用为中心,通过新的技术、工具对服务、节点、集群、平台等多个方面进行管理运维,提高系统的自动化运维能力。同时结合基于容器PaaS 构建 DevOps、微服务产品的实践经验,分享如何在简化DevOps 工具和微服务框架本身的同时,提高其可用性和简化运维管理的成本。

王磊认为,随着容器技术的普及落地,容器 PaaS 平台成为了企业云计算战略或云平台建设中不可或缺的部分;同时,容器技术也推动了DevOps 和微服务的逐步标准化和深入发展,容器 PaaS已经成为这些新理念、新技术、新框架的理想支撑平台。但在容器 PaaS 新技术架构落地过程中,企业和运维人员还面临着如下挑战:

新技术、新理念带来的学习成本

技术生态的飞速发展带来的复杂性以及如何保证其稳定性

管理高密度、快速变化的运行时环境的复杂性

如何在新技术架构下提高自由度和创新能力

如何进行跨中心的开发协作 – DevOps

微服务架构下的平台支撑及运维

我们先来看一下基于 Kubernetes 的容器 PaaS 平台有哪些运维的主要方式,这里从用户服务、节点、集群、平台自身运维几个角度分别介绍。

用户服务运维的手段,主要包含以下几点:

所在节点故障,自动迁移 - 设置合适的驱赶时间

设置探针,防止容器中服务无响应时带来的故障

合理设置探针各项参数,滚动升级时保障服务不中断

使用PodDisruptionBudget服务可用性、PodSecurityPolicy安全性、定义 PriorityClass优先级

通过服务分布及各项资源使用情况,打散热点进行重新调度

根据服务的状态、重启次数等数据及持续时间告警

根据服务日志匹配策略、频率告警

结合 ConfigMap与 gitlab的配置版本控制

把调试工具交给用户

服务操作审计、事件统一管理

同时对于数据中间件的支撑,可以通过 CRD 和自定义 operator 的方式来对不同的中间件集群进行部署运维等操作。包括集群的创建维护,数据的备份恢复,存储的扩容等,都可以通过不同的 CRD 及 controller 的方式进行实现,既要保证服务的可用性,又要保证数据的安全性。

集群节点的运维,可以从以下几点考虑并灵活运用:

主要资源指标监控、告警

Node affinity /taint

镜像、容器gc 策略

扩展节点设备类型- ListAndWatch / Allocate

节点维护状态

时间同步

节点故障、自定义 agent 上报异常情况

节点资源不足时的处理

驱赶策略
节点 OOM 行为
最佳实践(预留资源、服务QoS、DaemonSet)

对于 Kubernetes 集群的运维,主要从集群高可用、联邦集群、资源管理、配额管理,集群的运维工具、清理工具等方面进行了介绍。同时,在不同的底层 IaaS 平台基础上,还可以充分发挥 IaaS 的一些能力来简化或者改善容器 PaaS 的运维工作。随着 Kubernetes 自身的快速迭代,升级也就成了不得不考虑的一方面,目前我们提供两种升级路径,in-place或者 data migration,分别适合小版本升级和跨度较大的版本升级。

同时,对于整个平台的监控、运维,我们开发了一个独立的、易于部署的监控平台,用来对开发测试镜像仓库,生产镜像仓库、PaaS 平台、各类 API 服务、K8s 集群及其核心组件、各节点组件等进行统一状态收集,可以监控相关服务的状态,也可以对历史状态和异常情况进行回溯,从整体上考量每个组件的服务质量。

对于平台的运维,当然也要考虑到对数据的备份和恢复,以便在某些场景下对数据进行回滚操作。我们的容器 PaaS 上也提供了平台、集群相关的数据定时备份及恢复管理,可以把平台的 MySQL 数据及每个集群的 etcd 数据进行统一管理,也允许接入自定义备份源,实现对数据的统一管理。

接下来,介绍一下我们如何基于 Kubernetes 构建自己的 DevOps 平台。首先说一下时速云对自己的 DevOps 平台的期望:

可以更简单的同其它 DevOps 或者第三方工具集成

用户的 DevOps 需求比较多样,需要有更好的定制能力

更容易安装、运维、扩展和伸缩

减少客户和公司内部的学习成本

同 PaaS 平台保持一致的用户体验和数据一致性,充分发挥 PaaS 平台已有的能力

帮助自己的 PaaS 和微服务治理产品实现更好的 DevOps 能力

整体 DevOps 平台的基本架构如下,通过自定义 CRD 和 operator 来对构建任务进行管理,日志的收集、监控告警、节点管理、构建资源的伸缩、配额管理、权限控制都可以同PaaS 层的能力相一致,同时可以利用 PaaS 上的 Pod、Job、CronJob、Volume、ConfigMap、Secret 等诸多资源的能力,在持续集成、持续交付、持续部署等方面进行创新。未来 PaaS 层的新功能、功能改善,都可以直接适用于 DevOps 平台,大大降低了 DevOps 的开发和运维成本。

接着,我们来看一下如何在 DevOps平台上实现 CI/CD的一些例子:

实现 docker 镜像的构建

如何对构建中的产出物进行管理(war 包、jar 包等)

实现 Gitlab/Jenkins/Sonar 等工具的集成

人工审核任务

实现 Gitlab/Harbor/Jira 等工具的集成

最后,再分享一下如何在容器 PaaS 的新技术平台上更好的支撑位服务治理框架。主要包括如何对跨部门、跨中心的微服务协同开发进行支撑,如何减少微服务框架和 PaaS 平台之间的能力冲突,使彼此更好的融合。

在 Spring Cloud 和 K8s融合方面,可以使用 Spring Cloud开源的依赖项目,使用 K8s自身的服务发现、配置管理等相关能力;同时为了方便管理运维,我们将 Zuul 的路由配置使用数据库进行持久化,将 Zipkin 的调用链数据和 Hystrix 的熔断监控数据分别进行了持久化,以便随时对历史数据进行回溯;也可以直接在微服务治理平台上动态配置熔断策略或者开启降级操作。

在 Dubbo 和 K8s 融合方面,我们在 K8s 上进行了扩展,并对 Dubbo 的依赖包进行定制,替换了 zookeeper,使用 k8s 作为服务发现和注册中心,并支持 dubbo consumer 和 provider 之间通过 K8s 的 service 或者 pod ip 进行通信,用户可以根据自己的需求选择使用服务端负载均衡还是 Dubbo 的客户端负载均衡。

综上,我们一直致力于打造具备可靠、简单、自动化、集成扩展、协作等特点的容器PaaS、DevOps 和微服务治理平台,希望可以让用户更快捷、安全的进行云原生应用的实践与创新,未来我们也会继续在自动化、智能化运维以及引入适合于 容器 PaaS 的 ChatOps 上继续自己的努力。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/32759.html

相关文章

  • 稳定高于一切的金融行业如何用容器

    摘要:在谷歌不是这样,谷歌不会把特定的应用装在某台服务器上,业务应用和服务器的强绑定对于谷歌这种量级的数据中心的维护难度太高了。但是金融机构的数据中心规模不像谷歌这么大,所以能做到业务应用和硬件的强绑定。 复杂的基础IT架构是传统金融的现状,如何快速响应用户需求,加快新业务上线速度,缩短产品的迭代周期? 数人云在容器落地金融云的2年实践中,实现金融核心业务技术WebLogic、J2EE、Or...

    scola666 评论0 收藏0
  • 云计算新兴技术助推中国保险业“三十而立”

    摘要:年对于中国保险来说,是非常特殊的一年。从保险业确定改革开放至今,已经过去了整整三十年。太平集团是国内第一家在境外上市的中资保险企业,也是唯一一家管理总部设立在香港的中管金融保险集团。2018 年对于中国保险来说,是非常特殊的一年。从保险业确定改革开放至今,已经过去了整整三十年。在这个行业三十而立的今天,回溯过往的三十年,中国的保险业经历了缓慢发展期、平稳期、复苏期到快速发展期。经济转型和互联...

    _Dreams 评论0 收藏0
  • 中国人寿如何基于容器搭建金融PaaS云平台

    摘要:具体技术细节的补充中国人寿两朵云的最底层的容器调度与管理都是使用了平台。决定采纳容器拥抱,对整个中国人寿而言都是一次重大的变革。对中国人寿这样的传统金融企业而言,上一个并不容易。 6月28日,Rancher Labs在北京举办了Container Day 2018容器技术大会。在大会上,Rancher Labs CEO及联合创始人梁胜博士、中国人寿研发中心开发五部副总经理王川、技术处高...

    flybywind 评论0 收藏0
  • 宜信开源|详解PaaS平台LAIN的功能和架构

    摘要:是宜信公司大数据创新中心开发的开源平台。为宜信大数据创新中心各个团队提供了统一的测试和生产环境,简化了服务的部署与上线流程,也降低了运维人员对系统管理的复杂度。基于容器技术,面向多样化的技术栈,并且天然隔离系统和应用的依赖。 LAIN是宜信公司大数据创新中心开发的开源PaaS平台。在金融的场景下,LAIN 是为解放各个团队和业务线的生产力而设计的一个云平台。LAIN 为宜信大数据创新中...

    mist14 评论0 收藏0
  • 云计算与 Cloud Native | 数人云CEO王璞@KVM分享实录

    摘要:分享实录云计算技术源于互联网公司,现在云计算已经是下一代企业级的发展趋势。如何做云计算一直是云计算技术的领导者。互联网公司的快速发展,已经印证了云计算技术和云原生应用相比传统构架的巨大优势。 今天小数又给大家带来一篇干货满满的分享——来自KVM社区线上群分享的实录,分享嘉宾是数人云CEO王璞,题目是《云计算与 Cloud Native》。这是数人云在KVM社区群分享的第一弹,之后还有数...

    _Zhao 评论0 收藏0

发表评论

0条评论

BaronZhang

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<