摘要:在之前公众号的数人云工程师手记基于的集群管理开发实践对的服务发现及负载均衡有详细的介绍。服务名称为服务命名,必须为英文或数字。
引言本文是数人云9月22日线上微信群分享的文章实录。数人云容器管理面板Crane开源以来,很多小伙伴对它还不是非常了解,数人云工程师金鑫从Crane技术背景、环境准备和使用步骤等方面为大家做了详细的介绍,并整理大家常见的问题逐一进行了解答。
Docker1.12发布已有一段时间了,像Swarm mode模式、应用编排、滚动更新、健康检查、服务发现等等、这些功能给开发者们带来了更多惊喜,之前在安装 Docker之外,还要安装其它的组件来配合完成,比如Mesos-Marathon,比如K8S,现在Docker决定大包大揽,将这些功能整合到了一起。安装Docker1.12以后,通过命令行,几条命令,Swarm集群,overlay网络,服务发现等均可创建完成。
这里再提一下Docker1.12的服务发现和负载均衡是结合在一起实现的,有两种方式,一种是DNS轮询,一种是IPVS;IPVS这种方式,Docker为每个服务都分配来一个虚拟ip,这个ip是为服务做保留,不是对外提供服务。在创建服务时,通过entrypoint-mode的参数来确定是基于dnsrr(轮询)还是VIP(IPVS)的服务发现方式。
考虑到基于DNS的方式做负载均衡,会有时效性的问题,DNS生效的时间导致不能实时反映服务的变化情况。会有服务发现不准确的情况。而且,IPVS支持udp协议。稍有遗憾的是,不支持会话保持,我们在Crane发布的服务默认的服务发现的方式是后一种,IPVS的方式也是Docker1.12默认的服务发现方式。
Docker1.12的功能很诱人,但是在使用上来讲,一旦服务数量增加,单纯靠命令行管理,毕竟不是很方便,所以,数人云开发了这样一款工具,并且把它开源出来,供大家更方便的使用新版 Docker带来的新特性。
Crane!!!
数人云容器管理面板Crane安装使用指南 背景Crane作为国内第一款基于SwarmKit的容器管理工具,开源之后,小伙伴们试用热情高涨,也有小伙伴表示,体验时会在使用的某一处卡住,无法进行进一步的体验。这里针对大家反馈比较多的使用问题,做一点说明,避免环境原因,影响到小伙伴们的Crane体验。
环境准备目前推荐的主机系统是CentOS7或者Ubuntu14.04,及以上版本,虽然Docker新版本已经可以在Mac上安装,考虑不是主流,该版本未在Mac下的测试。
请确保Docker安装版本 >=1.12, 并确保Docker正常运行.(如何安装和配置Docker请参考https://docs.docker.com/engin...
按照如上说明,安装的Docker版本因该是1.12.1。service docker restart,启动Docker。
请确保docker-compose已经正确安装.(如何安装docker-compose请参考https://docs.docker.com/compo...
注意,这里安装后的docker-compose版本是1.8.0,如果您已经按照过较早版本的docker-compose,需要按照上述的地址更新到新版本,因为程序启动的语法是按照docker-compose的2.0语法。版本较早会影响程序的安装。
请确保主机的selinux和firewalld为关闭状态,如果不关闭,会影响Docker的一些功能使用。
关闭selinux 方法:vim /etc/sysconfig/selinux 设置 SELINUX=disabled 并重启系统
关闭firewalld方法:CentOS 7.0默认使用的是firewall作为防火墙,如果是Ubuntu,可以跳过这步。
systemctl status firewalld.service#查看firewall状态 systemctl start firewalld.service#启动firewall systemctl stop firewalld.service#停止firewall systemctl disable firewalld.service#禁止firewall开机启动
确保iptables对Docker没有规则限制,通常来讲,系统默认即可,如果您的环境内基于iptables的防火墙限制,建议删除。因为Swarm mode的服务发现和负载均衡均利用到iptables的转发规则。避免使用中遇到限制,需要将iptables的限制 规则清空。在之前公众号的《数人云工程师手记 | 基于 Docker 1.12 Swarm 的集群管理开发实践》对Swarm的服务发现及负载均衡有详细的介绍。有想深入了解的小伙伴可以在微信公众号内查找到该文章。
请确保NTP服务开启,收到的反馈比较多的是安装脚本执行过程中提示:
NTP is unsynchronised, Please confirm your ntp status before continue.
解决方式:以CentOS7为例,安装NTP服务,
yum install -y ntp && systemctl start ntpd && systemctl enable ntpd && systemctl disable chronyd ntpdate time.nist.gov
ntpsat 查看,显示如下正常,
synchronised to NTP server (59.46.44.253) at stratum 3 time correct to within 62 ms polling server every 1024 s
若仍出现unsynchronised字样,需要重启ntpd服务
service ntpd restart
确保开启Docker的TCP连接端口。
centos:
vim /lib/systemd/system/docker.service
ExecStart=/usr/bin/dockerd -H tcp://0.0.0.0:2375 -H unix:///var/run/docker.sock
systemctl daemon-reload && service docker restart
ubuntu:
vim /etc/default/docker
OCKER_OPTS="-H tcp://0.0.0.0:2375 -H unix:///var/run/docker.sock"
service docker restart
2375为Docker默认的tcp通讯端口,稍后在使用主机连接时需要用到。
至此,基础环境准备完毕!
安装Crane的主机默认会作为集群的管理节点,可以直接发布服务。
作为刚开始接触1.12的同学可以先按向导模式来发布,这样更便于了解新增的Docker运行参数,选择向导模式创建。这里对参数做一下介绍。然后我们发布一个ZooKeeper的集群作为演示的demo。
服务名称: 为服务命名,必须为英文或数字。
镜像名称: 服务使用的镜像,主机已存在的镜像或者为集群可以pull的镜像。
服务模式: 设定服务模式类型,分为固定实例数和一节点一任务模式。
选择网络: 服务使用的网络,需要在网络里预先创建。
认证标识: 预先设置的仓库认证信息,如果使用的镜像仓库需要登录验证,可以预先在仓库认证处设置登录信息的用户名、密码,设置不同的标签;此处选择相应的认证标签。
端口映射:建立宿主机的端口与容器端口的映射关系,支持TCP和UDP协议。
环境变量:设置容器启动时的环境变量。
启动参数:
容器工作目录:容器内工作路径,如设置/root,容器内工作路径在/root,如需执行/root/test.sh,此处设置/root,命令行设置sh test.sh即可;
命令行:容器启动的运行命令。需要说明的是,此处的命令行更相当于dockerfile中的entrypoint。
参数:为命令行提供参数。
示例: 本地docker run命令为:
docker run centos bash -c "while [ true ]; do echo "this is a test"; sleep 10; done;"
命令行输入
bash
参数输入两项
-c while [ true ]; do echo "this is a test"; sleep 10; done;
标签: 可以分别为服务和服务添加标签。
资源限制:设定服务每个容器的限制资源及预留资源。
容错策略:针对容器健康状态设置的重启策略,分别为退出、失败,退出指只要容器退出了,重启策略即生效,失败指容器非正常退出,重启策略才生效,若不设置重启策略,可以选择从不。
评估间隔:设定的时间用来评估重启政策。
重启间隔:容器重启的时间间隔。
尝试次数:尝试次数后,不再重启。
更新策略:服务更新时执行的策略
间隔:更新间隔,通常指更新的并行数<现有实例数;二次更新时的间隔时间。
并行数:一次更新的最大实例数
失败后策略,如果更新失败执行的策略,分继续尝试和立即停止两种。
调度策略:指服务发布的容器的调度分布,可以将服务的容器发布到指定的node* 节点或者指定label的节点,label需要预先编辑,label为key:value格式,
限定label输入方式node.labels.yourkey:yourvalue
限定节点id输入方式node.id:yournodeid
限定hostname的输入方式node.hostname:yourhostname
文件挂载:挂载宿主机路径到容器内,可以选择该路径到属性,如只读,读写。source为主机路径,taget为容器内路径。
发布ZooKeeper集群。因为表单较长,这里摘取了主要参数。
创建项目:zookeeper
服务1 node1
镜像:zookeeper
网络默认选择ingress
端口映射
`2181 tcp 2181
2888 tcp 2888
3888 tcp 3888 `
环境变量:
ZOO_SERVERS=server.1=node1:2888:2888 server.2=node2:2889:3889 server.3=node3:2890:3890
ZOOMYID=1 点击继续添加
服务2 node2
镜像:zookeeper
网络默认选择ingress
端口映射
2181 tcp 2182
2888 tcp 2889
3888 tcp 3889
环境变量:
ZOO_SERVERS=server.1=node1:2888:2888 server.2=node2:2889:3889 server.3=node3:2890:3890
ZOOMYID=2 点击继续添加
服务3 node3
镜像:zookeeper
网络默认选择 ingress
端口映射
2181 tcp 2183
2888 tcp 2890
3888 tcp 3890
环境变量:
ZOO_SERVERS=server.1=node1:2888:2888 server.2=node2:2889:3889 * server.3=node3:2890:3890
ZOOMYID=3
点击部署,等待镜像拉取成功后,(点击容器id--终端)执行./bin/zsServer.sh status 查看该容器的节点属性leaderorfollow
发布好的服务可以直接保存为模版。保存好的模版可以通过快捷创建,直接使用。也可以通过bundle的文件来快速部署应用。
点击项目-创建项目-DAB创建-输入项目名称-试试看中选择wordpress-部署。(也可以直接读取已有的DAB文件来发布。)
镜像拉取会有一小段时间,等待服务运行,访问主机的8000的端口,即可访问刚刚创建的应用。
Crane提供更直观的方式创建网络、添加主机、管理已发布的服务。详细的操作手册可以参考我们的线上的使用手册(https://dataman.gitbooks.io/c...
Q:应用商店里怎么添加第三方应用?第三方应用需要怎么去做?
A:之前我们的内测版本,自行设定编排模版的接口没有开放,现在已经增加,有两种方式,一种是在镜像--新建项目模版处,直接创建项目模版。项目名称为英文或数字。因为这个模版事基于bandle来发布,需要准备符合格式dab文件项目描述,图片不是必要选项。
另一种方式:通过已经发布的服务,直接转换为模版。
点击创建好的项目名称,右上角会看到添加至模版,点击该按钮,操作与上一方式类似,dab文件默认为现有项目的设置。
Q:容器资源配置时,不能手动输入大小, 鼠标滑鼠很麻烦。
A:这个设计浏览器规约,怪我们之前没有说明,我们建议使用浏览器是Chrome和Firefox,优先建议使用新版本Chrome。
Q:拉取rolex_db镜像时,响应较慢。
A:之前的镜像仓库出现了一点点问题,现已经修复。
Q:DAB方式很超前很强大。只是配置文件有学习曲线,如果做成可视化界面能帮助用户生成DAB配置文件就好了。
A:这个功能其实已经做了的,可能是方式不太直观,我们可以在创建好服务之后,将json文件导出,这样就会生出一个DAB的文件,默认的导出会带有参数的空置,如果您和我一样,有点点强迫症,可以修改文件,删除多余的空值信息,另外,推荐一个json.cn的网站,可以将混在一起的json文件格式化。
Q:能否增加持续集成功能。gitlab/github项目代码变更触发本系统的钩子,构建镜像,发布镜像,更新应用。
A:持续集成相对于docker现有功能来讲,算是一个比较重的配套功能,目前考虑到方案选型和整合会带来更大的复杂性,暂时不会加到这个项目中。不过更新功能已经集成。可以参考持续部署功能。
Q:起初上传镜像时 docker login 172.18.24.69:5000/ -uadmin@admin.com -padminadmin 报错 Error response from daemon: Get https://172.18.24.69:5000/v1/... http: server gave HTTP response to HTTPS client。
A:测试环境内没有复现这个问题,需要提供更多的参考信息。
Q:单节点部署完毕后尝试登录,提示"服务忙,请稍后重试"。
A:建议检查起的容器状态,如果方便,可以微信群发消息,远程查看。
我们列举了几个比较典型的反馈问题,如果您的反馈没有及时得到回复,可以在微信群里交流或者在GitHub上提交issue,反馈的处理优先级较高。
改进建议我们的Crane开源之后,许多热情的小伙伴在试用之后,也给我们提了许多很好的功能建议,我们也内部讨论准备在后续的版本中将部分功能整合到Crane之中。感谢所有支持Crane同学的建议!
易用性比如有同学建议在应用部署完成之后通过一个link可以直接打开应用的界面,这个功能目前的位置不明显,后续我们会加强操作便捷性的改进。
还有大家提及的安装建议,按照如上的环境准备说明操作之后,部署会减少重复的操作。如果直接修改本机配置显得又点霸道。我们考虑还是将修改的内容在环境准备时说明。
部署时按照应用向导创建时,选择相应参数但是未填写值,如果恰好点了折叠,应用无法部署,提示不够明显,这部分的用户提醒,我们正在改进。
高可用目前的部署方式为单点,在我们的roadmap中,将来会支持高可用的多节点部署。
更多系统的兼容,比如在Mac上部署。
自动伸缩策略功能已经在我们的roadmap中,方案正在论证,如果有好的思路可以给我们提建议。
SwarmKit的一些不完美作为Docker的大版本更新,1.12带来了大幅的功能更新,但新功能总有那么一些不完美,建议现用Docker的小伙伴酌情更新。
原有的docker-compose文件需要转换为bundle格式,如果有之前应用使用了docker-compose,考虑升级时,需要一点转换的工作量, 另外bundle并不能完全支持所有的参数。
不能支持host模式,虽然可以做到一主机一个任务,但是无法使用主机网络,如果您的应用需要暴露多个端口,需要一一映射。
网络性能,overlay的网络性能损耗较多,也是需要考量的一个点
服务发现还不是很完美,偶有不能正常发现的bug。
结语欢迎更多的小伙伴体验、支持数人云的开源项目,开源项目地址:https://github.com/Dataman-Cl...。 目前建议的使用场景为开发测试环境。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/26709.html
摘要:今天小数给大家带来的是数人云工程师金烨的分享,有关于自动快速部署服务相关组件的一些实践。当与相遇,双剑合璧,一切变得如此简单有趣。通过将服务注册到来做健康检查。 今天小数给大家带来的是数人云工程师金烨的分享,有关于自动快速部署DCOS服务相关组件的一些实践。当Ansible与Docker相遇,双剑合璧,一切变得如此简单有趣。 本次分享将包括以下内容: 云平台部署使用的服务、组件 Do...
摘要:容器内文件日志平台支持的文件存储是,避免了许多复杂环境的处理。以上是数人云在实践容器日志系统过程中遇到的问题,更高层次的应用包括容器日志分析等,还有待继续挖掘和填坑,欢迎大家提出建议,一起交流。 业务平台每天产生大量日志数据,为了实现数据分析,需要将生产服务器上的所有日志收集后进行大数据分析处理,Docker提供了日志驱动,然而并不能满足不同场景需求,本次将结合实例分享日志采集、存储以...
摘要:指导员明伯伯数人云工程师手记相关阅读基于的集群管理开发实践服务发现,负载均衡和 这是一个容器信息臃肿的时代。 Docker 鲸鱼鼓着圆圆的肚子在西雅图开了一场名为 DockerCon2016 的大会,全球 4000 人参加, 8 大看点留下对容器生态的更多畅想。 数人云一直专注于以企业级的 Mesos +容器技术栈,出于对容器新技术的热爱,我们在社区版的工具上小试牛刀,距 Docker...
摘要:改进了安装脚本,新的安装脚本将会检查集群的状态,是否开启。它根据的原生编排功能,采用轻量化架构,帮助开发者快速搭建环境,体验的各种最新功能。 马上就要投身到国庆节的美好假期中,小伙伴们是不是已经迫不及待了呢?为了欢度国庆, 小数这里也有一个好消息要告诉大家——我们的Cranev1.0.5 release 啦! 自从9月12日宣布开源以来,Crane受到很多开发者的关注,也收获了很...
阅读 768·2023-04-26 00:30
阅读 2661·2021-11-23 09:51
阅读 1026·2021-11-02 14:38
阅读 2525·2021-09-07 10:23
阅读 2207·2021-08-21 14:09
阅读 1266·2019-08-30 10:57
阅读 1590·2019-08-29 11:20
阅读 1112·2019-08-26 13:53