摘要:在,我们使用作为事件流架构的一部分。在源断和端,它使非常容易建立以及丢弃的。因此,第一步就是创建一个预安装了的镜像。一个基础的拓扑一个拓扑由组成,它有个核心概念和。
注:该文的原文为 Using Docker with Apache Flume - Part 1,由 Alex Wilson 编写。
在 Unruly ,我们使用 Apache Flume 作为事件流架构的一部分。在源断和 sinks 端,它使非常容易建立以及丢弃的。在我的创新时间,我尝试创立一些 Flume 技术来获得 Docker 和集装箱运输的知识。
建立一个基础镜像Docker 有镜像的概念,在这个镜像中我们能运行一个容器。因此,第一步就是创建一个预安装了 Flume 的镜像。Flume 仅仅依赖 java(它是一个java工程),我在一个 Ubuntu 基础镜像的基础上创建了它,创建它需要执行以下步骤:
安装 java 和 wget
下载和解压 flume 工程到 /opt/flume 目录下
设置 JAVA_HOME 和把 flume-ng 添加进 PATH
如下所做,创建一个 dockerfile :
FROM ubuntu # install wget + java RUN apt-get update -q RUN DEBIAN_FRONTEND=noninteractive apt-get install -qy --no-install-recommends wget openjdk-7-jre # download and unzip Flume RUN mkdir /opt/flume RUN wget -qO- https://archive.apache.org/dist/flume/stable/apache-flume-1.4.0-bin.tar.gz | tar zxvf - -C /opt/flume --strip 1 # set environment variables ENV JAVA_HOME /usr/lib/jvm/java-7-openjdk-amd64 ENV PATH /opt/flume/bin:$PATH
通过这个 Dockerfile 构建一个镜像(使用 docker build -t flume .),将给我们一个基础镜像,以使 Flume 容器使用。它是可用的,你可以在 Docker index 找到它。
一个基础的 Flume 拓扑一个 Flume 拓扑由 agent 组成,它有3个核心概念:sources、channels 和 sinks。
我们从 sources 接收数据,把它放入一个或是多个的 channels ,它能被 sinks 读取和加工。大部分的基础拓扑由一个节点组成,我们建立了以下一个由 Docker 创建的节点,使用:
一个 NetcatSource,从一个端口读取数据并且变成事件
一个 MemoryChannel,存放在内存中的事件 buffering 。
一个 LoggerSink,记录它接收到的事件
这个拓扑的配置文件,我们称之为 flume-example.conf 配置文件像如下这样:
docker.sinks = logSink docker.sources = netcatSource docker.channels = inMemoryChannel docker.sources.netcatSource.type = netcat docker.sources.netcatSource.bind = 0.0.0.0 docker.sources.netcatSource.port = 44444 docker.sources.netcatSource.channels = inMemoryChannel docker.channels.inMemoryChannel.type = memory docker.channels.inMemoryChannel.capacity = 1000 docker.channels.inMemoryChannel.transactionCapacity = 100 docker.sinks.logSink.type = logger docker.sinks.logSink.channel = inMemoryChannel
我们将使用这个配置文件创建一个新容器,并且启动 docker agent。
FROM probablyfine/flume ADD flume-example.conf /var/tmp/flume-example.conf EXPOSE 44444 ENTRYPOINT [ "flume-ng", "agent", "-c", "/opt/flume/conf", "-f", "/var/tmp/flume-example.conf", "-n", "docker", "-Dflume.root.logger=INFO,console" ]
在 ENTRYPOINT 块的 flume-ng 的命令将在一个启动的容器中运行(配置文件的目录,配置文件,和agent 名字),并且 EXPOSE 指令使得端口在运行期是可用的。NetcatSource 在监听这个端口。
一旦我们创建了这个新镜像(我们叫做 flume-example),我们就可以通过使用命令 docker run -p 444:44444 -t flume-example 启动这个容器,p 444:44444 指令将让容器中的 4444 端口和本机的 444 端口做映射。现在我们可以通过 echo foo bar baz | nc localhost 444 给它发送消息了,然后看被记录的事件。
... 2014-05-05 19:26:13,218 (SinkRunner-PollingRunner-DefaultSinkProcessor) [INFO - org.apache.flume.sink.LoggerSink.process(LoggerSink.java:70)] Event: { headers:{} body: 66 6F 6F 20 62 61 72 20 62 61 7A foo bar baz } ...
简直酷毙了!现在我们有一个工作的 Flume agent 可以获取和处理数据了。
下一篇文章,将展示更多的有趣的 Flume 技术,并且我们可以更早的把 Docker 的特性和 Flume 的建立整合起来(比如共享一个卷和只读的挂载)。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/35727.html
摘要:在,我们使用作为事件流架构的一部分。在源断和端,它使非常容易建立以及丢弃的。因此,第一步就是创建一个预安装了的镜像。一个基础的拓扑一个拓扑由组成,它有个核心概念和。 注:该文的原文为 Using Docker with Apache Flume - Part 1,由 Alex Wilson 编写。 在 Unruly ,我们使用 Apache Flume 作为事件流架构的一部分...
摘要:注该文的作文是原文地址为在,我们使用处理我们架构的一部分,因为它很容易设置和减少自定义和,在我的创新时间,我尝试设置一些拓扑来学习和集装箱化。酷现在我们有一个工作的可以提取和处理数据了。第二部分的地址 注:该文的作文是 mrwilson ,原文地址为 Using Docker with Apache Flume - Part 1 在 Unruly,我们使用 Apache Fl...
摘要:健康监控检查,可以说是集群中最重要的一部分了。我们在这里没有使用推荐的方式,我们自己将其与内部的系统做了结合,通过来对整个集群进行监控报警自动化操作。 在公司内部,基于kubernetes实现了简单的docker应用集群系统,拿出来和大家分享下,在这个系统中,实现了应用的自动部署、动态扩容、节点切换、健康检查、AB式版本更新等功能,也欢迎大家将各自的实现也分享给我。 整体架构 整体架构...
摘要:健康监控检查,可以说是集群中最重要的一部分了。我们在这里没有使用推荐的方式,我们自己将其与内部的系统做了结合,通过来对整个集群进行监控报警自动化操作。 在公司内部,基于kubernetes实现了简单的docker应用集群系统,拿出来和大家分享下,在这个系统中,实现了应用的自动部署、动态扩容、节点切换、健康检查、AB式版本更新等功能,也欢迎大家将各自的实现也分享给我。 整体架构 整体架构...
阅读 4175·2021-09-26 10:17
阅读 842·2021-09-22 15:02
阅读 3417·2021-09-06 15:00
阅读 1013·2021-07-25 16:52
阅读 2707·2019-08-29 16:16
阅读 2470·2019-08-29 13:25
阅读 1574·2019-08-26 13:51
阅读 2168·2019-08-26 10:58