专题详情LABEL DETAILS

cdh

cdh
CDH是Hadoop发行版的一种,是一套目前比较完整的、充分测试的Hadoop及其相关项目的发行版。CDH提供了Hadoop的核心元素——可扩展的存储和分布式计算——以及基于Web的用户界面和重要的企业功能。
  • cdhhdfs

    cdhhdfs

    CDH是一种功能强大的Hadoop发行版本,HDFS是CDH中的一个重要组件,负责提供大规模数据存储和访问的功能。  hdfs,全称hadoop distributed file system,意思是分布式文件系统。hadoop分布式文件系统是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。  HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。...

    白马啸西风
  • azkaban 部署-azkaban 的部署和应用

    azkaban 部署-azkaban 的部署和应用

    第一步:包准备 首先我们先将Azkaban Web服务器、Azkaban执行服务器和MySQL统一拷贝到虚拟机/usr/local/src/azkaban目录下,具体的命令如下:[root@masterzkaban]#ll|awk'{print$NF}' 98600 azkaban-executor-server-2.5.0.tar.gz azkaban-sql-script...

    白马啸西风
  • cdhazkaban-cdhazkaban介绍、安装和使用

    cdhazkaban-cdhazkaban介绍、安装和使用

    工作流调度系统一个完整的数据分析系统大都是由海量的任务单元组成shell脚本程序,java,mapreduce程序、hive脚本等等组成,非常复杂,各任务单元之间存在时间先后及前后依赖关系。为了很好地组织起这样的复杂系统,能够按照计划执行,就必须要一个工作流调度系统来调度执行。例如,某个业务系统可能每天产生20G原始数据,我们每天都要对其进行处理。具体处理步骤如下所示:1. 通过Hadoop先将原...

    白马啸西风
  • cdhmanager-cdhmanager是什么

    cdhmanager-cdhmanager是什么

      Cloudera Manager属于Cloudera数据平台CDP其中的组件。cdhmanager是管理CDH集群的端到端应用程序,cdhmanager通过提高服务性能,增强服务质量,并且能够降低管理成本和提高合规性来提供对CDH集群每个部分的可见性和控制。    cdhmanager的特点  自动部署和配置  可以以快速启动和运行 Hadoop 和 Cloudera Enterpri...

    白马啸西风

最新活动

<