资讯专栏INFORMATION COLUMN

cdh是什么意思

白马啸西风 / 2902人阅读

CDHCloudera Distribution for Hadoop 的缩写,是一种用于大数据处理的开源软件平台。它是基于 Apache Hadoop 项目的,包含了 Hadoop 的所有组件,并提供了一系列的工具和服务来帮助用户更方便地使用 HadoopCDH 支持在分布式环境下运行,可以帮助企业处理大量的数据,比如日志数据、网站流量数据等。它还提供了可视化工具,帮助用户对数据进行分析和挖掘。

image.pngCDH 版本的 Hadoop大数据平台的优势在于:
1)基于 Apache 协议 ,100%开源,版本管理清晰。
2)在兼容性、安全性 、稳定性上比 Apache Hadoop 有大幅度的增强。
3)运维简单方便 ,对于 Hadoop 集群提供管理、诊断、监控、配置更改等功能,使得运维工作非常高效,而且集群节点越多 ,优势越明显。
4CDH 提供成体系的文档、很多大公司的应用案例以及商业支持等。

Cloudera Manager(CM)是由 Cloudera 公司提供的大数据组件自动部署和监控管理工具。 CDHCloudera 公司在 Apache Hadoop 社区版的基础上做了商业化封装的大数据平台。 Cloudera ManagerGUI 的方式管理 Cloudera Hadoop 集群,井提供向导式的安装步骤。

 

CDH 是一种开源软件平台,主要用于大数据处理。它基于 Apache Hadoop 项目,包含了 Hadoop 的所有组件,比如 Hadoop 分布式文件系统(HDFS)、MapReduce 分布式计算框架、YARN 资源管理系统等。CDH 还包含了许多其他的工具和服务,比如 Apache Impala 分布式 SQL 查询引擎、Apache Flume 日志收集系统、Apache Sqoop 数据导入/导出工具等。

CDH 可以在分布式环境下运行,支持在多台机器上并行处理大量的数据。这对于处理海量的日志数据、网站流量数据等非常有用。CDH 还提供了可视化工具,帮助用户对数据进行分析和挖掘,比如 Cloudera Manager Cloudera Navigator

CDH 是由公司 Cloudera 提供的,它提供了商业版和社区版两种版本。商业版提供了更多的支持和服务,但是需要付费使用。社区版是完全免费的,但是只提供最基本的功能。

CDH 在大数据处理领域非常流行,因为它提供了一套完整的解决方案,能帮助企业快速处理大数据解决方案。


文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/128447.html

相关文章

  • 什么CDH Spark2

       CDH 包括除 Apache Hadoop 之外的许多其他开源工具和技术,例如 Apache Spark,它是一种用于大规模数据处理的快速灵活的数据处理引擎。  CDH Spark2 是 Apache Spark 的一个版本,包含在 Cloudera Distribution for Apache Hadoop (CDH) 中。它是一个强大而灵活的数据处理引擎,非常适合广泛的数据处理任务...

    白马啸西风 评论0 收藏0
  • 什么cdhkerberos

      在CDH集群中,Kerberos常用于为HDFS(Hadoop分布式文件系统)、YARN(Yet Another Resource Negotiator)等Hadoop服务提供安全认证。Kerberos 是一种网络身份验证协议,它使用密钥加密来安全地验证用户和服务。使用 Kerberos,用户必须先使用一组凭据(通常是用户名和密码)向 Hadoop 集群验证自己的身份,然后才能访问集群上的...

    白马啸西风 评论0 收藏0
  • Maven 学习

    摘要:指令通过将本地工程打包成包,放入到本地仓库中在整合或者发布环境下执行,将最终版本的包拷贝到远程的仓库,使得其他的开发者或者工程可以共享。比如父在标签中导入依赖,但是子没有导入该依赖,就会引用不到相关类 指令 mvn test mvn installmaven通过install将本地工程打包成jar包,放入到本地仓库中 mvn deploy在整合或者发布环境下执行,将最终版本的包拷...

    Jason 评论0 收藏0

发表评论

0条评论

白马啸西风

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<