资讯专栏INFORMATION COLUMN

托管Hadoop集群-故障排查 UHadoop

ernest.wang / 2692人阅读

摘要:集群运行慢时,通常会在日志中可以查找到明显的异常,或者花费时间长的操作。检查集群节点的运行状态检查集群节点的运行状态管理群集上部署的各种服务。如果主节点遇到性能问题,整个群集都会受到影响。工作的不均衡分配可能会导致处理速度较慢。

故障排查

本篇目录

任务执行失败排查工具故障描述集群运行速度慢

任务执行失败

1.查看console输出日志

查看任务执行时控制台输出的log,检查是否有ERROR

2.查看任务执行日志

若任务为后台执行或定时任务,首先需要知道失败的任务ID,可通过获取日志详情分析日志报错(查询日志方法可见日志查看

Tips: 常见任务失败ERROR可参考常见任务ERROR

排查工具

1.查看监控

- 在集群的“监控视图”页面查看集群或者节点的监控数据,判断是否有异常。

2.查看服务日志

- 各个节点上的/var/log下面有各个服务的日志 - 通过web-yarn的页面或者hue可以查看到任务运行的日志情况

故障描述

1.问题描述

在向技术支持提交故障时,可以在提交信息中附带以下内容以便快速定位故障:

- 群集的标识符 - 启动群集的区域和可用区 - 如何操作会出现这个异常 - 异常的现象的具体描述

2.检查集群的配置修改

- 上一次正确运行的配置和环境变量是否有做修改。

3.检查日志

通常提交的任务可以在hadoop-yarn的界面可以看到,如无法查看任务通常有以下几种情况:

- spark任务用本地模式提交 - hive任务用本地提交(hive-server2默认会将一些小任务用本地模式跑)

集群运行速度慢

1.检查集群配置修改2.检查日志

- 检查任务日志,如果一个或多个失败任务,请调查对应的任务尝试的日志,以了解更详细的错误信息。 - 检查服务日志,在每个节点的/var/log目录下,每个服务都有各自的存档目录。集群运行慢时,通常会在日志中可以查找到明显的异常,或者花费时间长的操作。

3. 检查集群节点的运行状态

- master:管理群集上部署的各种服务。如果主节点遇到性能问题,整个群集都会受到影响。 - core:处理 map-reduce 任务,保持 Hadoop 分布式文件系统 (HDFS),hbase的regionserver。 - task:处理 map-reduce 任务。这些纯粹是计算资源,并不存储数据。您可以向群集添加任务节点,提高性能速度,或移除不需要的任务节点。

注解:在task节点运行的任务会通过网络从core节点上获取数据,所以在某些情况下增加task节点并不能够缩短任务的运行时间。

4. 检查输入数据

- 请查看您的输入数据。它是否在键值之间均匀分配? 如果您的数据严重偏向一个或几个键值,那么可能将处理负载映射到少量节点,而其他节点则闲置。工作的不均衡分配可能会导致处理速度较慢。 - 不平衡数据集的示例是,依据按字母顺序排列的词运行群集,但有一个数据集仅包含以字母“a”开始的词。当工作被映射时,以“a”开始的节点处理值会过量,而以其他字母开始的节点处理词会处于闲置状态。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/127198.html

相关文章

  • 托管Hadoop集群 快速上手 UHadoop

    摘要:也可以将托管集群设置为快捷方式,通过左侧快捷方式菜单栏点击进入。框架集群中仅部署。用于做存储集群,有专属的节点机型。节点管理节点,负责协调整个集群服务。目前仅节点支持绑定。通过云主机内网进行登录。登录密码为集群创建时设置的密码。 快速上手本篇目录创建集群提交任务本文档将带领您如何创建UHadoop集群,并使用UHadoop集群完成数据处理任务。创建集群本章简单介绍了用户使用UHadoop服务...

    ernest.wang 评论0 收藏295
  • 元数据管理 托管Hadoop集群 UHadoop

    摘要:架构架构元数据管理元数据管理元数据管理创建集群时可在控制台开启元数据独立管理。若项目中已开启过元数据独立管理,则新集群开启该功能时,不再创建新的,而是将新集群的元数据存储于已有的中。 元数据管理本篇目录介绍产品架构元数据管理介绍UHadoop 支持将 Hive-Metastore 的数据库独立于 Hadoop 集群部署,也支持多个集群访问同一个 Hive 元数据库,可在控制台对其做管理。产品...

    ernest.wang 评论0 收藏2953
  • 常用操作 托管Hadoop集群 UHadoop

    摘要:查看上的历史日志查看上的历史日志任务的日志在任务运行结束之后会上传到上,当日志文件过大无法通过来查看时,可以通过将日志文件从上下载下来查看。挂载在允许的主机上执行 常用操作本篇目录应用的Web接口查看日志配置NFS挂载hdfs到本地应用的Web接口Hadoop 提供了基于 Web 的用户界面,可通过它查看您的 Hadoop 集群。Web 服务会在主节点上运行(Active NameNode或...

    ernest.wang 评论0 收藏1142
  • 托管Hadoop集群多少钱UHadoop

    摘要:产品价格产品价格产品价格托管集群价格根据节点类型及配置不同,北京上海广州香港可用区详细价格如下,其他可用区价格请咨询技术支持。 产品价格托管 Hadoop 集群价格根据节点类型及配置不同 ,北京、上海、广州、香港可用区详细价格如下,其他可用区价格请咨询技术支持。 节点类型机型名称CPU内存(G)硬盘(G)华北一E价格(元/月)国内其他可用区价格(元/月)Master&​Task​计算优化实例...

    ernest.wang 评论0 收藏3047

发表评论

0条评论

ernest.wang

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<