大数据分布式处理SEARCH AGGREGATION

首页/精选主题/

大数据分布式处理

大数据平台

...rm(简称 USDP),是 UCloud 推出的云上智能化、轻量级的大数据基础服务平台,能够帮您快速构建起大数据的分析处理能力。 USDP 构建于 UCloud 的云服务上,无缝集成云端 IaaS 资源能力,通过自研的 USDP Manager 管理工具,支持用户...

大数据分布式处理问答精选

大数据分布的架构怎么做调优呢?

回答:这个太范化了吧。大数据架构选择的方案就有很多,海量数据的即席查询本省就是业内目前的痛点,暂时没有太好的解决方案,kylin等框架也只是一个折中方案,如果你不是要求海量数据分析的秒级响应的话sparkSql、presto等都是不错的方案,分钟级别可以返回。

Paul_King | 636人阅读

分布式处理、分布式存储方面新的研究方向有哪些?

回答:分布式处理,分布式系统(其实也包含分布式存储系统)一直把RAS、MTBF、MTTR等作为可靠性衡量指标,但是专业指标是CAP指标,可用性作为其中重要因素之一。CAP理论阐述了在分布式系统的设计中,没有一种设计可以同时满足一致性,可用性和分区容错性。所以一个好的分布式系统,必须在架构上充分考虑上述指标。分布式系统设计中,BASE理论作为CAP理论的折中或延伸,在分布式系统中被大量使用。分布式系统的可...

lolomaco | 1179人阅读

搭建私有云平台:Hadoop还是选择OpenStack?

回答:首先建议题主描述清楚应用场景,否则别人做的方案可能都不符合需求。就Hadoop和OpenStack的纠结而言,支撑数据分析用前者,做资源管理用后者。=================补充=============题主的需求,实质是搭建一个IoT实时大数据平台,而不是一般意义的私有云。IoTa大数据平台除了数据采集和结果反馈,其余部分和一般的大数据平台相差不多。OpenStack长于管理VM资源管理...

MonoLog | 1034人阅读

为什么SQL处理数据比Java快?

回答:使用SQL处理数据时,数据会在数据库内直接进行处理,而且sql处理本身可以对sql语句做优化,按照最优的策略自动执行。使用Java处理时,需要把数据从数据库读入到Java程序内存,其中有网络处理和数据封装的操作,数据量比较大时,有一定的延迟,所以相对来说数据处理就慢一些。当然,这个只是大体示意图,实际根据业务不同会更复杂。两者侧重的点不同,有各自适合的业务领域,需要根据实际情况选用合适的方式。

stefanieliang | 1944人阅读

你处理过的最大的数据量是多少?你是如何处理的?

回答:我是做JAVA后台开发的,目前为止最多处理过每天600万左右的数据!数据不算特别多,但是也算是经历过焦头烂额,下面浅谈下自己和团队怎么做的?后台架构:前置部门:负责接收别的公司推过来的数据,因为每天的数据量较大,且分布不均,使用十分钟推送一次报文的方式,使用batch框架进行数据落地,把落地成功的数据某个字段返回给调用端,让调用端验证是否已经全部落地成功的,保证数据的一致性!核心处理:使用了spr...

李增田 | 1355人阅读

大数据时代,如何理解“大数据”?

回答:目前阶段大数据技术及体系已经逐渐趋于成熟,不再是以概念贯穿的模式,大数据越来越多的被使用,伴随互联网化的发展更多的企业信息化已经由IT时代转变为DT时代,以数据为核心,用数据进行决策,基于数据驱动企业的创新与发展,相信在将来大数据也会有更广泛的应用空间,对于大数据的理解主要分为以下几个层面。1.数据来源:对于大数据时代而言更多强调基于业务数据的沉淀,在一定规模的数据上进行进一步的分析、处理、转换,...

arashicage | 1163人阅读

大数据分布式处理精品文章

  • 数据技术原理与应用》第一章-数据概述

    ...和数据处理与分析层,由此可概括的两大核心技术: ① 分布式存储 解决海量数据的存储问题 一台机器无法存储,我们就借助集群进行分布式存储 ② 分布式处理 解决海量数据的处理问题 一台机器无法高效完成数据处理,...

    1fe1se 评论0 收藏0
  • 数据是什么?

    ...储技术的发展变得步履蹒跚,赶不上数据发展的速度时,分布式存储成为了必然选择,非结构型数据也对存储格式提出了新的要求。层出不穷的数据源也使得数据量产生了井喷似的迅猛增长。此时分布式存储与NoSQL的诞生回应了...

    DirtyMind 评论0 收藏0
  • Chapter1 数据概述

    ...析这两个层面。 1.4.2两大核心技术 两大核心技术指的是分布式存储、分布式处理。 分布式存储:解决海量数据的存储问题。单机无法存储海量数据时,就借助集群进行分布式存储。 分布式处理:解决海量数据的处理问题。单...

    Dean 评论0 收藏0
  • 学习Hadoop数据基础框架

    ...统,可以多达几万台机器甚至更多。 Hadoop最初主要包含分布式文件系统HDFS和计算框架MapReduce两部分,是从Nutch中独立出来的项目。在2.0版本中,又把资源管理和任务调度功能从MapReduce中剥离形成YARN,使其他框架也可以像MapReduce...

    amc 评论0 收藏0
  • 什么是数据

    ...件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。Hadoop框架中最核心设计就是:HDFS和MapReduce。HDFS提供了海量数据的存储,MapReduce提供了对数据的计算。Hadoop的发行版除了社区的Apache hadoop外,cloudera,hortonwork...

    learn_shifeng 评论0 收藏0
  • 数据分析技术与应用

    ...析技术 常见的大数据分析技术主要由以下几部分构成: 分布式的文件系统存储海量的非结构化数据(例如:hdfs等) 分布式的离线计算系统,对业务数据批量处理。(例如:mapreduce等) 分布式的实时计算系统,实时对业务数据...

    shinezejian 评论0 收藏0

推荐文章

相关产品

<