大数据分布式处理_大数据分布式处理相关云计算内容

大数据平台

...rm（简称 USDP），是 UCloud 推出的云上智能化、轻量级的大数据基础服务平台，能够帮您快速构建起大数据的分析处理能力。 USDP 构建于 UCloud 的云服务上，无缝集成云端 IaaS 资源能力，通过自研的 USDP Manager 管理工具，支持用户...

立即购买论坛提问专栏学习 1对1咨询

大数据分布式处理分布式数据处理大数据大数据处理处理大数据大数据数据处理大数据处理数据

这样搜索试试？

大数据分布式处理问答精选换一批

大数据分布的架构怎么做调优呢？

回答:这个太范化了吧。大数据架构选择的方案就有很多，海量数据的即席查询本省就是业内目前的痛点，暂时没有太好的解决方案，kylin等框架也只是一个折中方案，如果你不是要求海量数据分析的秒级响应的话sparkSql、presto等都是不错的方案，分钟级别可以返回。

Paul_King | 753人阅读

回答:分布式处理，分布式系统(其实也包含分布式存储系统)一直把RAS、MTBF、MTTR等作为可靠性衡量指标，但是专业指标是CAP指标，可用性作为其中重要因素之一。CAP理论阐述了在分布式系统的设计中，没有一种设计可以同时满足一致性，可用性和分区容错性。所以一个好的分布式系统，必须在架构上充分考虑上述指标。分布式系统设计中，BASE理论作为CAP理论的折中或延伸，在分布式系统中被大量使用。分布式系统的可...

lolomaco | 1336人阅读

搭建私有云平台：Hadoop还是选择OpenStack？

回答:首先建议题主描述清楚应用场景，否则别人做的方案可能都不符合需求。就Hadoop和OpenStack的纠结而言，支撑数据分析用前者，做资源管理用后者。=================补充=============题主的需求，实质是搭建一个IoT实时大数据平台，而不是一般意义的私有云。IoTa大数据平台除了数据采集和结果反馈，其余部分和一般的大数据平台相差不多。OpenStack长于管理VM资源管理...

MonoLog | 1145人阅读

为什么SQL处理数据比Java快？

回答:使用SQL处理数据时，数据会在数据库内直接进行处理，而且sql处理本身可以对sql语句做优化，按照最优的策略自动执行。使用Java处理时，需要把数据从数据库读入到Java程序内存，其中有网络处理和数据封装的操作，数据量比较大时，有一定的延迟，所以相对来说数据处理就慢一些。当然，这个只是大体示意图，实际根据业务不同会更复杂。两者侧重的点不同，有各自适合的业务领域，需要根据实际情况选用合适的方式。

stefanieliang | 2263人阅读

你处理过的最大的数据量是多少？你是如何处理的？

回答:我是做JAVA后台开发的，目前为止最多处理过每天600万左右的数据！数据不算特别多，但是也算是经历过焦头烂额，下面浅谈下自己和团队怎么做的？后台架构:前置部门:负责接收别的公司推过来的数据，因为每天的数据量较大，且分布不均，使用十分钟推送一次报文的方式，使用batch框架进行数据落地，把落地成功的数据某个字段返回给调用端，让调用端验证是否已经全部落地成功的，保证数据的一致性！核心处理:使用了spr...

李增田 | 1890人阅读

大数据时代，如何理解“大数据”？

回答:目前阶段大数据技术及体系已经逐渐趋于成熟，不再是以概念贯穿的模式，大数据越来越多的被使用，伴随互联网化的发展更多的企业信息化已经由IT时代转变为DT时代，以数据为核心，用数据进行决策，基于数据驱动企业的创新与发展，相信在将来大数据也会有更广泛的应用空间，对于大数据的理解主要分为以下几个层面。1.数据来源：对于大数据时代而言更多强调基于业务数据的沉淀，在一定规模的数据上进行进一步的分析、处理、转换，...

arashicage | 1309人阅读

大数据分布式处理精品文章

《大数据技术原理与应用》第一章-大数据概述

...和数据处理与分析层，由此可概括的两大核心技术： ① 分布式存储解决海量数据的存储问题一台机器无法存储，我们就借助集群进行分布式存储 ② 分布式处理解决海量数据的处理问题一台机器无法高效完成数据处理，...

1fe1se 2021-11-22 09:34 评论0 收藏0
大数据是什么？

...储技术的发展变得步履蹒跚，赶不上数据发展的速度时，分布式存储成为了必然选择，非结构型数据也对存储格式提出了新的要求。层出不穷的数据源也使得数据量产生了井喷似的迅猛增长。此时分布式存储与NoSQL的诞生回应了...

DirtyMind 2019-06-26 18:25 评论0 收藏0
Chapter1 大数据概述

...析这两个层面。 1.4.2两大核心技术两大核心技术指的是分布式存储、分布式处理。分布式存储：解决海量数据的存储问题。单机无法存储海量数据时，就借助集群进行分布式存储。分布式处理：解决海量数据的处理问题。单...

Dean 2021-09-09 09:33 评论0 收藏0
学习Hadoop大数据基础框架

...统，可以多达几万台机器甚至更多。 Hadoop最初主要包含分布式文件系统HDFS和计算框架MapReduce两部分，是从Nutch中独立出来的项目。在2.0版本中，又把资源管理和任务调度功能从MapReduce中剥离形成YARN，使其他框架也可以像MapReduce...

amc 2019-08-16 13:42 评论0 收藏0
什么是大数据

...件框架，实现在大量计算机组成的集群中对海量数据进行分布式计算。Hadoop框架中最核心设计就是：HDFS和MapReduce。HDFS提供了海量数据的存储，MapReduce提供了对数据的计算。Hadoop的发行版除了社区的Apache hadoop外，cloudera，hortonwork...

learn_shifeng 2019-08-16 13:40 评论0 收藏0
大数据分析技术与应用

...析技术常见的大数据分析技术主要由以下几部分构成：分布式的文件系统存储海量的非结构化数据（例如：hdfs等）分布式的离线计算系统，对业务数据批量处理。（例如：mapreduce等）分布式的实时计算系统，实时对业务数据...

shinezejian 2019-06-26 18:41 评论0 收藏0