资讯专栏INFORMATION COLUMN

大数据简介

Tecode / 1936人阅读

摘要:一什么是大数据在互联网技术发展到至今阶段,大量日常,工作等事务产生的数据都已经信息化,人类产生的数据量相比以前有了爆炸式的增长,以前传统的数据处理技术已经无法胜任,需求催生技术,一套用来处理海量数据的技术应运而生,这就是发数据技术。

一、什么是大数据
在互联网技术发展到至今阶段,大量日常,工作等事务产生的数据都已经信息化,人类产生的数据量相比以前有了爆炸式的增长,以前传统的数据处理技术已经无法胜任,需求催生技术,一套用来处理海量数据的技术应运而生,这就是发数据技术。

梳理海量数据的核心技术:

海量数据的储存(分布式)
海量数据的运算(分布式)
这些核心技术的实现是不需要用户从零开始造轮子的储存和运算的都已经有大量的承受的框架来用。

储存框架:

HDFS–分布式文件储存系统
HBase–分布式数据库系统
Kafka – 分布式消息缓存系统(实时流式数据处理场景中应用广泛)
运算框架:(要解决的核心问题就是帮用户将处理逻辑在许多机器上并行执行)

Hive – 数据仓库工具:可以接收SQL,翻译成mapreduce或者spark程序运行
Flume – 数据采集
Sqoop – 数据迁移
Elisticsearch – 分布式的搜索引擎

换个角度说,大数据是:
有海量的数据
有海量的数据进行挖掘的需求,有对海量数据进行挖掘的工具(Hadoop、spark等)
大数据在现实生活中的具体应用
数据处理测最典型应用:公司的产品运营情况分析
电商推荐系统:基于海量的浏览行为,购物行为数据,进行大量的模型的运算,得出各种推荐结论,一共电商网站页面来为用户进行商品推荐,(猜你喜欢)

精准广告推送系统:基于海量的互联网用户的各类数据,统计分析,进行用户画像(得到用户的各种属性标签),然后可以为广告主进行有针对性的进准的广告投放。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/125919.html

相关文章

  • 功能简介 智能数据平台 USDP

    摘要:功能简介功能简介功能简介本篇目录一功能点概述一功能点概述二支持的大数据生态服务二支持的大数据生态服务一功能点概述一功能点概述一功能点概述支持友好的浏览器管理控制台支持集群节点管理,如节点监控资源使用率节点状态等支持集群大数据服务的服 功能简介本篇目录一、功能点概述二、支持的大数据生态服务一、功能点概述支持友好的Web浏览器管理控制台;支持集群节点管理,如节点监控、资源使用率、节点状态等;支持...

    ernest.wang 评论0 收藏2278
  • 数据入门指南(GitHub开源项目)

    摘要:项目地址前言大数据技术栈思维导图大数据常用软件安装指南一分布式文件存储系统分布式计算框架集群资源管理器单机伪集群环境搭建集群环境搭建常用命令的使用基于搭建高可用集群二简介及核心概念环境下的安装部署和命令行的基本使用常用操作分区表和分桶表视图 项目GitHub地址:https://github.com/heibaiying... 前 言 大数据技术栈思维导图 大数据常用软件安装指...

    guyan0319 评论0 收藏0
  • 产品概述 智能数据平台 USDP

    摘要:产品概述产品概述产品概述本篇目录产品特点产品特点功能简介功能简介操作指南操作指南开发指南开发指南任务调度任务调度产品价格产品价格简称,是推出的云上智能化轻量级的大数据基础服务平台,能够帮您快速构建起大数据的分析处理能力。 产品概述本篇目录产品特点功能简介操作指南开发指南任务调度产品价格UCloud Smart Data Platform(简称 USDP),是 UCloud 推出的云上智能化、...

    ernest.wang 评论0 收藏441
  • 前端必备资源整理

    摘要:资源不断更新中。。。主页前端工具简介虽然不是第一个任务执行工具,它却很快成为了最受欢迎的。官方网站网易框架是网易推出的开源前端框架,提供了丰富代码库和插件,可以极大的帮助开发人员提高开发效率。 资源不断更新中。。。 动画库1.Animate.css说明:一个简单易用的跨浏览器CSS动画库。GitHub主页: https://github.com/daneden/an... 2.CSSh...

    JiaXinYi 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<