{eval=Array;=+count(Array);}
大数据是我的研究方向之一,所以我来回答一下这个问题。
大数据专业是一个非常新的专业,早期有的学校开设了数据科学专业,后来随着条件逐步成熟,一部分高校开设了大数据专业。大数据专业的教学内容主要集中在三个方面,一个方面是数学,因为大数据需要用到大量的算法,所以数学基础对大数据研发人员来说还是非常重要的。一方面是统计学,大数据的很多内容是统计学的延伸,尤其是大数据分析领域。还有一方面是计算机技术,大数据是物联网和云计算发展的必然产物,所以大数据的基础就是计算机网络技术。
大数据专业毕业的学生就业面非常广,由于目前大数据正在由概念向产业转换,所以大部分大数据专业的毕业生都在从事大数据平台工程师的岗位,主要任务是搭建企业的大数据平台以及开发一些平台上的具体功能。
当然,未来大数据岗位涉及到算法分析师、算法实现工程师、数据分析师、BI工程师(还有很多细分岗位)、数据工程师(采集、整理等)、程序员等。
由于目前大数据领域的人才缺口比较大,所以目前从事大数据岗位的工程师待遇都非常不错,相信在未来很长一段时间内,大数据相关岗位的待遇会明显高于软件行业平均水平。
另外,建议大数据专业的本科生继续读研,读研会提供一个更好的研究平台,也会明显提升自己的职场竞争力。
我目前在带大数据团队做一些落地项目,我会陆续在头条上写一些大数据相关的科普文章,感兴趣的朋友可以关注我的头条号,相信一定会有所收获。
如果有大数据方面的问题,或者是考研方面的问题,都可以咨询我。
谢谢!
本人从事大数据以及相关行业,从目前大数据实际运用的角度来说一下这个问题。以下是我整理的近年来大数据相关好岗位以及岗位职责,技能需求需求,供参考
一,大数据开发
从事大数据开发工程师
岗位职责
1、利用Hadoop、Spark等技术在分布式系统上对海量历史数据进行预处理,挖掘用户信
息;
2、参与大数据基础平台的搭建和维护;
3、负责广告投放项目管理平台研发;
4、负责大数据计算处理平台项目研发。
技术要求
1、熟练掌握c++/Java开发,具备扎实的程序设计基本功和学习能力
2、熟悉 Linux,熟悉 shell/perl/python/php 等脚本语言的一种或多种。
3、熟悉传统数据库MySQL。
4、熟悉MapReduce、Storm、Spark、Spark Streaming等大数据开发工具,对源代码
有一定研究者优先;
5、熟悉linux环境,熟悉shell等脚本编程;
6、有大规模数据处理和日志处理经验的优先。
7、有较强的人际沟通、协调能力,具备与技术人员沟通数据需求的能力;
8、具备良好的逻辑分析能力和解决实际问题的能力。
二,大数据运维
从事大数据运维工程师
岗位职责
1、负责大数据平台整体软硬件的日常运维;
2、分析平台运行状态,进行性能优化;
3、负责大数据平台运行故障的分析、定位和解决;
4、负责新技术、新组件的技术探索、测试和应用;
5、支撑运维自动化系统的设计和开发。
岗位要求:
1、 熟悉hadoop生态圈主要开源技术组件及其工作原理,能阅读相关源代码,能顺利阅读英文文档;
2、熟悉软硬件设备、网络原理,有丰富的大数据平台部署、性能优化和运维经验;
3、熟悉Linux,熟悉cacti、ganglia、zabbix等运维软件,熟悉SaltStack、Ansible等自动化软件,有python、java、shell编程基础;
4、工作认真负责,有较强的学习能力、动手能力和分析解决问题的能力;
补充:
熟悉
Hadoop/Hbase/Hive/Presto/Yarn/Spark/Storm/Kafka/Elasticsearch/Flume等开源项目,有运维优化经验者优先;
熟悉Linux操作系统的配置、管理及优化;
熟悉Python、Linux、shell,有ETL维护经验、电信行业大数据维护经验者优先
三,数据挖掘
从事数据挖掘工程师
岗位职责
1、对海量数据进行分析,建立数据挖掘算法,利用大数据对产品进行研究和建模,为用户提供评估和预测等功能;
2、参与/负责用户画像、推荐等系统搭建,参与核心产品推荐场景算法的研发和优化;
3、采用先进的数据挖掘和机器学习算法,为公司业务部门提供决策依据;
4、搭建数据挖掘系统和机器学习系统,实现智能平台的自动化流程。
1、具备强悍的编码能力,有扎实的数据结构和算法功底;
2、优秀的学习能力、独立分析问题和解决问题能力;
3、熟悉Linux开发环境,熟悉Python,PHP,Java等语言两种以上;
4、熟悉基本的数据分析方法、数据挖掘、机器学习算法;
5、熟悉SPSS/Modeler/R/Python等至少一种数据挖掘工具;
6、熟悉Hadoop/Spark,有Elasticsearch,Solr,Kafka,Flume等开源项目使用经验
7、有画像、广告、推荐,搜索等算法方向实际工作经验优先
四,BI(商务智能)工程师— (包括数据库开发、BI开发工程师、ETL开发、报表开发、BI咨询顾问)
岗位职责
1、独立负责业务数据收集整理,构建经营分析和报表系统;
2、通过专题分析,对业务问题进行深入分析,为业务的策略、产品优化提供数据支持;
3、 以数据驱动业务为目标,进行数仓研发工作但不局限于数仓;
4、 参与数据仓库ETL设计、开发和优化工作,保证数据准确、稳定、组织合理
岗位要求
1、掌握Oracle、MySQL、ODPS等数据库开发技能,熟练应用开发、数据库原理和常用性能优化和扩展技术;
2、掌握数据仓库建设、熟悉大数据平台操作,离线计算Hive/MR研发、实时计算spark streaming/storm;
3、熟悉ETL逻辑、OLAP设计和数据分析技术(聚类分析、回归分析、决策树等)、数据挖掘相关算法;
4、熟悉Linux系统环境开发,掌握shell、perl、python等至少一种开发语言。
6. 有较强的逻辑/概率思维能力,善于分析、归纳、描述、沟通、和解决问题。
补充(根据企业工具区别)
1、全面熟知数据仓库设计理念、设计方法,熟练掌握Informatica、Kettle、Automation等至少一种ETL工具;
2、熟练掌握SAP BO、MSTR、SmartBI、Cognos、QV等至少一种BI工具;
3、熟悉数据仓库,掌握BI相关工具,如ETL工具(SSIS, SAP DataService)、OLAP工具(SSAS)和前端展示工具(BO CR/Webi)
五,数据可视化
从事可视化工程师
岗位职责
1、负责大数据平台业务逻辑和数据可视化功能,数据可视化组件研发;
2、搭建基础的可视化分析平台,设计数据分析应用的架构,实现实时数据调用与展示;
3、数据相关性分析与根因分析;
4、支持客户需求分析和数据分析。
岗位要求
1、熟练Web前端技术(SVG/HTML5/JavaScriptdeJS等);
2、熟练D3、Echarts、Three.js、WebGL等开源数据可视化库和技术;
3、有Web服务器端编程语言(如Node/Java)开发经验优先;
4、有blender(以及blender game engine)或者unity 3d或unreal engine等开发经验优先
一些BI岗位的详细介绍
BI工程师(开发、咨询、实施)
BI开发工程师
岗位职责
1、执行在框架设计的基础上完成具体组件的概要设计、详细设计编写;
2、完成BI系统具体组件的代码编写、单元测试;
3、参与BI系统报表平台技术架构设计,数据库结构设计;
4、参与BI系统数据仓库的构架、建模和实现。
5、负责向需求方提供数据及业务分析服务,负责整体风控模型的优化,理解并掌握BI报表需求;
岗位要求
1、有数据仓库或统计分析类项目开发经验或较深的理论知识;
2、熟悉Cognos、Webfocus、ireport等数据分析报表开发工具和技术;
3、熟悉Linux/Unix服务器,并了解一些基本的操作命令;
4、至少熟悉Informix/Oracle/SQL Server等数据库中的一种,并在此基础上有过ETL程序或存储过程的开发。
5、能够熟练应用JSP/Servlet/JavaScript等WEB开发技术,熟悉Spring,Struts2和iBATIS等主流的开发框架,熟悉BIRT、JasperReports等开源报表工具;
6、熟悉Linux Shell、Perl等脚本语言,熟悉ORACLE数据库,PL/SQL编程;
7、熟悉BI系统技术框架,熟悉数据采集流程,对数据仓库有比较深入的了解;
8、熟悉行业经营分析系统(BI)架构及实现者优先。
BI咨询顾问
岗位职责
1、分析客户的数据要求;
2、负责Qlikview/Tableau BI项目的实施和报表开发;
3、负责校验数据,保障数据的准确;
4、 负责客户需求收集、分析,梳理业务流程解决方案,项目的拓展支撑;
5、撰写需求规格书及各类相关文档;
6、良好的团队合作、协调、问题处理能力;
岗位要求
1、对BI有系统的认知;
2、熟练使用Qlikview,Tableau等前端工具;
3、熟悉MS SQL Server,熟练运用SQL语言;
4、前端报表偏业务方向需熟悉主流报表工具或新兴前端报表工具Qlikview、Tableau等优先考虑;
6、后台数据处理需熟悉掌握至少一种后台ETL开发工具,例:Informatica powercenter、Datastage、OWB、微软DTS、Kettle等;
7、后台数据建模需熟练掌握至少一种数据挖掘算法和建模方法,了解建模;
8、良好的英文能力,能快速阅读和撰写英文技术文档者优先。
BI实施工程师
岗位职责
1、负责BI项目的需求调研与分析工作;
2、负责BI项目的方案设计、实施或项目管理工作;
3、参与公司BI产品和项目的实施开发工作。
岗位要求
1、良好的数据库基础,精通SQL,深入掌握Oracle或其他数据库,能够进行数据库调优;
3、熟悉ORACLE、MYSQL、SQLSERVER等主流数据库的安装及配置、熟悉SQL语句编写及ETL、BI实施工作;
3、熟悉LINUX操作系统安装及常用命令;
4、熟悉BI基础理论知识,使用过BI相关产品;
5、参与BI相关项目的实施工作;
6、熟悉TOMCAT、JDK等安装及参数配置;
7、具备较强的语言表达能力,能与客户顺畅沟通或产品介绍;
8、具备较强的学习与动手能力,能够适应全国范围内出差;
9、熟悉hadoop大数据及自动化运维工具经验者的待遇从优。
ETL工程师
岗位要求:
具备一般的JAVA应用开发能力;
熟悉Oracle下的分区,表空间, SQL性能调优等操作;
熟悉常用的ETL工具,如:kettle, informatica等;
熟悉常用的报表工具,如:Cognos等。
岗位职责:
负责行业生产交易系统数据仓库开发,存储过程编写,数据模型研究,大数据研究
六,数据分析工程师
岗位职责:
1、进行业务和企业经营行为分析,梳理业务规律和业务需求;
2、将业务需求转化为数据需求,发现数据应用场景,梳理指标体系;
3、使用合适的数据分析工具进行数据分析和模型设计;
4、提出基于数据的结果和分析建议,根据分析结果进行行业研究、评估和预测;
5、编写数据分析报告;
6、完成领导交办的其他工作。
岗位要求
1、本科以上学历,计算机、数学、统计学等相关专业;
2、深刻理解大数据分析原理及相关应用;
3、熟练掌握主流数据库技术;
4、精通数据分析、挖掘工具与方法,如SAS、R、Python、EXCEL等;
5、敏锐的数据观察和分析能力,及时发现和分析其中隐含的变化和问题并给出建议;
6、良好的沟通能力和团队精神,较强的学习能力,能承担一定的工作压力;
互联网是一个快速发展的行业,如果你刚上大学,可能四年出来就会有变化!所以还是注意相关咨询!希望能够帮到你,欢迎关注,讨论
1、大数据开发工程师
开发,建设,测试和维护架构,负责公司大数据平台的开发和维护,负责大数据平台持续集成相关工具平台的架构设计与产品开发等
2、数据分析师
收集,处理和执行统计数据分析;运用工具,提取、分析、呈现数据,实现数据的商业意义,需要业务理解和工具应用能力
3、数据挖掘工程师
数据建模、机器学习和算法实现;商业智能,用户体验分析,预测流失用户等;需要过硬的数学和统计学功底以外,对算法的代码实现也有很高的要求
4、数据架构师
需求分析,平台选择,技术架构设计,应用设计和开发,测试和部署;高级算法设计与优化;数据相关系统设计与优化,需要平台级开发和架构设计能力
5、数据科学家
数据挖掘架构、模型标准、数据报告、数据分析方法;利用算法和模型提高数据处理效率、挖掘数据价值、实现从数据到知识的转换。等等。
加米谷大数据培训,6月大数据开发0基础班、提高班,预报名中
相关:大数据培训相关的职业岗位及主要工作内容
https://www.toutiao.com/i6642200037784814094/
第一次工业革命是机械化,第二次电气化,第三次信息化,第四次智能化。这次的工业革命从规模,从对每个人的生活、对整个社会的影响的广泛性和深度,都要远远大于前几次。在技术上来讲,核心技术是通过数据来观察世界,通过数据来获取知识。
站在浪尖上面临150万的人才紧缺的大数据。
大数据主要分成三大类:大数据系统研发类、大数据应用开发类、大数据分析类,岗位包括大数据系统架构、大数据开发、大数据系统分析、数据分析、数据挖掘、大数据可视化、数据库管理、数据迁移等。
据有关媒体报道,目前行业最稀缺的人才:
1、java大数据开发
2、大数据精准营销
3、大数据分析师(金融企业急需和紧缺的,尤为突出)
4、数据架构师
当下最热门的岗位两大类:一类是应用类,另一类是系统类。
应用类
应用类,偏向于数据分析和数据应用,经常说到的数据分析、数据挖掘,就是典型的应用技术。这一类职位,要求采用适当的分析和挖掘方法对数据进行分析,提取数据中隐含的业务信息,来支撑企业决策。
最典型的职位就是:大数据分析师。
主要岗位有:
1、大数据分析师:主要是指,基于业务问题,能够选择最合适的数据分析和数据挖掘方法,提取数据中的业务信息,从而支撑业务决策。要求熟悉数据分析/挖掘过程,掌握数据分析/挖掘方法,理解数据分析模型,熟练操作数据分析工具(比如Excel、SPSS、SAS等)。一般对于大数据分析师,其能力要求比较全面,不管是业务逻辑、还是分析方法、模型、可视化,都要求全面掌握。
2、业务数据分析师:侧重于商业理解,要求能够将业务问题和商业问题,转化为大数据的问题,并将分析结果从业务层面进行解读,从而形成业务建议和业务策略。要求熟悉业务逻辑和业务模型,掌握数据分析思路,能将数据可视化,对数据解读等。当然,类似的职位还有大数据观察员、大数据研究员等等,这些都侧重于商业理解。
3、大数据建模/算法师:侧重于数据建模,能够围绕业务问题,构建合适的数据分析框架和分析模型,将业务问题进行分解,从而达到定性或定量来描述业务的目的。要求熟悉数据建模、模型评估、模型优化、模型应用等等。
4、大数据算法师:侧重于数据模型的实现算法研究、设计与实现,为达到分析目的,对实现算法进行分析、选择与优化,确保实现性能及效果。一般情况下,算法师往往和建模师在一起工作。
系统类
系统类,偏向于系统研发,比如Hadoop系统、云计算,就属于系统类技术。这一类职位,要求熟悉Hadoop大数据平台的核心框架和组件,能够基于大数据平台来写代码开发应用,支撑业务应用。
最典型的职位就是:大数据工程师。
1、大数据开发工程师:负责大数据系统的开发工作,能够运用编程语言进行应用程序的开发、测试和维护,实现产品功能。要求掌握编程语言,如JAVA、R、Python等等。
2、大数据架构师:负责大数据系统的平台架构设计、平台构建。要求熟悉Hadoop/Storm/Spark等平台,熟悉整个生态系统的组件,有平台级开发和架构设计能力等等。
3、大数据运维工程师:侧重于大数据平台运维管理,包括系统运维规划、系统监控、系统优化等等,保障大数据平台服务的稳定性和可用性。掌握平台各组件的安装、配置与调试,有良好的系统性能优化及故障排除能力。
4、大数据库管理员:侧重于数据库/数据倒仓库的设计、开发、管理和优化,监控数据库的性能、故障检测和排除,包括数据采集,数据库架构设计,空间和容量规划,性能优化,数据安全和隐私,数据容错,等等。
当然,在不同的企业中,职位的名称和叫法有所不同,或者会衍生出新的职位,但基本的岗位职责是类似的。
1、大数据系统架构师
大数据平台搭建、系统设计、基础设施。
技能:计算机体系结构、网络架构、编程范式、文件系统、分布并行处理等。
年薪百万百度大数据架构师需要掌握什么技术?
大数据极为庞大。如今每天为我们创造出约2.3万亿GB数据,这意味着数据世界每两年都将增长一倍。那么,展望即将到来的2018年,大数据领域会出现哪些变化?这些变化又会给我们造成怎样的影响!
(1)、我们终将利用暗数据;
(2)、 结构化与非结构化边界的消失;
(3)、CDO快速崛起;
(4)、量子计算进入公众视野。
那么,大数据架构师需要掌握什么技术?
(1)、统计分析
大数定律、抽样推测规律、 秩和检测 、回归分析、方差分析等
(2)、可视化辅助工具
Excel 、PPT、Xmind 、Visio
(3)、大数据处理框架
Hadoop 、 Kaffka、Storm 、ELK、Spark
(4)、数据库
SQlite 、MySQL 、MongoDB 、Redis 、Cassandra 、HBase
(5)、数据仓库/商业智能
SSIS数据仓库、SSAS MDX多维数据表Ssrs、DW2.0
(6)、数据挖掘工具
Matlab、SAS、SPSS、R、Python
(7)、人工智能/挖掘算法
机器学习、数据结构一致性、常用算法
(8)、编程语言
Python、R、Ruby、Java
2、大数据系统分析师
面向实际行业领域,利用大数据技术进行数据安全生命周期管理、分析和应用。
技能:人工智能、机器学习、数理统计、矩阵计算、优化方法。
3、大数据开发工程师
围绕大数据系平台系统级的研发人员, 熟练Hadoop、Spark、Storm等主流大数据平台的核心框架。深入掌握如何编写MapReduce的作业及作业流的管理完成对数据的计算, 熟练掌握Hadoop整个生态系统的组件如: Yarn,HBase、Hive、Pig等重要组件,能够实现对平台监控、辅助运维系统的开发。
通过学习一系列面向开发者的Hadoop、Spark等大数据平台开发技术,掌握设计开发大数据系统或平台的工具和技能,能够从事分布式计算框架如Hadoop、Spark群集环境的部署、开发和管理工作,如性能改进、功能扩展、故障分析等。
4、数据分析师
不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。在工作中通过运用工具,提取、分析、呈现数据,实现数据的商业意义。
作为一名数据分析师,至少需要熟练SPSS、STATISTIC、Eviews、SAS、大数据魔镜等数据分析软件中的一门,至少能用Acess等进行数据库开发,至少掌握一门数学软件如matalab、mathmatics进行新模型的构建,至少掌握一门编程语言。总之,一个优秀的数据分析师,应该业务、管理、分析、工具、设计都不落下。
5、数据挖掘工程师
做数据挖掘要从海量数据中发现规律,这就需要一定的数学知识,最基本的比如线性代数、高等代数、凸优化、概率论等。经常会用到的语言包括Python、Java、C或者C++,我自己用Python或者Java比较多。有时用MapReduce写程序,再用Hadoop或者Hyp来处理数据,如果用Python的话会和Spark相结合。
6、大数据实施工程师:能熟练架设数据库.大数据分析生态系统,通过Hive编写常见的 MapReduce程序。
7、用户交互技术工程师
大数据所提供的用户交互方式主要有五种类型,分别是统计分析和数据挖掘、任意查询和分析、立方体分析、企业报表、报表分发和预警,它们在交互程度和用户群类型及规模上各有差异。
8、大数据可视化工程师
随着大数据在人们工作及日常生活中的应用,大数据可视化也改变着人类的对信息的阅读和理解方式。从百度迁徙到谷歌流感趋势,再到ucloud云推出县域经济可视化产品,大数据技术和大数据可视化都是幕后的英雄。
9、大数据采集与管理师
大数据浪潮,汹涌来袭,与互联网的发明一样,这绝不仅仅是信息技术领域的革命,更是在全球范围加速企业创新、引领社会变革的利器。现代关系学之父德鲁克有言,预测未来最好的方法,就是去创造未来。而“大数据战略”,则是当下领航全球的先机。“大数据”(BigData)指一般的软件工具难以捕捉、管理和分析的大容量数据。“大数据”之“大”,并不仅仅在于“容量之大”,更大的意义在于:通过对海量数据的交换、整合和分析,发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。“大数据”能帮助企业找到一个个难题的答案,给企业带来前所未有的商业价值与机会。大数据同时也给企业的IT系统提出了巨大的挑战。通过不同行业的“大数据”应用状况,我们能够看到企业如何使用大数据和云计算技术,解决他们的难题,灵活、快速、高效地响应瞬息万变的市场需求。
10、数据安全师
从事数据安全的系统管理与监测工作,数据安全在大数据行业极为重要,因此数据安全师的地位远远高于线下生活中保安的地位。
11、数据营销师
大家一看不算很新,但是实际上这个职位与过去的营销岗位除了有相近的传播、推广、沟通说服与信息汇集的功能以外,在今天的数据营销师会遇到的最大问题是客户提出了问题,而这个问题或者需求是原来的大数据产品或者技术不能完全解决的,因此营销过程带有较强的探索性沟通与寻求合作研发的特性。
同时,数据营销师往往需要一定的架构能力,而且能够理解数据架构的逻辑,从而能够创造性地推广前沿性的数据产品与服务。
12、数据科学家
数据科学家是指能采用科学方法、运用数据挖掘工具对复杂多量的数字、符号、文字、网址、音频或视频等信息进行数字化重现与认识,并能寻找新的数据洞察的工程师或专家(不同于统计学家或分析师)。一个优秀的数据科学家需要具备的素质有:懂数据采集、懂数学算法、懂数学软件、懂数据分析、懂预测分析、懂市场应用、懂决策分析等。
13、大数据分析架构师
梳理业务数据的来源、定义、逻辑,根据多样化的业务需求制定、优化报表;l 理解并分析相关产品和制造流程现状,根据业务需求分析挖掘数据规律、趋势、关注点,为产品制造业务提供决策支持;l 基于海量数据,通过机器学习和AI的方法,为个人电脑和手机产品制造业务提供个性化服务,提升制造效率和质量;l 负责相应安全AI模型设计,研发适合在业务中使用的模型、算法和工具,以支持数据分析需求和模拟预测业务场景。l 结合业务层面数字化项目,开发系统数据接口及建立分析预判机制,实现数据定制可视化、预警、模拟、决策辅助。
14、大数据解决方案架构师
负责大数据业务的售前技术支持,能独立进行售前工作,包括并不限于客户需求调研、解决方案编制和技术交流;
对竞争产品和方案进行竞争分析和对比,对市场竞争形势进行总结;
配合销售团队培训代理商合作伙伴,并提供相关培训和技术支持;
分析、撰写和总结公司产品的行业应用方案。
不同的平台对应不同的职位
1、数据平台
Data Platform,构建、维护稳定、安全的大数据平台,按需设计大数据架构,调研选型大数据技术产品、方案,实施部署上线。对于大数据领域涉及到的大多数技术都要有所了解,并精通某一部分,具备分布式系统的知识背景;
对应职位:大数据架构师,数据平台工程师
2、数据采集
Data Collecting,从Web/Sensor/RDBMS等渠道获取数据,为大数据平台提供数据来源,如Apache Nutch是开源的分布式数据采集组件,大家熟知的Python爬虫框架ScraPy等。
对应职位:爬虫工程师,数据采集工程师
3、数据仓库
Data Warehouse,有点类似于传统的数据仓库工作内容:设计数所仓库层级结构、ETL、进行数据建模,但基于的平台不一样,在大数据时代,数据仓库大多基于大数据技术实现,例如Hive就是基于Hadoop的数据仓库。
对应职位:ETL工程师,数据仓库工程师
3、数据处理
Data Processing,完成某些特定需求中的处理或数据清洗,在小团队中是结合在数据仓库中一起做的,以前做ETL或许是利用工具直接配置处理一些过滤项,写代码部分会比较少,如今在大数据平台上做数据处理可以利用更多的代码方式做更多样化的处理,所需技术有Hive、Hadoop、Spark等。随便说下,千万不要小看数据处理,后续的数据分析、数据挖掘等工作都是基于数据处理的质量,可以说数据处理在整个流程中有特别重要的位置。
对应职位:Hadoop工程师,Spark工程师
5、数据分析
Data Analysis,基于统计分析方法做数据分析:例如回归分析、方差分析等;大数据分析例如Ad-Hoc交互式分析,SQL on Hadoop的技术有:Hive、Impala、Presto、Spark SQL,支持OLAP的技术有:Kylin;
对应职位:数据分析师
6、数据挖掘
Data Mining,是一个比较宽泛的概念,可以直接理解为从大量数据中发现有用的信息。大数据中的数据挖掘,主要是设计并在大数据平台上实现数据挖掘算法:分类算法、聚类算法、关联分析等。
对应职位:数据挖掘工程师
7、机器学习
Machine Learning,与数据挖掘经常一起讨论,甚至被认为是同一事物。机器学习是一个计算机与统计学交叉的学科,基本目标是学习一个x->y的函数(映射),来做分类或者回归的工作。之所以经常和数据挖掘合在一起讲是因为现在好多数据挖掘的工作是通过机器学习提供的算法工具实现的,例如个性化推荐,是通过机器学习的一些算法分析平台上的各种购买,浏览和收藏日志,得到一个推荐模型,来预测你喜欢的商品。
对应职位:算法工程师,研究员
8、深度学习
Deep Learning,是机器学习里面的一个topic(非常火的Topic),从深度学习的内容来看其本身是神经网络算法的衍生,在图像、语音、自然语言等分类和识别上取得了非常好的效果,大部分的工作是在调参。不知道大家有否发现现在的Google翻译比以前的要准确很多,因为Google在去年底将其Google翻译的核心从原来基于统计的方法换成了基于神经网络的方法;
对应职位:算法工程师,研究员
9、数据可视化
Data Visualization,将分析、挖掘后的高价值数据用比较优美、灵活的方式展现在老板、客户、用户面前,更多的是一些前端的东西,也可能要求有一定的美学知识。结合使用者的喜好,以最恰当的方式呈现数据价值;
对应职位:数据工程师,BI工程师
10、数据应用
Data Application,从以上的每个部分可以衍生出的应用,例如广告精准投放、个性化推荐、用户画像等。
对应职位:数据工程师
从数据科学家到数据架构师,大数据职场中的核心新岗位
任何新行业兴起的时候必然伴随着行业的深化与细化,伴随着新职业岗位的生长,大数据行业也不例外。大家都说大数据,很多人甚至省略掉了数据,其实我们今天很多朋友做的最多算数据行业,还远不是大数据行业,因为还没有做数据源的整合、不同结构数据源的清理与对接、数据的贯通分析与实时共享;即使已经是大数据行业,那么属于大数据硬件行业(如制造、销售、管理大数据服务器)还是软件行业(开发大数据管理系统、数据内容的软件化整合与开发应用)也是不一样的;就算同是大数据软件行业,那么是属于数据库管理与运行维护,还是属于数据应用就是差异行业;同样是数据应用行业,数据资源的转移应用与精准匹配应用,与基于深度分析的决策应用,也是深度细分的差异行业;在大数据决策应用行业中,基于大数据分析的人工应用模式与基于大数据智能的自动化应用模式,可以看成不同的技术含量的精度细分行业。零点有数就是属于最后这个类别的大数据智能应用服务机构。
而在这样的行业中,我们会看到不少新兴的职业岗位兴起,其中不少人已经对数据科学家这一说法有认识,他们往往是数据模型或者说算法的设计者,也是复杂算法的修正优化与管理者;数据营销师,大家一看不算很新,但是实际上这个职位与过去的营销岗位除了有相近的传播、推广、沟通说服与信息汇集的功能以外,在今天的数据营销师会遇到的最大问题是客户提出了问题,而这个问题或者需求是原来的大数据产品或者技术不能完全解决的,因此营销过程带有较强的探索性沟通与寻求合作研发的特性;数据工程师是与数据科学家合作实施具体的数据管理与开发工作的技术白领,今天绝大部分数据工程师是边干边学,一般他们往往是学习计算机或者数据科学出身的初级专业人员;数据挖掘师,在海量数据中从事数据分类、清洗、标签与检核工作;数据安全师,从事数据安全的系统管理与监测工作,数据安全在大数据行业极为重要,因此数据安全师的地位远远高于线下生活中保安的地位。在所有这些岗位以外,有一个岗位往往是很少为人提及,但实际上至为重要的,那就是数据架构师。数据架构师需要判断在某一领域、行业的基本趋势与特点,熟悉开放式关键中的最佳标杆与前沿和典型做法,对于半封闭与体系内需要具备敏锐与犀利的洞察能力,由此而能来定义数据应用任务或者项目的目标与疆界、核心工作内容与指标、路线图与时间表,其中涉及到在多大意义上要体现本任务与宏观需要的契合、与周围可能有的其他关联系统的对接口、要素保障与条件保障、危机测定与安全管理机制。架构师需要将总体目标、要素关系、推进步骤能够在合理构设中蓝图化与实现优化整合。与设计师不同的是,架构师不只是蓝图设计者,也是蓝图可行性的负责人与推进者、协调者。
尽管我们在前面描述大数据行业的时候有一种介绍序列,其实在实际的大数据应用中,我们可以反过来看我们的大数据需要,然后设定我们在大数据应用、软硬件建设中的需要,这也是数据架构师所可能设计的工作内容。而我们所说的数据科学家,在一定程度上是链接与细化数据架构师工作的,而数据营销师往往需要一定的架构能力,而且能够理解数据架构的逻辑,从而能够创造性地推广前沿性的数据产品与服务。如果我能够大致提出一个典型大数据智能服务机构中这几类岗位的人员比例,那么它们大致是:数据架构师:数据营销师:数据科学家:数据工程师:数据挖掘师:数据安全师=1:2:3:30:60:5。而从人才市场的供应来说,实际上越是后面的岗位越是可以依靠专业机构培训的,越是前面的人才往往是在一定专业基础上在实际工作涌现的具有特殊技能的营运人才而需要数据机构领导人去留心发现。
由于国内高校2016年开始开设大数据本科专业,目前还没有毕业生流向市场,造成人才严重短缺,所以大数据人才待遇较高。
初级岗位(3—5年):15000—25000月/元;
中级岗位(5—10年):25000—35000月/元;
高级岗位(10年以上):40—100万/年。
如大数据系统架构师、大数据分析架构师、数据科学家等。
总之,选择大数据专业,从事大数据工作,待遇高,前景好!
0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答4
回答