分析如何成为一名大数据开发工程师

网上有关“分析如何成为一名大数据开发工程师”话题很是火热,小编也是针对分析如何成为一名大数据开发工程师寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。

1、认识大数据

大数据开发工程师,首先你得熟悉关系型数据库,比如Oracle或者MySQL,熟悉之后,有利于数据仓库的开发;再次熟悉Hadoop,这个都是现在大数据领域中用的最多的一个技术,它的HDFS可以实现分布式存储,Yarn是一个优秀的资源调度框架

2、大数据所需技能要求

必须掌握的技能:

Java高级(虚拟机、并发)、Linux 基本操作、Hadoop(HDFS+MapReduce+Yarn )、 HBase(JavaAPI操作+Phoenix )、Hive(Hql基本操作和原理理解)、 Kafka、Storm/JStorm、Scala、Python、Spark (Core+sparksql+Spark streaming ) 、辅助小工具(Sqoop/Flume/Oozie/Hue等)

1.大数据工程师工作中会做什么?

集群运维:安装、测试、运维各种大数据组件

数据开发:细分一点的话会有ETL工程师、数据仓库工程师等

数据系统开发:偏重Web系统开发,比如报表系统、推荐系统等

这里面有很多内容其实是十分重合的,下面大致聊一下每一块内容大致需要学什么,以及侧重点。

2.集群运维

数据工程师,基本上是离不开集群搭建,比如hadoop、Spark、Kafka,不要指望有专门的运维帮你搞定,新组件的引入一般都要自己来动手的。

因此这就要求数据工程师了解各种大数据的组件。

由于要自己的安装各种开源的组件,就要求数据工程师要具备的能力:Linux。要对Linux比较熟悉,能各种自己折腾着玩。

由于现在的大数据生态系统基本上是JVM系的,因此在语言上,就不要犹豫了,JVM系的Java和Scala基本上跑不掉,Java基本上要学的很深,Scala就看情况了。

3.ETL

ETL在大数据领域主要体现在各种数据流的处理。这一块一方面体现在对一些组件的了解上,比如Sqoop、Flume、Kafka、Spark、MapRece;另一方面就是编程语言的需要,Java、Shell和Sql是基本功。

4.系统开发

我们大部分的价值最后都会由系统来体现,比如报表系统和推荐系统。因此就要求有一定的系统开发能力,最常用的就是JavaWeb这一套了,当然Python也是挺方便的。

需要注意的是,一般数据开发跑不掉的就是各种提数据的需求,很多是临时和定制的需求,这种情况下,Sql就跑不掉了,老老实实学一下Sql很必要。

如何入门?

前面提到了一些数据工程师会用到的技能树,下面给一个入门的建议,完全个人意见。

1.了解行业情况

刚开始一定要了解清楚自己和行业的情况,很多人根本就分不清招聘信息中的大数据和数据挖掘的区别就说自己要转行,其实是很不负责的。不要总是赶热点,反正我就是经常被鄙视做什么大数据开发太Low,做数据就要做数据挖掘,不然永远都是水货。

2.选择学习途径

如果真是清楚自己明确地想转数据开发了,要考虑一下自己的时间和精力,能拿出来多少时间,而且在学习的时候最好有人能多指点下,不然太容易走弯路了。

在选择具体的学习途径时,要慎重一点,有几个选择:

自学

报班

找人指点

别的不说了,报班是可以考虑的,不要全指望报个辅导班就能带你上天,但是可以靠他帮你梳理思路。如果有专业从事这一行的人多帮帮的话,是最好的。不一定是技术好,主要是可沟通性强。

3.学习路线

学习路线,下面是一个大致的建议:

第一阶段

先具备一定的Linux和Java的基础,不一定要特别深,先能玩起来,Linux的话能自己执行各种操作,Java能写点小程序。这些事为搭建Hadoop环境做准备。

学习Hadoop,学会搭建单机版的Hadoop,然后是分布式的Hadoop,写一些MR的程序。

接着学学Hadoop生态系统的其它大数据组件,比如Spark、Hive、Hbase,尝试去搭建然后跑一些官网的Demo。

Linux、Java、各种组件都有一些基础后,要有一些项目方面的实践,这时候找一些成功案例,比如搜搜各种视频教程中如何搞一个推荐系统,把自己学到的用起来。

第二阶段

到这里是一个基本的阶段了,大致对数据开发有一些了解了。接着要有一些有意思内容可以选学。

数据仓库体系:如何搞数据分层,数据仓库体系该如何建设,可以有一些大致的了解。

用户画像和特征工程:这一部分越早了解越好。

一些系统的实现思路:比如调度系统、元数据系统、推荐系统这些系统如何实现。

第三阶段

下面要有一些细分的领域需要深入进行,看工作和兴趣来选择一些来深入进行

分布式理论:比如Gossip、DHT、Paxo这些构成了各种分布式系统的底层协议和算法,还是要学一下的。

数据挖掘算法:算法是要学的,但是不一定纯理论,在分布式环境中实现算法,本身就是一个大的挑战。

各种系统的源码学习:比如Hadoop、Spark、Kafka的源码,想深入搞大数据,源码跑不掉。

关于“分析如何成为一名大数据开发工程师”这个话题的介绍,今天小编就给大家分享完了,如果对你有所帮助请保持对本站的关注!

本文来自作者[种树辰]投稿,不代表唯乐迪立场,如若转载,请注明出处:https://www.cqwld.cn/weile/813.html

(13)

文章推荐

  • 150万的房子首付多少月供多少

    网上有关“150万的房子首付多少月供多少”话题很是火热,小编也是针对150万的房子首付多少月供多少寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。150万的房子首付多少月供多少按第一套房子的30%,那么二首房首付就是45万。一百五十万的房贷,一个月五百七十四块

    2025年10月24日
    14311
  • 二保焊收弧电压收弧电流怎么调

    网上有关“二保焊收弧电压收弧电流怎么调”话题很是火热,小编也是针对二保焊收弧电压收弧电流怎么调寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。二保焊收弧电压收弧电流怎么调?相关内容如下:1.收弧电压的调节:收弧电压是焊接电弧维持的电压,它直接影响焊接电流的稳

    2025年10月24日
    16311
  • 公积金有什么作用和好处

    网上有关“公积金有什么作用和好处”话题很是火热,小编也是针对公积金有什么作用和好处寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。公积金的作用和好处如下:1、改善住房条件:通过缴纳住房公积金,职工可以积累资金购房或进行住房改造,从而改善居住条件;2、提高购房门

    2025年10月25日
    14302
  • 奇瑞e5保养手册(奇瑞e5消除保养警示)

    网上有关“奇瑞e5保养手册(奇瑞e5消除保养警示)”话题很是火热,小编也是针对奇瑞e5保养手册(奇瑞e5消除保养警示)寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。奇瑞e5维护注意事项:1.淋雨后及时洗车、洗车。遇到大雨时,返程后应及时清洗,否则可能会造成车

    2025年10月25日
    12307
  • 三国演义中的故事——三顾茅庐

    网上有关“三国演义中的故事——三顾茅庐”话题很是火热,小编也是针对三国演义中的故事——三顾茅庐寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。三顾茅庐东汉末年,天下大乱,各路人马互相攻伐,连年征战。刘备胸怀大志,欲建立一番功业。当时有一位名士叫诸葛亮(字

    2025年10月25日
    13309
  • 服装跟单是怎么做的能告诉我吗?

    网上有关“服装跟单是怎么做的能告诉我吗?”话题很是火热,小编也是针对服装跟单是怎么做的能告诉我吗?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。服装跟单流程1、查阅订单资料服装接到订单资料后,仔细查看资料是否完整准确。订单资料是跟单员跟进订单的唯一依据,

    2025年10月25日
    12316
  • 标书上的投标人写谁

    网上有关“标书上的投标人写谁”话题很是火热,小编也是针对标书上的投标人写谁寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。写招标代理公司。《中华人民共和国招标投标法实施条例》对其有相应的规定:第十四条招标人应当与被委托的招标代理机构签订书面委托合同,合同约定

    2025年10月25日
    13320
  • 员工持股计划的利弊-

    网上有关“员工持股计划的利弊?”话题很是火热,小编也是针对员工持股计划的利弊?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。一、员工持股计划的优点:1、员工具有劳动者和股东的双重身份,使员工利益和公司利益统一。通过员工持股计划可以实现劳动者与所有者风险共担、

    2025年10月26日
    10300
  • 双蛋刀贼和双蛋刀战士

    网上有关“双蛋刀贼和双蛋刀战士”话题很是火热,小编也是针对双蛋刀贼和双蛋刀战士寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。我来回答你把6区呢是网通区这个服的帐号跟金币交易量较同网通2区比较小具体价格呢跟您帐号所在的服务器阵营还有角色种族职业都有关

    2025年10月26日
    8314
  • 女生初学游泳需要准备什么物品?

    网上有关“女生初学游泳需要准备什么物品?”话题很是火热,小编也是针对女生初学游泳需要准备什么物品?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。干湿分离游泳背包主要用于携带零碎物品和衣物。具有独特的干湿分离设计。游泳后,它可以把干衣服和湿的游泳衣分开。防水技

    2025年10月26日
    6321
  • 如何自制决明子枕头

    网上有关“如何自制决明子枕头”话题很是火热,小编也是针对如何自制决明子枕头寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。随着人们生活品质的提高,决明子枕头也成为越来越受人们喜欢的一款保健类枕头之一,通过决明子的药理作用,起到对人体保健的作用与功效,接下来

    2025年10月27日
    4302
  • 梦见汽车从山上翻下来是什么意思

    网上有关“梦见汽车从山上翻下来是什么意思”话题很是火热,小编也是针对梦见汽车从山上翻下来是什么意思寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。梦境的产生其实是和生命活动有着一定的关联的,是一种心理和生理共同影响的多重作用。人类在睡眠的状态之下,身体仍然是保

    2025年10月27日
    3321

发表回复

本站作者才能评论

评论列表(3条)

  • 种树辰的头像
    种树辰 2025年10月25日

    我是唯乐迪的签约作者“种树辰”

  • 种树辰
    种树辰 2025年10月25日

    本文概览:网上有关“分析如何成为一名大数据开发工程师”话题很是火热,小编也是针对分析如何成为一名大数据开发工程师寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望...

  • 种树辰
    用户102503 2025年10月25日

    文章不错《分析如何成为一名大数据开发工程师》内容很有帮助