如何成为一名大数据开发工程师,工作经验总结

如何成为一名大数据开发工程师,工作经验总结

原画心旗 2019-11-06 13:35:22

首先,我个人进入大数据行业也纯属偶然,当年实习的时候做的是纯纯的Java开发,后来正式毕业了以后找了份Java开发的工作,本以为和大多数Java猿一样天天搞增删改查了,但是巧的是搞好部门有个做大数据开发的离职了,数据开发缺人手,然后领导就让我顶上了。刚开始什么Hadoop,HDFS也是各种不懂,只会写hive,因为毕竟有SQL基础嘛。再后来发现hive实现一些东西很麻烦,就开始学习spark。网上找的例子,从Wordcount入手,边写简单的例子边看《Hadoop权威指南这本书》,不到一周时间就上手写了一个计算报表数据的作业。后来就不断深入,过程之中觉得《Hadoop权威指南》这本书每一次读都有不同的体会,前前后后应该读了有三四遍吧。

总体感受就是理解了分布式计算的模型,就知道如何写mapreduce了。但是如何进行作业优化以及数据处理过程中遇到的问题如何解决就需要更深入的研究。

前面提到来面试的有应届生也有工作几年的,针对不同的人给一些不同的建议。

3.1 对应届生

个人觉得应届生应该打好基础,大学本科一般都会开设数据结构,算法基础,操作系统,编译原理,计算机网络等课程。这些课程一定要好好学,基础扎实了学其他东西问题都不大,而且好多大公司面试都会问这些东西。如果你准备从事IT行业,这些东西对你会很有帮助。

至于学什么语言,我觉得对大数据行业来说,Java还是比较多。有时间有兴趣的话可以学学scala,这个语言写spark比较棒。

集群环境一定要搭起来。有条件的话可以搭一个小的分布式集群,没条件的可以在自己电脑上装个虚拟机然后搭一个伪分布式的集群。一来能帮助你充分认识Hadoop,而来可以在上面做点实际的东西。你所有踩得坑都是你宝贵的财富。

然后就可以试着写一些数据计算中常见的去重,排序,表关联等操作。

对于我来说,面试应届生就问你的基础,笔试大多是数据结构和算法方面的,如果你基础不错而且有一定的大数据方面的经验,基本上都会过。

3.2 对有工作经验想转行的

主要考察三个方面,一是基础,二是学习能力,三是解决问题的能力。

基础很好考察,给几道笔试题做完基本上就知道什么水平了。

学习能力还是非常重要的,毕竟写Javaweb和写mapreduce还是不一样的。大数据处理技术目前都有好多种,而且企业用的时候也不单单使用一种,再一个行业发展比较快,要时刻学习新的东西并用到实践中。

解决问题的能力在什么时候都比较重要,数据开发中尤为重要,我们同常会遇到很多数据问题,比如说最后产生的报表数据对不上,一般来说一份最终的数据往往来源于很多原始数据,中间又经过了n多处理。要求你对数据敏感,并能把握问题的本质,追根溯源,在尽可能短的时间里解决问题。

基础知识好加强,换工作前两周复习一下就行。学习能力和解决问题的能力就要在平时的工作中多锻炼。

社招的最低要求就上面三点,如果你平日还自学了一些大数据方面的东西,都是很好的加分项。

以上是个人的一些经历和见解,希望能帮到你。当然也不完全正确,如果你认为不妥可以评论开喷,哈哈。

最后祝各位看官都找到称心如意的工作!

大数据工程师有多种解释,一种是用大数据的,就是data scientist这种,一种是开发大数据平台的,就是平台开发工程师,比如写hadoop,hive的某个组件的工程师。

2.如果是走应用这个路线,需要的技能包括:sql,java,mapreduce job的编写,一些比较简单的脚本编写,再加上一些数据分析领域的东西,比如统计,机器学习等等。

3.如果是走底层开发这个路线的,需要的技能基本上是比较硬的开发技能,很多都需要了解语言的高级特性,软件开发模式呀,抽象呀,操作系统怎么用,编译啊,测试呀。这种开发学习曲线比较陡峭一点。

如何成为一名大数据开发工程师,工作经验总结

 

互联网科技发展蓬勃兴起,人工智能时代来临,抓住下一个风口。为帮助那些往想互联网方向转行想学习,却因为时间不够,资源不足而放弃的人。我自己整理的一份最新的大数据进阶资料和高级开发教程,大数据学习君羊:522189307 欢迎进阶中和进想深入大数据的小伙伴加入。

大数据本质其实也是数据,不过也包括了些新的特征,

数据来源广;

数据格式多样化(结构化数据、非结构化数据、Excel文件等);

数据量大(最少也是TB级别的、甚至可以是PB级别);

数据增长速度快。

而针对以上新的特征需求思索很多成果:

例如,数据来源广,该如何采集汇总?采集汇总之后,又该存储呢?数据存储之后,该如何经过运算转化本钱人想要的结果呢?

关于这些成果,我们需求有相对应的知识处置。

二、大数据所需技艺要求

如何成为一名大数据开发工程师,工作经验总结

 

Python言语:编写一些脚本时会用到。

Scala言语:编写Spark顺序的最佳言语,当然也可以选择用Python。

Ozzie,azkaban:定时义务调度的工具。

Hue,Zepplin:图形化义务执行管理,结果反省工具。

Allluxio,Kylin等:经过对存储的数据中止预处置,加快运算速度的工具。

必需掌握的技艺:

Java初级(虚拟机、并发)、Linux 基本操作、Hadoop(HDFS+MapReduce+Yarn )、 HBase(JavaAPI操作+Phoenix )、Hive(Hql基本操作和原理理解)、 Kafka、Storm/JStorm、Scala、Python、Spark (Core+sparksql+Spark streaming ) 、辅佐小工具(Sqoop/Flume/Oozie/Hue等)

高阶技艺6条:

机器学习算法以及mahout库加MLlib、 R言语、Lambda 架构、Kappa架构、Kylin、Alluxio

三、学习规划

每天需求有3个小时的学习时间,周末的时分需求10小时,假设做不到的话,只能是

第一阶段(基础阶段)

Linux学习

Linux操作系统引见与安装、Linux常用命令、Linux常用软件安装、Linux网络、 防火墙、Shell编程等。

Java 初级学习(《深化理解Java虚拟机》、《Java高并发实战》)

掌握多线程、掌握并发包下的队列、掌握JVM技术、掌握反射和静态代理、了解JMS。

Zookeeper学习

Zookeeper分布式协调效力引见、Zookeeper集群的安装部署、Zookeeper数据结构、命令。

第二阶段(攻坚阶段)

Hadoop、Hive、HBase、Scala、Spark、Python

第三阶段(辅佐工具工学习阶段)

Sqoop、Flume、Oozie、Hue这些工具的学习主要在CSDN,51CTO以及官网都可以学习。

如何成为一名大数据开发工程师,工作经验总结

 

总结

在技术行业里面,每天都会有新的东西出现,需求关注最新技术静态,不时学习。任何普通技术都是先学习实践,然后在实际中不时完善实践的进程。

假设你觉得自己看书效率太慢,你可以网上搜集一些课程。

快速学习的才干、处置成果的才干、沟通才干在这个行业是真的非常重要的目的。

要擅长运用StackOverFlow和Google来帮助你学习进程遇到的成果。

以上是我们对大数据学习的总结,当然我们也提到了,并不是说零基础的就可以直接学习,需求有编程的基础,要先掌握扎实的编程基础,有一定编程阅历,自学起来也相对比末尾要复杂一点,然后对大数据有兴味或许想要进入这个行业的就可以去学习了 以上内容是我个人见解,希望对你有帮助不

大数据基础入门教程
关注 关注
  • 4
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
从零开始的大数据技术学习路线指南:带你轻松成为大数据开发工程师
云祁QI
05-24 1万+
之前有不少小伙伴留言和私信我关于大数据学习路线,以及咨询我一些关于有工作经验想转行大数据的问题,只言片语也讲不清。我花了一个月整理了一份我当初学习的大数据学习路线,从最基础的大数据集群搭建开始,希望能帮助到大家。
面经总结(大数据开发相关)
qq_39300291的博客
04-07 3337
整理收集一些面试遇到的简单问题
大数据开发面试经验总结1(慢慢学习补充)
m0_62671297的博客
11-28 1723
大数据面试经验(部分)
大数据开发经验
s20081294的专栏
03-12 731
对百万级以上的大数据开发,通常都会遇到查询效率、性能、甚至导致系统崩溃等问题。对大数据开发一般有几个原则:       1. 先选择后连接           在多表关联查询时,先将子表添加过滤条件,先过滤掉一些数据,然后在进行表连接       2. 查看PL/SQL执行计划           查看PL/SQL执行计划,如果出现全表扫描,说明查询语句写的有问题,要对语句进行优化,避免全
如何成为一名大数据开发工程师
热门推荐
coding笔记
03-13 2万+
版权申明:转载请注明出处。 文章来源:http://bigdataer.net/?p=239 1.关于我本人现在北京某大型互联网公司高级数据开发工程师一枚,三年工作经验,一年多面试官经验。2.为啥要写这篇文章?面试中经常会遇到这种情况:之前专心写web的Java码农突然转型想做大数据了,然后写几个大数据的项目经验跑来面试,结果就是一问三不知,还有好多人只是搭了个Hadoop环境就说自己是搞大数
谈谈我的面试经历:大数据开发如何面试?
大数据工程师
06-02 7587
1 面试官:您好,请讲述一个自己最熟悉的项目,自己在其中的贡献? 最优解答: 项目规模和介绍:某项目,是为多少用户提供什么服务,哪些功能和核心模块。 技术架构:遇到高并发,高可用的实际问题是什么,因此采用Hadoop离线处理和Spark实时计算。 技术难点一:离线处理中的数据处理,比如数据表的行转列,JSON转Java,复杂的SQL语句等。 技术难度二:实时处理时的常见内存溢出问题...
大数据开发工程师简历模板.doc
02-05
大数据开发工程师简历模板.doc
大数据开发工程师工作总结模版PPT.pdf
04-24
大数据开发工程师工作总结模版PPT.pdf
大数据开发工程师简历模板
03-31
大数据开发工程师简历模板
大数据开发工程师实习报告.doc
04-26
大数据开发工程师实习报告
项目工程师经验讲(项目工程师经验讲)
01-06
项目工程师经验讲项目工程师经验讲项目工程师经验
大数据开发工程师实习报告.docx
03-02
大数据开发工程师实习报告.docx大数据开发工程师实习报告.docx大数据开发工程师实习报告.docx大数据开发工程师实习报告.docx大数据开发工程师实习报告.docx大数据开发工程师实习报告.docx大数据开发工程师实习报告....
大数据开发岗位面试经验总结(一线、二线,独角兽,外企,外国企业)
简单就好
06-11 2万+
为什么想走? 跟很多人也许不同,我不是觉得待遇不好,反而认为陌陌在互联网公司中的待遇算一股清流了:额外家属子女商业保险、总包差不多17薪、每年出国团建、加班少、工作氛围愉快,没有所谓大公司政治斗争,这些对于我毕业第一份工作已经非常满意。可我还是想离开,主要是觉得个人成长已经很缓慢,工作没有太大压力,而内心很想逃出舒适区,于是想离职的想法逐渐萌芽。 整个面试差不多持续1个半月,从刚开始懵懵懂懂准...
大数据开发经验分享:学习大数据开发的方法
weixin_44806671的博客
05-22 524
学习新的知识,最重要的就是学习方法,有一个好的学习方法会起到事半功倍的效果。学习大数据开发的方法有哪些? 一、学会爱数据 数据科学是一个广泛而模糊的领域,这使得它很难学习。没有动力,你最终会中途停止对自己失去信心。 你需要些东西来激励你不断学习,即使是在半夜公式已经开始变的模糊,你还是想探究关于神经网络的意义。对于小白学习大数据需要注意的点有很多,但无论如何,既然你选择了进入大数据行业,那么便只...
大数据开发-关于数据管理的经验分享
napcleon1的博客
05-23 1638
这里写自定义目录标题大数据开发-关于数据同步数据管理的经验分享前言数据源的多样性数据格式数据字典不统一合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入 大数据开发-关于数据同步数据管理的经验分享 大数据开发除了炫酷的报表 、复杂的算法、系统架
真相!没项目经验高薪就无望?
程序猿DD
05-11 862
福利!廖雪峰最新研磨的实战宝典《如何将大数据开发做到优秀》首次开放了,内容出自开课吧 vip 课程“大数据高级开发实战班”,为帮助大家特殊时期职场走得更加顺畅,现决定将这套价值 788元...
项目经验:某大厂大数据项目总结
金融科技和数据治理
04-26 6902
2015年有幸加入某大厂大数据项目,在此之前从没有接触过大数据这类高大上的技术,进入大厂之后才发现,原来大厂在做研究项目,也就是商业化前的可行性论证,也只有大厂会花这么多人力、物力做这个。当时物色了很多优秀的人才,有海龟博士、国内顶尖计算机专业硕士、资深大数据专家等等。但最终做了两年不到,项目最终被解散,回过头来总结经验,虽然时间隔得有点远,但很有必要。 一、业务需求 空间更小,速度更快 当时做...
C# WPF入门学习主线篇(二十)—— 资源和样式
最新发布
weixin_56595425的博客
06-09 1076
在《C# WPF入门学习主线篇(二十)—— 资源和样式》这篇文章中,我们详细介绍了WPF中的资源和样式。本文涵盖了静态资源和动态资源的定义与使用,以及如何通过样式实现控件的视觉统一和代码重用。通过具体的代码示例,读者可以学会在实际开发中灵活运用资源和样式,提高应用程序的可维护性和美观性。
大数据开发工程师工作内容
03-25
大数据开发工程师工作内容主要是设计、搭建和管理大数据技术平台,包括数据收集、存储和处理系统,以及大数据分析和应用系统。他们还负责收集、整理和可视化数据,以及开发和调整大数据分析模型,以帮助企业更有效地利用数据。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • 数据仓库工程师、大数据开发工程师、BI工程师、ETL工程师之间有什么区别? 8237
  • 大数据技术十大核心原理 7808
  • 大数据这么火,具体用用到哪些领域?揭秘大数据十三大具体应用场景 7062
  • 大数据入门书籍推荐 6893
  • 关于大数据应用方向9点思考 5175

最新评论

  • 大数据开发工程师,必须掌握的开发流程图是这样的

    普通网友: 大数据工程师2023版(升级版31周) https://download.csdn.net/download/u011712285/87679251

  • 本科生自学Java大数据成功入职外企:大数据值得转吗?门槛高吗?

    杰夫·王盖茨: 外企工作咋样啊哥,晋升可以不

  • 学习大数据最正确的步骤(0基础必备)

    ives: kvm是Kernel-based Virtual Machine,不是你写的这个键鼠显中转器

  • HBase Java API编程实例

    Meltshock: 有一点拼写错误,单词路很清晰!感谢!

  • 如何成为一名大数据开发工程师,工作经验总结

    KerryZXC: 写得好

大家在看

  • 网络安全(黑客)——自学2024 617
  • Vue3-Pinia-持久化
  • 自学网络安全的三个必经阶段(含路线图)
  • macOS 15 beta (24A5264n) Boot ISO 原版可引导镜像下载 375
  • 数字时代的信用守护者:小易大数据带你探索个人信用的未来 302

最新文章

  • 玩转大数据开发套件--(2)
  • 玩转大数据开发工具--(1)
  • HBase常见运维工具整理
2020年149篇
2019年77篇

目录

目录

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳SEO优化公司扬州模板制作报价玉树网页设计多少钱吴忠模板网站建设报价西安设计公司网站价格福永seo网站推广海西SEO按天收费公司东莞优化价格湛江关键词按天扣费推荐玉溪百度标王价格石家庄企业网站改版贵阳seo优化报价遂宁模板网站建设临沧网站制作推荐榆林百度竞价包年推广多少钱沈阳网站开发价格大芬企业网站设计六安网站优化按天计费报价莱芜企业网站设计多少钱新余建网站价格遵义网络推广报价醴陵网站优化按天计费推荐沈阳网站推广系统哪家好梅州至尊标王公司合肥网站制作哪家好张家界网页设计公司日照网站排名优化报价德宏百度网站优化多少钱大庆网站推广方案价格宁德设计网站价格坂田百度seo多少钱歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化