Hadoop3大数据技术快速入门pdf下载pdf下载

Hadoop3大数据技术快速入门百度网盘pdf下载

作者:
简介:本篇主要提供Hadoop3大数据技术快速入门pdf下载
出版社:科技生活自营旗舰店
出版时间:2021-09
pdf下载价格:0.00¥

免费下载

前去下载

书籍下载

下载地址

内容介绍

产品特色

编辑推荐

本书基于Hadoop 3.3.0,覆盖Hadoop、HBase、Hive的核心概念、实践应用、程序开发等方面的内容,帮你快速解决大数据是什么和怎么用的问题。本书适合Java大数据开发人员快速掌握Hadoop技术。

内容简介

  《Hadoop 3大数据技术快速入门/大数据技术丛书》基于Hadoop3.3.0,覆盖Hadoop、HBase、Hive的核心概念、实践应用、程序开发等方面的内容,帮你快速解决大数据是什么和怎么用的问题,书中还利用Docker来部署Hadoop分布式集群,让你同时学会4种流行的技术。
  《Hadoop 3大数据技术快速入门/大数据技术丛书》共9章,主要内容包括Hadoop概述、HDFS原理详解、Yarn原理详解、Hadoop系统配置、高可用Hadoop配置、HDFS编程、MapReduce编程、Hive实战、HBase实战。
  《Hadoop 3大数据技术快速入门/大数据技术丛书》从案例入手、通俗易懂,能使读者在非常短时间内迅速掌握Hadoop大数据技术。
  《Hadoop 3大数据技术快速入门/大数据技术丛书》既适合Hadoop大数据初学者、大数据应用开发人员、大数据处理人员使用,也适合高等院校和培训机构大数据相关专业的师生教学参考。

作者简介

牛搞,软件开发从业15年编程实战经验,流媒体技术专家,高性能服务器专家。CSDN知名博主。现为IOS、Adroid、C++高级培训讲师。著有图书《Android 9编程通俗演义》《Android 10 Kotlin编程通俗演义》。

内页插图

目录

第1章 概述 1

1.1 什么是大数据 1

1.1.1 大数据系统的定位 1

1.1.2 与传统分布式系统的区别 1

1.1.3 成功的大数据系统项目 2

1.2 Hadoop的原理 2

1.2.1 存储与资源调度 2

1.2.2 计算框架原理 2

1.3 总结 5

第2章 HDFS原理详解 6

2.1 主从节点架构 6

2.2 数据冗余 7

2.3 fsimage与edits 8

2.4 SecondaryNameNode 9

2.5 HA 10

2.6 自动故障转移 11

2.7 ZooKeeper 13

2.8 防脑裂 14

2.9 联邦 15

2.10 总结 16

第3章 Yarn原理详解 17

3.1 概述 17

3.2 作业调度策略 19

3.2.1 容量调度器 19

3.2.2 公平调度器 21

3.2.3 队列其他事项 22

3.3 Yarn与MapReduce程序 22

第4章 配置Hadoop系统 24

4.1 Docker简介 24

4.2 安装Docker 25

4.2.1 Windows、macOS做宿主系统 25

4.2.2 Linux做宿主系统 26

4.2.3 测试Docker容器 30

4.3 创建Hadoop容器 32

4.4 配置独立模式Hadoop 34

4.5 配置伪分布Hadoop 37

4.5.1 安装并配置SSH 37

4.5.2 安装其他命令行程序 38

4.5.3 编辑core-site.xml 38

4.5.4 编辑hdfs-site.xml 39

4.5.5 编辑mapred-site.xml 40

4.5.6 编辑yarn-site.xml 40

4.5.7 编辑hadoop-env.sh 41

4.5.8 运行伪分布式Hadoop 41

4.5.9 状态监控 43

4.6 基于Dockerfile的伪分布Hadoop 45

4.6.1 Dockerfile 45

4.6.2 构建Hadoop镜像 46

4.6.3 运行容器 47

4.6.4 配置Hadoop 48

4.7 配置全分布式Hadoop 49

4.7.1 组件部署架构 49

4.7.2 配置思路 50

4.7.3 修改配置文件 50

4.7.4 创建集群 51

4.7.5 启动集群 53

4.8 Windows下运行Hadoop 55

4.8.1 配置独立模式Hadoop 55

4.8.2 配置伪分布式Hadoop 56

4.9 Yarn调度配置 60

4.9.1 容量调度器 61

4.9.2 公平调度器 63

第5章 配置高可用Hadoop 66

5.1 HDFS高可用 66

5.1.1 组件部署架构 66

5.1.2 修改配置文件 67

5.1.3 创建镜像 70

5.1.4 创建HA HDFS集群 72

5.1.5 运行HA HDFS 73

5.1.6 测试HA HDFS 74

5.1.7 NameNode自动故障转移 75

5.2 Yarn高可用 78

第6章 HDFS编程 81

6.1 安装开发工具 81

6.1.1 安装Git 81

6.1.2 安装Maven 83

6.1.3 安装VSCode 84

6.1.4 安装VSCode插件 85

6.2 Native编程 87

6.2.1 创建HDFS客户端项目 87

6.2.2 示例1:查看目录状态 91

6.2.3 添加依赖库 92

6.2.4 运行程序 96

6.2.5 示例2:创建目录和文件 97

6.2.6 示例3:读取文件内容 99

6.2.7 示例4:上传和下载文件 100

6.3 WebHDFS与HttpFS 101

6.3.1 WebHDFS 101

6.3.2 VSCode插件RestClient 103

6.3.3 HttpFS 104

第7章 MapReduce编程 106

7.1 准备测试环境与创建项目 106

7.2 添加MapReduce逻辑 107

7.2.1 添加Map类 108

7.2.2 添加Reduce类 109

7.3 创建Job 110

7.4 添加依赖库 111

7.5 运行程序 112

7.6 查看运行日志 114

7.7 在Hadoop中运行程序 116

7.8 Combiner 117

7.9 Mapper与Reducer数量 119

7.10 实现SQL语句 120

7.10.1 简单查询 120

7.10.2 排序 127

7.10.3 复杂排序 129

7.10.4 分区 132

7.10.5 组合 134

7.10.6 总结 135

7.11 实现SQL JOIN 136

7.11.1 INNER JOIN 136

7.11.2 MapReduce实现JOIN 137

7.11.3 Mapper JOIN 142

7.11.4 DistributedCache 146

7.12 Counter 148

7.13 其他组件 149

7.14 升级版的WordCount 150

7.15 分布式k-means 154

第8章 Hive 166

8.1 Hive的设计架构 166

8.2 运行架构 167

8.3 安装配置Hive3 168

8.4 运行Hive3 173

8.5 其他运行方式 175

8.6 Hive数据管理 176

8.7 Hive查询优化 190

8.8 索引 192

8.9 HCatalog 192

8.10 Hive编程 194

8.11 总结 208

第9章 HBase 209

9.1 什么是HBase 209

9.2 HBase架构 210

9.3 安装与配置 211

9.4 基本数据操作 218

9.5 HBase设计原理 224

9.6 HBase应用编程 232

9.7 总结 245

后记 246

查看全部↓

前言/序言

  当前己完全进入大数据时代,人们忽然发现积累十几年的老数据里竟然埋着巨大的财富。大数据技术无处不在,正在迅速深度融入金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的社会各行各业,并为它们带来效益的显著提升。所以说:数据就是生产力!大数据技术的广泛应用以及国家层面的大力推进,使得大数据人才的需求相当巨大。
  对软件工程师来讲,大数据几乎己成必备技能或为自己加分的辅助技能,每个程序员都应该了解大数据,快速学习大数据技术已成为程序员的一种迫切需求。然而,找一本既系统讲解Hadoop的主要概念和原理,又通俗易懂、适合零基础入门的大数据图书是很难的,而本书就是为解决这个问题创作的。作者认为,世上没有难以理解的技术,只是因为说了行话而没有说“人”话。本书没有事无巨细地将所有内容都罗列进来,因为本书不是开发手册,本书关注的是快速理解、无痛入门,为读者自学和提高奠定基础,铺平道路。

查看全部↓


相关内容

数据挖掘及其在学习资源推荐中的应用研究
大数据环境下的半监督学习算法的设计与分析
面向数据科学家的实用统计学第2版
数据分析基础技术――阿里云大数据分析师ACA认证培训教程
Kafka权威指南
工业大数据融合体系结构与关键技术

深圳SEO优化公司中山企业网站制作鄂州网站优化价格泉州营销型网站建设推荐河池网站优化按天扣费公司唐山网页制作公司兴安盟营销型网站建设清徐设计公司网站报价梧州seo网站推广公司茂名网络营销多少钱南充关键词按天收费佛山网页设计推荐内江百度竞价包年推广多少钱保山模板推广石家庄模板推广推荐三亚网站优化推荐平凉网页设计哪家好梅州如何制作网站多少钱包头模板推广推荐临沂建站哪家好郴州网站设计价格玉树阿里店铺运营价格江门建站哪家好海南网站排名优化推荐抚州关键词排名哪家好石岩网站搭建报价保山英文网站建设推荐酒泉百度关键词包年推广推荐郑州网站优化排名报价永湖SEO按天计费中山网页设计价格歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化