大数据技术基础实验五：Zookeeper实验——部署ZooKeeper-阿里云开发者社区

大数据技术基础实验五：Zookeeper实验——部署ZooKeeper

2022-11-08 405

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

服务治理 MSE Sentinel/OpenSergo，Agent数量不受限

简介： 大数据技术基础实验五，学习如何在三台虚拟机上部署并启动ZooKeeper。

一、前言

本期我们将学习Hadoop项目下的另一个子项目——ZooKeeper，这个分布式服务框架在我们的后续实验中也会经常用到，它也是Hadoop中一个非常重要的组件。

二、实验目的与要求

掌握ZooKeeper集群安装部署，加深对ZooKeeper相关概念的理解，熟练ZooKeeper的一些常用Shell命令。
部署三个节点的ZooKeeper集群，通过ZooKeeper客户端连接ZooKeeper集群，并用Shell命令练习创建目录，查询目录等。

三、实验原理

ZooKeeper 分布式服务框架是 Apache Hadoop 的一个子项目，它主要是用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。

ZooKeeper是以Fast Paxos算法为基础的。

ZooKeeper集群的初始化过程：集群中所有机器以投票的方式（少数服从多数）选取某一台机器作为leader(领导者)，其余机器作为follower(追随者)。如果集群中只有一台机器，那么就这台机器就是leader，没有follower。

ZooKeeper集群与客户端的交互：客户端可以在任意情况下ZooKeeper集群中任意一台机器上进行读操作；但是写操作必须得到leader的同意后才能执行。

ZooKeeper选取leader的核心算法思想：如果某服务器获得N/2 + 1票，则该服务器成为leader。N为集群中机器数量。为了避免出现两台服务器获得相同票数（N/2），应该确保N为奇数。因此构建ZooKeeper集群最少需要3台机器。

四、实验步骤

本实验主要介绍ZooKeeper的部署，ZooKeeper一般部署奇数个节点，部署方法包主要含安装JDK、修改配置文件、启动测试三个步骤。

1、安装JDK

学校服务器内已经安装JDK了所以不需要配置，而且一般的云服务器都会自带Java和Python环境，如果是自己本地的虚拟机的话就需要配置环境。

简单的讲一下配置JDK的过程：

首先去到Oracle官网下载对应的jdk版本的压缩包
然后通过Xftp工具将jdk压缩包上传到虚拟机上
然后再虚拟机内解压刚才的jdk压缩包
然后就是进入 etc/profile文件内配置jdk环境变量
最后重启虚拟机并检查jdk环境是否配置成功

2、修改ZooKeeper配置文件

首先配置master，slave1和slave2之间的免密登录和各虚拟机的/etc/hosts文件，这个步骤请参考我之前的一篇博客，里面有详细过程：

大数据技术基础实验一：配置SSH免密登录

然后修改ZooKeeper的配置文件，步骤如下：

首先进入解压目录下，把conf目录下的zoo_sample.cfg赋值成zoo.cfg文件。

cd /usr/cstor/zookeeper/conf
cp zoo_sample.cfg zoo.cfg

然后打开zoo.cfg并修改和添加配置项目：

# The number of milliseconds of each ticktickTime=2000# The number of ticks that the initial # synchronization phase can takeinitLimit=10# The number of ticks that can pass between # sending a request and getting an acknowledgementsyncLimit=5# the port at which the clients will connectclientPort=2181# the directory where the snapshot is stored.dataDir=/usr/cstor/zookeeper/data
dataLogDir=/usr/cstor/zookeeper/log
server.1=master:2888:3888
server.2=slave1:2888:3888
server.3=slave2:2888:3888

然后新建两个目录：

mkdir /usr/cstor/zookeeper/data
mkdir /usr/cstor/zookeeper/log

将/usr/cstor/zookeeper目录传到另外两台机器上。

scp -r /usr/cstor/zookeeper root@slave1:/usr/cstor
scp -r /usr/cstor/zookeeper root@slave2:/usr/cstor

然后分别在三个节点上的/usr/local/zookeeper/data目录下创建一个文件：myid。

vi /usr/cstor/zookeeper/data/myid

分别在myid上按照配置文件的server. 中id的数值，在不同机器上的该文件中填写相应过的值，如下：

master 的myid内容为1

slave1 的myid内容为2

slave2 的myid内容为3

3、启动ZooKeeper集群

分别在三个节点进入bin目录，启动ZooKeeper服务进程：

cd /usr/cstor/zookeeper/bin
./zkServer.sh start

在各机器上依次执行脚本，查看ZooKeeper状态信息，两个节点是follower状态，一个节点是leader状态：

./zkServer.sh status

在其中一台机器上执行客户端脚本：

./zkCli.sh -server master:2181,slave1:2181,slave2:2181

在客户端shell下执行创建目录命令：

create /testZk ""

然后再向/testZk目录写数据：

set /testZk 'aaa'

然后再读取/testZk目录数据：

get /testZk

最后删除/testZk目录并退出客户端：

rmr /testZk
quit

4、查看java进程和ZooKeeper集群目录

查看java进程：

master：
slave1：
slave2：

查看ZooKeeper集群目录：

五、最后我想说

本期有关ZooKeeper部署的实验就结束了，后续就会开始学习HBase，HBase中也会用到ZooKeeper，所以大家可以多多练习如何成功部署并启动Zookeeper。

文章标签：

云虚拟主机

微服务引擎

云原生大数据计算服务 MaxCompute

Java

Python

Shell

分布式计算

Hbase

Hadoop

算法

大数据

分布式数据库

数据管理

关键词：

云原生大数据计算服务 MaxCompute技术

微服务引擎部署

云原生大数据计算服务 MaxCompute部署

技术微服务引擎

云原生大数据计算服务 MaxCompute技术zookeeper

大数据技术基础实验五：Zookeeper实验——部署ZooKeeper

一、前言

二、实验目的与要求

三、实验原理

四、实验步骤

1、安装JDK

2、修改ZooKeeper配置文件

3、启动ZooKeeper集群

4、查看java进程和ZooKeeper集群目录

五、最后我想说

热门文章

最新文章

相关课程

相关电子书

相关实验场景