Zookeeper学习总结Zookeeper一、什么是Zookeeper二、Zookeeper的应用场景三、搭建zk服务器四、Zookeeper内部的数据模型五、Zookeeper客户端(zkCli)的使用六、Curator客户端的使用七、zk实现分布式锁八、zk的watch机制九、Zookeeper集群实战十、ZAB协议十一、CAP理论

236 阅读 0 评论 156 点赞

我是靠谱客的博主可靠橘子，这篇文章主要介绍Zookeeper学习总结Zookeeper一、什么是Zookeeper二、Zookeeper的应用场景三、搭建zk服务器四、Zookeeper内部的数据模型五、Zookeeper客户端(zkCli)的使用六、Curator客户端的使用七、zk实现分布式锁八、zk的watch机制九、Zookeeper集群实战十、ZAB协议十一、CAP理论，现在分享给大家，希望可以做个参考。

Zookeeper

分布式组件的鼻祖。

一、什么是Zookeeper

Zookeeper是一种分布式协调服务，用于管理大型主机
在分布式环境中协调和管理服务是一个复杂的过程，Zookeeper通过简单的架构和API解决了这个问题
ZooKeeper 允许开发人员专注于核心应用程序逻辑，而不必担心应用程序的分布式特性。

二、Zookeeper的应用场景

分布式协调组件
在分布式系统中，需要有zookeeper作为分布式协调组件，协调分布式系统中的状态
分布式锁
zk在实现分布式锁上，可以做到强一致性
无状态话实现

三、搭建zk服务器

安装虚拟机

克隆一台虚拟机
安装jdk
下载zk的压缩包（已经下载好了）
上传压缩包到虚拟机中
配置文件重命名 conf/zoo_sample.cfg ->zoo.cfg
进入到bin中，执行如下命令，来启动zk： ./zkServer.sh start

zoo.cfg配置文件的说明

# zookeeper时间配置中的基本单位 (毫秒)
tickTime=2000
# 允许follower初始化连接到leader最大时长，它表示tickTime时间倍数 即:initLimit*tickTime
initLimit=10
# 允许follower与leader数据同步最大时长,它表示tickTime时间倍数 
syncLimit=5
#zookeper 数据存储目录及日志保存目录（如果没有指明dataLogDir，则日志也保存在这个文件中）
dataDir=/tmp/zookeeper
#dataLogDir=/tmp/log
#对客户端提供的端口号
clientPort=2181
#单个客户端与zookeeper最大并发连接数
maxClientCnxns=60
# 保存的数据快照数量，之外的将会被清除
autopurge.snapRetainCount=3
#自动触发清除任务时间间隔，小时为单位。默认为0，表示不自动清除。
autopurge.purgeInterval=1

Zookeeper服务器的操作命令

# 启动
./zkServer.sh start 
# 查看状态
./zkServer.sh status 
# 停止
./zkServer.sh stop

四、Zookeeper内部的数据模型

1. zk是如何保存数据的

zk中的数据是保存在节点上的，节点就是znode，多个znode之间构成一棵树的目录结构

在这里插入图片描述

树是由节点构成，Zookeeper的数据存储也是基于节点，这种节点叫做Znode
但是不同于树的节点，Znode的引用方式是路径引用，类似于文件路径

/动物/猫
/汽车/宝马

这样的层级结构，让每一个 Znode 节点拥有唯一的路径，就像命名空间一样对不同信息作出清晰的隔离

2. zk中的znode是什么样的结构

zk中的znode，包含了四个部分：

data：保存数据
acl：权限，定义了什么样的用户能够操作这个节点，且能够进行怎样的操作
- c：create 创建权限，允许在该节点下创建子节点
- w：write 更新权限，允许更新该节点的数据
- r：read 读取权限，允许读取该节点的内容以及子节点的列表信息
- d：delete 删除权限，允许删除该节点的子节点
- a：admin 管理者权限，允许对该节点进行acl权限设置
stat：描述当前znode的元数据
child：当前节点的子节点

3. zk中节点znode的类型

持久节点：创建出的节点，在会话结束后依然存在。保存数据
持久序号节点：创建出的节点，根据先后顺序，会在节点之后带上一个数值，越后执行数值越大，适用于分布式锁的应用场景- 单调递增
create -s /mynode abc
临时节点：在会话结束后，自动被删除的，通过这个特性，zk可以实现服务注册与发现的效果
create -e /mynode abc
临时序号节点：跟持久序号节点相同，适用于临时的分布式锁
create -s -e /node1
容器Container节点：Container容器节点，当容器中没有任何子节点，该容器节点会被zk定期删除（60s）
TTL节点：可以指定节点的到期时间，到期后被zk定时删除。只能通过系统配置 zookeeper.extendedTypesEnabled=true开启

4. zk的数据持久化

zk的数据是运行在内存中，zk提供了两种持久化机制：

事务日志

zk把执行的命令以日志形式保存在dataLogDir指定的路径中的文件中（如果没有指定dataLogDir，则按dataDir指定的路径）

数据快照

k会在一定的时间间隔内做一次内存数据的快照，把该时刻的内存数据保存在快照文件中。

zk通过两种形式的持久化，在恢复时先恢复快照文件中的数据到内存中，再用日志文件中的数据做增量恢复，这样的恢复速度更快。

五、Zookeeper客户端(zkCli)的使用

1. 多节点类型创建 - create

创建持久节点 create
创建持久序号节点 create -s
创建临时节点 create -e
创建临时序号节点 create -s -e
创建容器节点 create -c

2. 查询节点

普通查询 get
查询节点详细信息 get -s
cZxid: 创建节点的事务ID
mZxid：修改节点的事务ID
pZxid：添加和删除子节点的事务ID
ctime：节点创建的时间
mtime: 节点最近修改的时间
dataVersion: 节点内数据的版本，每更新一次数据，版本会+1
aclVersion: 此节点的权限版本
ephemeralOwner: 如果当前节点是临时节点，该值是当前节点所有者的session id。如果节点不是临时节点，则该值为零。
dataLength: 节点内数据的长度
numChildren: 该节点的子节点个数

3. 删除节点

普通删除 delete
乐观锁删除 delete -v 0 /mynode4

4. 权限设置

在另一个会话中必须先使用账号密码，才能拥有操作该节点的权限

注册当前会话的账号和密码
addauth digest xiaowang:123456
创建节点并设置权限
create /test-node abcd auth:xiaowang:123456:cdwra

5. 更新节点

set /节点路径新的内容

六、Curator客户端的使用

1. Curator介绍

Curator是Netflix公司开源的一套zookeeper客户端框架，Curator是对Zookeeper支持最好的客户端框架。
Curator封装了大部分Zookeeper的功能，比如Leader选举、分布式锁等，减少了技术人员在使用Zookeeper时的底层细节开发工作。

2. 引入

引入依赖

		<!--Curator-->
		<dependency>
      <groupId>org.apache.curator</groupId>
      <artifactId>curator-framework</artifactId>
      <version>2.12.0</version>
    </dependency>
    <dependency>
      <groupId>org.apache.curator</groupId>
      <artifactId>curator-recipes</artifactId>
      <version>2.12.0</version>
    </dependency>
		<!--Zookeeper-->
		<dependency>
      <groupId>org.apache.zookeeper</groupId>
      <artifactId>zookeeper</artifactId>
      <version>3.7.0</version>
    </dependency>

application.properties配置文件

curator.retryCount=5
curator.elapsedTimeMs=5000
curator.connectString=172.16.253.35:2181
curator.sessionTimeoutMs=60000
curator.connectionTimeoutMs=5000

注入配置Bean

@Data
@Component
@ConfigurationProperties(prefix = "curator")
public class WrapperZK {

  private int retryCount;

  private int elapsedTimeMs;

  private String connectString;

  private int sessionTimeoutMs;

  private int connectionTimeoutMs;
}

注入CuratorFramework

@Configuration
public class CuratorConfig {

    @Autowired
    WrapperZK wrapperZk;

    @Bean(initMethod = "start")
    public CuratorFramework curatorFramework() {
      return CuratorFrameworkFactory.newClient(
        wrapperZk.getConnectString(),
        wrapperZk.getSessionTimeoutMs(),
        wrapperZk.getConnectionTimeoutMs(),
        new RetryNTimes(wrapperZk.getRetryCount(), wrapperZk.getElapsedTimeMs()));
    }
}

3. 创建节点

  @Autowired
  CuratorFramework curatorFramework;  

  @Test
  void createNode() throws Exception {

    //添加持久节点
    String path = curatorFramework.create().forPath("/curator-node");
    //添加临时序号节点
    String path1 = curatorFramework.create().withMode(CreateMode.EPHEMERAL_SEQUENTIAL).forPath("/curator-node", "some-data".getBytes());
    System.out.println(String.format("curator create node :%s  successfully.",path));

    System.in.read();

  }

4. 获得节点数据

  @Test
  public void testGetData() throws Exception {
    byte[] bytes = curatorFramework.getData().forPath("/curator-node");
    System.out.println(new String(bytes));
  }

5. 修改节点数据

  @Test
  public void testSetData() throws Exception {
    curatorFramework.setData().forPath("/curator-node","changed!".getBytes());
    byte[] bytes = curatorFramework.getData().forPath("/curator-node");
    System.out.println(new String(bytes));
  }

6. 创建节点同时创建父节点

  @Test
  public void testCreateWithParent() throws Exception {
    String pathWithParent="/node-parent/sub-node-1";
    String path = curatorFramework.create().creatingParentsIfNeeded().forPath(pathWithParent);
    System.out.println(String.format("curator create node :%s  successfully.",path));
  }

7. 删除节点

  @Test
  public void testDelete() throws Exception {
    String pathWithParent="/node-parent";
    curatorFramework.delete().guaranteed().deletingChildrenIfNeeded().forPath(pathWithParent);
  }

七、zk实现分布式锁

1. zk中锁的种类：

读锁（谈恋爱）：大家都可以读，要想上读锁的前提是：之前没有写锁
写锁（结婚）：只有得到写锁的才能写，要想上写锁的前提是：之前没有任何锁

2. zk如何上读锁

创建一个临时序号节点，节点的数据是read，表示读锁
获取当前zk中序号比自己小的节点
判断最小节点是不是读锁：
- 如果不是读锁的话，则上锁失败，为最小的节点设置监听。阻塞等待，zk的watch机制会当最小的节点发生变化时通知当前节点，于是执行第二步流程
- 如果是读锁的话，则上锁成功

3. zk如何上写锁

创建一个临时序号节点，节点的数据是write，表示写锁
获取zk中所有的子节点
判断自己是否是最小的节点
- 如果是，则上锁成功
- 如果不是，说明前面还有锁，则上锁失败，监听最小的节点，如果最小的节点有变化，则回到第二步

4. 羊群效应

如果用上述上锁方式，只要节点发生变化，就会触发其他节点监听事件，这样的话对zk的压力非常大–>羊群效应，可以调整成链式监听来解决这个问题
在这里插入图片描述

5. curator实现读写锁

5.1 获取读锁

	@Test
	void testGetReadLock() throws Exception{
		// 读写锁
		InterProcessReadWriteLock interProcessReadWriteLock = new InterProcessReadWriteLock（client,"/lock1"）;
		// 获取读锁对象
		InterProcessLock interProcessLock = interProcessReadWriteLock.readLock();
		System.out.println("等待获取读锁对象!");
		// 获取锁
		interProcessLock.acquire();
		for (int i = 1; i <= 100; i++) {
	        Thread.sleep(3000);
	        System.out.println(i);
	    }
	    // 释放锁
	    interProcessLock.release();
	    System.out.println("等待释放锁!");
		
	}

5.2 获取写锁

    @Test
    void testGetWriteLock() throws Exception {

        // 读写锁
        InterProcessReadWriteLock interProcessReadWriteLock=new InterProcessReadWriteLock(client, "/lock1");
        // 获取写锁对象
        InterProcessLock interProcessLock=interProcessReadWriteLock.writeLock();
        System.out.println("等待获取写锁对象!");
        // 获取锁
        interProcessLock.acquire();
        for (int i = 1; i <= 100; i++) {
            Thread.sleep(3000);
            System.out.println(i);
        }
        // 释放锁
        interProcessLock.release();
        System.out.println("等待释放锁!");
    }

八、zk的watch机制

1. Watch机制介绍

我们可以白 Watch 理解成是注册在特定Znode上的触发器，当这个Znode发生改变，也就是调用了create，delete，setData 方法的时候，将会触发 Znode 上注册的对应事件，请求 Watch 的客户端会接收到异步通知。

具体交互过程如下：

客户端调用 getData 方法，watch 参数是 true。服务端接到请求，返回节点数据，并且在对应的哈希表里插入被 Watch 的 Znode 路径，以及 Watcher 列表。
当被 Watch 的 Znode 已删除，服务端会查找哈希表，找到该 Znode 对应的所有 Watcher，异步通知客户端，并且删除哈希表中对应的 Key-Value。
客户端使用了NIO通信模式监听服务端的调用。

2. zkCli客户端使用watch

create /test xxx
get -w /test 一次性监听节点
ls -w /test 监听目录,创建和删除子节点会收到通知。子节点中新增节点不会收到通知
ls -R -w /test 对于子节点中子节点的变化，但内容的变化不会收到通知

3. curator客户端使用watch

@Test
public void addNodeListener()throws Exception{
	NodeCache nodeCache = new NodeCache(curatorFrameWork, "/curator-node");
	nodeCache.getListenable().addListener(new NodeCacheListener() {
	   @Override
	   public void nodeChanged() throws Exception {
	      log.info("{} path nodeChanged: ","/curator-node");
	      printNodeData();
	   }
   });
   nodeCache.start();
   System.in.read();  
  }
}

九、Zookeeper集群实战

1. zk集群角色

Leader：处理集群的所有事物请求，集群中只有一个Leader
Follower：只能处理读请求，参与Leader选举
Observer：只能处理读请求，提升集群读的性能，但不能参与Leader选举

2. 集群搭建

搭建4个节点，其中一个节点为Observer

2.1 创建4个节点的myid，并设值

在/usr/local/zookeeper中创建以下四个文件

/usr/local/zookeeper/zkdata/zk1# echo 1 > myid
/usr/local/zookeeper/zkdata/zk2# echo 2 > myid
/usr/local/zookeeper/zkdata/zk3# echo 3 > myid
/usr/local/zookeeper/zkdata/zk4# echo 4 > myid

2.2 编写4个zoo.cfg

# The number of milliseconds of each tick
tickTime=2000
# The number of ticks that the initial 
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between 
# sending a request and getting an acknowledgement
syncLimit=5
# 修改对应的zk1 zk2 zk3 zk4
dataDir=/usr/local/zookeeper/zkdata/zk1
# 修改对应的端口 2181 2182 2183 2184
clientPort=2181
# 2001为集群通信端口，3001为集群选举端口，observer表示不参与集群选举
server.1=172.16.253.54:2001:3001
server.2=172.16.253.54:2002:3002
server.3=172.16.253.54:2003:3003
server.4=172.16.253.54:2004:3004:observer

2.3 启动4台Zookeeper

./bin/zkServer.sh status ./conf/zoo1.cfg
./bin/zkServer.sh status ./conf/zoo2.cfg 
./bin/zkServer.sh status ./conf/zoo3.cfg 
./bin/zkServer.sh status ./conf/zoo4.cfg

2.4 连接Zookeeper集群

./bin/zkCli.sh -server
172.16.253.54:2181,172.16.253.54:2182,172.16.253.54:2183

十、ZAB协议

1. 什么是ZBA协议

zookeeper作为非常重要的分布式协调组件，需要进行集群部署，集群中会以一主多从的形式进行部署。zookeeper为了保证数据的一致性，使用了ZAB（Zookeeper Atomic Broadcast）协议，这个协议解决了Zookeeper的崩溃恢复和主从数据同步的问题。

2. ZAB协议定义的四种节点状态

Looking ：选举状态。
Following ：Follower 节点（从节点）所处的状态。
Leading ：Leader 节点（主节点）所处状态。
Observing：观察者节点所处的状态

3. 集群上线时的Leader选举过程

Zookeeper集群中的节点在上线时，将会进入到Looking状态，也就是选举Leader的状态，这个状态具体会发生什么？
在这里插入图片描述

4. 崩溃恢复时的Leader选举

Leader建立完后，Leader周期性地不断向Follower发送心跳（ping命令，没有内容的socket）。当Leader崩溃后，Follower发现socket通道已关闭，于是Follower开始进入到Looking状态，重新回到上一节中的Leader选举过程，此时集群不能对外提供服务。

5. 主从服务器之间的数据同步