zookeeper概述

概述
Zookeeper是一个开源的分布式的，为分布式应用提供协调服务的Apache项目。
Zookeeper从设计模式角度来理解：是一个基于观察者模式设计的分布式服务管理框架，它负责存储和管理大家都关心的数据，然后接受观察者的注册，一旦这些数据的状态发生变化，Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应，从而实现集群中类似Master/Slave管理模式Zookeeper=文件系统+通知机制
特点
Zookeeper：一个领导者（leader），多个跟随者（follower）组成的集群
Leader负责进行投票的发起和决议，更新系统状态
Follower用于接收客户请求并向客户端返回结果，在选举Leader过程中参与投票
集群中只要有半数以上节点存活，Zookeeper集群就能正常服务。
全局数据一致：每个server保存一份相同的数据副本，client无论连接到哪个server，数据都是一致的。
更新请求顺序进行，来自同一个client的更新请求按其发送顺序依次执行。
数据更新原子性，一次数据更新要么成功，要么失败。
实时性，在一定时间范围内，client能读到最新数据。
数据结构
ZooKeeper数据模型的结构与Unix文件系统很类似，整体上可以看作是一棵树，每个节点称做一个ZNode。
很显然zookeeper集群自身维护了一套数据结构。这个存储结构是一个树形结构，其上的每一个节点，我们称之为"znode"，每一个znode默认能够存储1MB的数据，每个ZNode都可以通过其路径唯一标识

应用场景

统一配置管理

软负载均衡

统一集群管理

下载地址

配置参数详解`解读zoo.cfg 文件中参数含义`

tickTime
通信心跳数，Zookeeper服务器心跳时间，单位毫秒
Zookeeper使用的基本时间，服务器之间或客户端与服务器之间维持心跳的时间间隔，也就是每个tickTime时间就会发送一个心跳，时间单位为毫秒
initLimit
集群中的follower跟随者服务器(F)与leader领导者服务器(L)之间初始连接时能容忍的最多心跳数（tickTime的数量），用它来限定集群中的Zookeeper服务器连接到Leader的时限。
syncLimit
集群中Leader与Follower之间的最大响应时间单位，假如响应超过syncLimit tickTime，Leader认为Follwer死掉，从服务器列表中删除Follwer
dataDir
数据文件目录+数据持久化路径
保存内存数据库快照信息的位置，如果没有其他说明，更新的事务日志也保存到数据库
clientPort
客户端连接端口
监听客户端连接的端口

分布式搭建`zookepper`

重命名conf文件夹下的zoo_sample.cfg文件为zoo.cfg
修改dataDir的路径
添加以下配置

server.1=hadoop01:2888:3888
server.2=hadoop02:2888:3888
server.3=hadoop03:2888:3888

在dataDir路径下新建myid文件,并添加id值
与server.x里的x对应起来
启动四个服务端
sh zkServer.sh start
启动客户端
sh zkCli.sh

常用命令

zookeeper概述