《从Paxos到Zookeeper》——第四、七章:基本概念及原理
目录
第四章 Zookeeper与Paxos
4.1 Zk是什么
4.1.1 Zk特性
4.1.2 Zk基本概念
4.1.2.1 集群角色(Follower, Leader, Observer)
4.1.2.2 数据模型
4.1.2.3 ZNode(数据节点)
4.1.2.4 Session(会话)
4.1.2.5 ACL(Access Control Lists)
4.1.2.6 Watcher(事件监听器)
4.2 ZAB协议
第七章 Zookeeper技术内幕
7.1 系统模型
7.1.1 数据模型
7.1.2 节点特性
7.1.2.1 节点分类
7.1.2.2 节点数据
7.1.3 版本(version、cversion、aversion)
7.1.4 Watcher——数据更变的通知
7.1.5 ACL——保障数据的安全
本章重点:
- 集群角色(Follower, Leader, Observer)
- ZNode:持久/临时 + 顺序
- 版本:version、cversion、aversion
- Watcher机制
- ACL权限管理机制
第四章 Zookeeper与Paxos
4.1 Zk是什么
-
2010年11月正式成为 Apache 顶级项目
-
Zk是一个分布式数据一致性的解决方案,提供了高效且可靠的分布式协调服务。
-
应用程序可以基于它实现诸如数据发布/订阅,负载均衡,统一命名服务,分布式协调通知,配置管理,分布式锁,分布式锁等分布式的基础服务(第六章会详细提及)
-
-
ZooKeeper 并没有直接采用 Paxos 算法,而是采用了名为 ZAB(Zookeeper Atomic Broadcast) 的一致性协议
4.1.1 Zk特性
-
顺序一致性:所有客户端看到的服务端数据模型都是强一致的;从一个客户端发起的事务请求,最终都会严格按照其发起顺序被应用到 ZooKeeper 中(可见下文:原子广播)
-
原子性:所有事务请求的处理结果在整个集群中所有机器上的应用情况是一致的,即整个集群要么都成功应用了某个事务,要么都没有应用(可见下文:事务)
-
单一视图:无论客户端连接的是哪个 Zookeeper 服务器,其看到的服务端数据模型都是一致的
-
高性能:ZooKeeper 将数据全量存储在内存中,所以其性能很高。需要注意的是:由于 ZooKeeper 的所有更新和删除都是基于事务的,因此 ZooKeeper 在读多写少的应用场景中有性能表现较好;如果写操作频繁,性能会大大下滑
-
高可用:ZooKeeper 的高可用是基于副本机制实现的,此外 ZooKeeper 支持故障恢复(可见下文:选举 Leader)
4.1.2 Zk基本概念
4.1.2.1 集群角色(Follower, Leader, Observer)
-
没有沿用Master / Slave概念,引入Follower, Leader, Observer三种角色
角色 | 职责 |
---|---|
Leader |
|
Follower |
|
Observer |
|
4.1.2.2 数据模型
-
ZooKeeper 的数据模型是一个树形结构的文件系统(ZNode Tree),树中的节点被称为 ZNode。每个节点上都可以保存数据,并挂上子节点
-
模型的根节点为 /
-
节点由斜杠(/)进行分割路径,例如/foo/path1
4.1.2.3 ZNode(数据节点)
-
ZNode 通过路径被引用,ZNode 节点路径必须是绝对路径
-
每个ZNode上都会保存自己的数据内容,及一系列属性信息,大小被限制在 1MB 以内
-
ZNode 两种类型
-
临时节点(EPHEMERAL):生命周期和客户端会话绑定,会话失效后,这个客户端创建的所有临时节点都会被删除
-
持久节点(PERSISTENT):持久节点一旦被创立,除非客户端主动删除,否则会一直存在 ZooKeeper 上
-
-
ZNode 属性
-
SEQUENTIAL:ZNode 上还有一个特殊属性 (SEQUENTIAL,也称顺序标志)。如果在创建 ZNode 时,设置了SEQUENTIAL,那么 ZooKeeper 会使用计数器为该ZNode的节点名后面添加一个单调递增的整型数字(该数字由父节点维护),即 zxid。ZooKeeper 正是利用 zxid 实现了严格的顺序访问控制能力
-
Stat(版本):Zk为每个ZNode维护了一个叫Stat的数据结构,里面记录了这个ZNode的三个数据版本,分别是version(当前ZNode的版本),cversion(当前ZNode子节点的版本),aversion(当前ZNode的ACL版本)
-
4.1.2.4 Session(会话)
-
在Zk中,客户端启动时,首先通过一个 TCP 长连接连接到 ZooKeeper 服务集群,端口默认2181
-
Session 从第一次连接开始就已经建立,之后客户端通过心跳检测机制来与服务端保持有效的会话状态。通过这个连接,客户端可以发送请求并接收响应,同时也可以接收到 Watch 事件的通知。
-
一旦客户端与一台服务器建立连接,这台服务器会为这个客户端创建一个新的会话。每个会话都会有一个超时时间,若服务器在超时时间内没有收到任何请求,则相应会话被视为过期(这段时间内如果连回来了仍视为有效)。一旦会话过期,就无法再重新打开,且任何与该会话相关的临时 ZNode 都会被删除
4.1.2.5 ACL(Access Control Lists)
ZooKeeper 采用 ACL策略来进行权限控制。Zk定义了5种权限,每个 ZNode 创建时都会带有一个 ACL 列表,用于决定谁可以对它执行何种操作
-
CREATE:允许创建其子节点
-
READ:允许从节点获取数据并列出其子节点
-
WRITE:允许为节点设置数据
-
DELETE:允许删除其子节点
-
ADMIN:允许为节点设置权限
ACL 依赖于 ZooKeeper 的客户端认证机制。ZooKeeper 提供了以下几种认证方式
-
digest: 用户名和密码 来识别客户端
-
sasl:通过 kerberos 来识别客户端
-
ip:通过 IP 来识别客户端
4.1.2.6 Watcher(事件监听器)
-
Watcher(事件监听器)是Zk的一个重要特性。Zk允许用户在指定ZNode上注册一些Watcher,并在特定事件触发时,Zk服务端会将事件通知到注册的客户端。该机制是Zk实现分布式协调服务的重要特性。
4.2 ZAB协议
全称Zookeeper Atomic Broadcast(原子消息广播协议),与Paxos算法类似。比较复杂,不赘述。
第七章 Zookeeper技术内幕
7.1 系统模型
介绍五方面:数据模型、节点特性、版本、Watcher、
7.1.1 数据模型
-
树:ZooKeeper 的数据模型是一个树形结构的文件系统(ZNode Tree),树中的节点被称为 ZNode,每个节点上都可以保存数据,并挂上子节点
-
事务ID
-
在Zk中,事务是指能改变服务器状态的操作。一般包括节点创建,节点删除,节点内容更新,客户端会话创建,客户端会话失效 等操作
-
对于每一个事务请求,Zk会为其分配一个全局事务ID,用ZXID表示,通常是64位数字。每一个ZXID对应一次更新操作,可以根据值识别出各个操作的执行顺序
-
7.1.2 节点特性
7.1.2.1 节点分类
在Zk中,节点类型可以分为三类:持久节点(P),临时节点(E),顺序节点(S)节点有以下特性
节点特性 | 备注 | 默认 |
---|---|---|
持久(P) / 临时(S) | 必选,二选一 | 持久(P) |
顺序(S) | 是 / 否 | 非顺序 |
具体在节点的创建过程中,通过组合使用,可以生成以下四种组合型节点类型
-
持久节点(Persistent):被创建后一直存在于服务器上,直至被删除操作主动清除。最常见的节点。
-
持久顺序节点(Persistent_Sequential):在创建节点时可以设置这个标记,则每个父节点会维护其子节点的先后顺序。即在创建过程中,自动为节点加上一个数字后缀,作为节点名,上限是Integer.MAX
-
临时节点(Ephemeral):
-
临时节点的生命周期与客户端会话Session绑定在一起,会话失效,则节点被自动清理
-
Zk规定了不能基于临时节点来创建子节点,即临时节点只能是叶子节点
-
-
临时顺序(Ephemeral_Sequential):在临时节点的基础上,添加了顺序的特性
7.1.2.2 节点数据
节点的存储包含两部分
-
用户写入节点的数据内容
-
节点自身的一些状态信息,这些状态信息存在Stat的结构体中,包括事务ID、版本信息、子节点个数
7.1.3 版本(version、cversion、aversion)
-
Zk为数据节点引入了版本version的概念,Zk中每个数据节点都有三类版本号,对节点的任何操作都会引起这三个版本号的变化
-
version:当前数据节点数据内容的修改次数
-
cversion:当前数据节点子节点的修改次数
-
aversion:当前数据节点ACL更变的修改次数
-
-
以version为例
-
节点第一次创建时,version=0;对数据内容更变后,version=1
-
需要注意的是,即使前后的数据内容没变,version依然会变,version强调的是更变次数
-
-
Zk设计version的目的:基于CAS乐观锁的思想进行更新
-
从源码来看,request里会带上请求的version,Zk服务端处理request时会校验version
-
request中的version=-1:表示客户端不要求使用乐观锁,因此会忽略版本对比;
-
request中的version!=-1:表示客户端要基于乐观锁更新
-
Zk服务端会比较请求的version和当前节点的currentVersion,一致则更新,不一致就抛异常
-
-
-
7.1.4 Watcher——数据更变的通知
-
在Zk中,引入了Watcher来实现分布式数据的发布/订阅功能,整体通知如下
-
①客户端向Zk服务器注册Watcher,并将Watcher存储在自身的WatcherManager中
-
②Zk服务器触发Watcher事件后,向客户端发送通知
-
③客户端线程从WatcherManager中取出对应的Watcher对象,执行回调逻辑
-
-
整体代码与逻辑:不罗列了
-
Watcher特性总结如下
-
一次性:一旦一个Watcher被触发,Zk会将其移除。因此开发者需要反复注册。这种设计有利于减轻服务端压力
-
客户端串行执行:客户端Watcher回调是一个串行同步的过程,因此保证了顺序
-
轻量:Watcher通知非常轻量,只会告诉客户端发生了某种事件,不会传达事件详情。这点需要客户端收到事件后主动重新拉取。有利于网络和内存开销
-
7.1.5 ACL——保障数据的安全
-
ACL的重要性:通过ACL(Access Control List)权限控制机制保障数据的安全
-
ACL介绍:可以从三方面理解该机制:权限模式(Scheme),授权对象(ID),权限(Permission),通常使用 "scheme:id:permission" 来标识一个有效的ACL信息
-
权限模式(Scheme):权限验证过程中使用哪个策略,开发人员使用最多的是以下四种权限
-
IP:针对IP地址维度进行控制
-
例1:"ip:192.168.0.110":表示控制权限只针对这个IP
-
例2:"ip:192.168.0.1/24":表示针对192.168.0.*这个IP段进行权限控制
-
-
Digest:最常用的,类似于"username:password"的形式
-
Zk会对其进行编码,将这种形式编码成无法辨识的字符串,避免明文
-
-
World:开放者模式,不校验权限,权限对所有用户开放
-
可以看作是特殊的Digest模式,即"world:anyone"
-
-
Super:也是一种特殊的Digest模式,相当于管理员(超级用户)模式,超级用户可以操作所有节点
-
-
授权对象(ID):与上述的权限模式配合使用。在不同的scheme下,id是不同的。见下图
-
权限(Permission):权限就是通过了权限检查后可以被允许执行的操作。在Zk中操作可分以下5类
-
CREATE:允许 授权对象 创建该节点的子节点
-
READ:允许 授权对象 从该节点读取数据 或 子节点列表 等
-
WRITE:允许 授权对象 对该节点进行更新操作
-
DELETE:允许 授权对象 删除该节点的子节点
-
ADMIN:允许 授权对象 为该节点设置ACL权限
-
-
ACL的管理
-
ACL设置:在Zk服务端有两种方式能对ACL进行设置
-
方式
例子
方式一:创建节点的同时设置ACL参数,命令格式如下:【create [-s] [-e] path data acl】
方式二:通过setAcl命令,单独对已存在的节点进行设置:【setAcl path acl】
-
-
如何使用Super模式
-
Super模式由来:如果一个持久数据节点的创建者客户端已下线,那么该如何清理?需要一个超级管理员
-
使用方式:
-
在ZK服务器上开启Super模式:在服务端启动时,添加以下属性
-
-
-
-
相关文章:

《从Paxos到Zookeeper》——第四、七章:基本概念及原理
目录 第四章 Zookeeper与Paxos 4.1 Zk是什么 4.1.1 Zk特性 4.1.2 Zk基本概念 4.1.2.1 集群角色(Follower, Leader, Observer) 4.1.2.2 数据模型 4.1.2.3 ZNode(数据节点) 4.1.2.4 Session(会话) 4.1.2.5 ACL(Access Control Lists) 4.1.2.6 Watcher(事件…...

网络演进技术演进:裸纤专线、SDH、MSTP+、OTN、PTN、IP-RAN
前言 文章主要介绍常见名词以及其在各自领域实现的功能价值。 01 裸纤 裸光纤(裸光纤)由运营商提供,是无中继的光纤线路,仅通过配线架连接。相比传统光纤,裸光纤提供纯粹的物理传输路径,无需额外网…...
MMC设备
MMC(MultiMediaCard)是一种闪存卡标准,用于作为便携式设备上的存储媒介,例如数码相机、智能手机、平板电脑、个人数字助理(PDA)以及其他便携式设备。MMC卡最初是由SanDisk和Siemens AG开发的,并…...

图片浏览器-PicView
一、前言 PicView 是一款适用于 Windows 10 或 11 的快速高效的图像查看器,配备了干净简洁的用户界面,可以在不需要时方便地隐藏。 二、支持类型 它支持广泛的图像文件类型,包括:WEBP、GIF、SVG、PNG、JXL、HEIC、PSD 三、软件特…...
一些零碎小知识
函数递归复习 #define 的头文件包含 #define定义标识符常量 等define其他用法 斐波那契数列 函数栈帧 青蛙跳台问题 汉诺塔问题 字符“0”与0的计算 “0”-“0”0; 最后一次作业题一道 素数 随机数 strand timer rand 水仙花数 变种随鲜花 斐波那契数…...

2.2 Java全栈开发前端+后端(全栈工程师进阶之路)-前端框架VUE3-基础-Vue基本语法
文本渲染指令 文本渲染指令-v-html与v-text Vue使用了基于HTML的模板语法,允许开发者声明式地将DOM绑定至底层Vue实例的数据。所有Vue的模板都是 合法的HTML,所以能被遵循规范的浏览器和HTML解析器解析。 在前面,我们一直使用的是字符串插…...

(Arxiv,2024)Mind the Modality Gap:通过跨模态对齐建立遥感视觉语言模型
文章目录 相关资料摘要引言相关工作对比语言图像预训练遥感域专用 CLIP 模型遥感中的多模态 CLIP 启发模型 方法模型算法输入阶段:输出阶段:步骤说明: 第一阶段:通过权重插值修补CLIP将遥感图像模态与自然图像和文本对齐 实验 相关…...
区块链 | 一文了解 NFT 的生态系统(上)
🐶原文: Understanding Security Issues in the NFT Ecosystem 🐶写在前面: 本博客只摘取了原论文的第二、三节。 技术背景知识 在本节中,我们将介绍以太坊生态系统的构建模块,重点关注「NFT,…...
为什么centos官方版不支持arm架构?
为什么centos官方版不支持arm架构? 1、资源限制:CentOS是由社区维护的开源操作系统,其开发和维护需要大量的人力和物力资源。由于ARM架构的设备相对较少,社区资源有限,因此官方版CentOS选择集中精力在x86架构上进行开发…...
awk小尝试2(随手记)
文章目录 需求1解法 需求2解法(3种-grep/sed/awk) 需求1 使用hostname -I创建文件名 echo hostname -I.txt 10.0.0.124 .txt # 需要注意,这里的.txt前有一个空格,需要去掉,不然就是两个文件名解法 echo hostname -I…...

Vue的项目启动指令分析
通过Vue CLI脚手架创建的项目,默认的启动项目方式是 npm run serve 这里的serve是可以修改的。 在创建的项目目录中,找到package.json 双击打开,找到scripts部分 在scripts部分,有一个"serve"键值对,这里的…...

年轻人刮疯了,刮刮乐断货了
年轻人刮疯了 刮刮乐缺货了。 00后彩票店老板陆诗等得有点着急。她的福彩店开在深圳,今年4月才开门营业,但从开业到今天,刮刮乐总共就来了一回货——开业时发的20本。 那之后,刮刮乐就彻底断供了。原本,陆诗想把刮刮…...

25 JavaScript学习:var let const
JavaScript全局变量 JavaScript中全局变量存在多种情况和定义方式,下面详细解释并提供相应的举例: 使用var关键字声明的全局变量: var globalVar "我是全局变量";未使用var关键字声明的变量会成为全局变量(不推荐使用&…...

docker部署的nacos2.2x开启鉴权功能
注意在2.2.0版本之后如果不开启鉴权,那么默认不需要登录就可以访问 所以我们需要手动开启鉴权,nacos启动好以后来到容器内部修改 docker exec -it nacos /bin/shvim conf/application.properties在第34行下面添加 nacos.core.auth.enabledtrue nacos.cor…...

【数据结构与算法】之五道链表进阶面试题详解!
目录 1、链表的回文结构 2、相交链表 3、随机链表的复制 4、环形链表 5、环形链表(||) 6、完结散花 个人主页:秋风起,再归来~ 数据结构与算法 个人格言:悟已往之不谏,知…...

vue2实现生成二维码和复制保存图片功能(复制的同时会给图片加文字)
<template><divstyle"display: flex;justify-content: center;align-items: center;width: 100vw;height: 100vh;"><div><!-- 生成二维码按钮和输入二维码的输入框 --><input v-model"url" placeholder"输入链接" ty…...
Redis之字符串类型深入之SDS底层结构
作为一名程序员不可能不知道redis 知道redis不可能不知道redis的字符串 如果你真的熟悉redis不能不知道sds, 我们探究一下redis字符串的底层结构 sds翻译过来就是动态扩容(Simple Dynamic String)、先看一下最早版本redis的sds结构体 struct sdshdr{int len; //记录数组中…...

Cesium 3dTileset 支持 uv 和 纹理贴图
原理: 使用自定义shader实现uv自动计算 贴图效果: uv效果:...
C++可变参数模板中的省略号
看可变参数模板代码时常会遇到省略号的使用,这类奇特的“...”出现位置还不固定,容易引起困惑。C最近一直不用都快废了,在此想对省略号的使用做个简单归纳以提醒自己。可变参数模板以两种方式使用省略号。 在参数名称的左侧,表示“…...
uni-ui 使用uni-icons有些图标显示不出来,如down,up图标
问题描述 我使用的是uni创建时勾选的uni-ui模板,一次偶然机会发现down图标显示不出,left,right等其他图标又可以。 最后发现使用uni-icons不是最新版本导致的,使用模板生成的icons是1.3.5版本,我在插件市场找到的是2.0…...

TDengine 快速体验(Docker 镜像方式)
简介 TDengine 可以通过安装包、Docker 镜像 及云服务快速体验 TDengine 的功能,本节首先介绍如何通过 Docker 快速体验 TDengine,然后介绍如何在 Docker 环境下体验 TDengine 的写入和查询功能。如果你不熟悉 Docker,请使用 安装包的方式快…...

聊聊 Pulsar:Producer 源码解析
一、前言 Apache Pulsar 是一个企业级的开源分布式消息传递平台,以其高性能、可扩展性和存储计算分离架构在消息队列和流处理领域独树一帜。在 Pulsar 的核心架构中,Producer(生产者) 是连接客户端应用与消息队列的第一步。生产者…...

MMaDA: Multimodal Large Diffusion Language Models
CODE : https://github.com/Gen-Verse/MMaDA Abstract 我们介绍了一种新型的多模态扩散基础模型MMaDA,它被设计用于在文本推理、多模态理解和文本到图像生成等不同领域实现卓越的性能。该方法的特点是三个关键创新:(i) MMaDA采用统一的扩散架构…...
Frozen-Flask :将 Flask 应用“冻结”为静态文件
Frozen-Flask 是一个用于将 Flask 应用“冻结”为静态文件的 Python 扩展。它的核心用途是:将一个 Flask Web 应用生成成纯静态 HTML 文件,从而可以部署到静态网站托管服务上,如 GitHub Pages、Netlify 或任何支持静态文件的网站服务器。 &am…...

Nuxt.js 中的路由配置详解
Nuxt.js 通过其内置的路由系统简化了应用的路由配置,使得开发者可以轻松地管理页面导航和 URL 结构。路由配置主要涉及页面组件的组织、动态路由的设置以及路由元信息的配置。 自动路由生成 Nuxt.js 会根据 pages 目录下的文件结构自动生成路由配置。每个文件都会对…...
WEB3全栈开发——面试专业技能点P2智能合约开发(Solidity)
一、Solidity合约开发 下面是 Solidity 合约开发 的概念、代码示例及讲解,适合用作学习或写简历项目背景说明。 🧠 一、概念简介:Solidity 合约开发 Solidity 是一种专门为 以太坊(Ethereum)平台编写智能合约的高级编…...
#Uniapp篇:chrome调试unapp适配
chrome调试设备----使用Android模拟机开发调试移动端页面 Chrome://inspect/#devices MuMu模拟器Edge浏览器:Android原生APP嵌入的H5页面元素定位 chrome://inspect/#devices uniapp单位适配 根路径下 postcss.config.js 需要装这些插件 “postcss”: “^8.5.…...

Docker 本地安装 mysql 数据库
Docker: Accelerated Container Application Development 下载对应操作系统版本的 docker ;并安装。 基础操作不再赘述。 打开 macOS 终端,开始 docker 安装mysql之旅 第一步 docker search mysql 》〉docker search mysql NAME DE…...
QT3D学习笔记——圆台、圆锥
类名作用Qt3DWindow3D渲染窗口容器QEntity场景中的实体(对象或容器)QCamera控制观察视角QPointLight点光源QConeMesh圆锥几何网格QTransform控制实体的位置/旋转/缩放QPhongMaterialPhong光照材质(定义颜色、反光等)QFirstPersonC…...
MySQL JOIN 表过多的优化思路
当 MySQL 查询涉及大量表 JOIN 时,性能会显著下降。以下是优化思路和简易实现方法: 一、核心优化思路 减少 JOIN 数量 数据冗余:添加必要的冗余字段(如订单表直接存储用户名)合并表:将频繁关联的小表合并成…...