数据结构 —— B树
数据结构 —— B树
- B树
- B树的插入操作
- 分裂
- 孩子分裂
- 父亲分裂
我们之前学过了各种各样的树,二叉树,搜索二叉树,平衡二叉树,红黑树等等等等,其中平衡二叉树和红黑树都是控制树的高度来控制查找次数。
但是,这都基于内存能放的下:
平衡二叉树和红黑树等数据结构确实是为了在内存中高效处理动态数据集而设计的。它们的主要目标是在各种操作(如查找、插入和删除)中保持对数时间复杂度O(log n),其中n是树中节点的数量。这意味着随着数据集的增长,操作时间不会线性增长,而是以较慢的速度增长,保持较高的性能。
在设计上,平衡二叉树和红黑树假设整个数据集能够被加载到内存中,这是因为这些树的算法和操作需要频繁地遍历树的不同部分。磁盘I/O操作比内存访问要慢得多,因此如果数据集太大而不能完全装入内存,使用这些数据结构将大大降低效率。
但是,直接在磁盘上实现平衡二叉树或红黑树通常不是最有效的方法,因为磁盘访问的成本高,而这类树的许多操作涉及多次磁盘读写。因此,对于大规模数据集,更常见的做法是使用专门针对磁盘访问优化的数据结构,如B树或B+树,它们在设计上考虑了磁盘I/O的特性,可以更有效地处理大量数据。
B树
1970年,R.Bayer和E.mccreight提出了一种适合外查找的树,它是一种平衡的多叉树,称为B树(后面有一个B的改进版本B+树,然后有些地方的B树写的的是B-树,注意不要误读成"B减树")。一棵m阶(m>2)的B树,是一棵平衡的M路平衡搜索树,可以是空树或者满足一下性质:
- 根节点至少有两个孩子
- 每个分支节点都包含k-1个关键字和k个孩子,其中 ceil(m/2) ≤ k ≤ m ceil是向上取整函数
- 每个叶子节点都包含k-1个关键字,其中 ceil(m/2) ≤ k ≤ m
- 所有的叶子节点都在同一层
- 每个节点中的关键字从小到大排列,节点当中k-1个元素正好是k个孩子包含的元素的值域划分
- 每个结点的结构为:(n,A0,K1,A1,K2,A2,… ,Kn,An)其中,Ki(1≤i≤n)为关键字,且Ki<Ki+1(1≤i≤n-1)。Ai(0≤i≤n)为指向子树根结点的指针。且Ai所指子树所有结点中的关键字均小于Ki+1。n为结点中关键字的个数,满足ceil(m/2)-1≤n≤m-1。
说白了,我们以前的树中,一个结点包含的数据量只能有一个:
B树的基本思想就是一个结点可以携带多个数据:
但是每个结点也有自己的要求:一个结点要包括数据和孩子:
假设我们是一棵3阶的B树,规定每个结点的孩子最多有3个,而数据个数比孩子个数小1:
但是我们数据个数为偶数的话,后面的分裂操作不好操作,所以我们会多开一个数据空间,但是不会装入任何数据,同时会增加一个孩子:
B树的插入操作
我们这里以3阶的B树为例:
int a[] = {53, 139, 75, 49, 145, 36, 101} //构建b树
下面我们要插入75:
这个时候数据个数已经超过了两个,需要进行分裂:
分裂
这个时候75被提出来:
接下来我们插入49,145:
孩子分裂
接着我们插入36
父亲分裂
我们这样一直插入,插入到139:
B树的插入过程是反人类的,是先有孩子,再有父亲,其中孩子会分裂,父亲也会分裂
我们来看看代码,大家能看懂多少看多少:
#pragma once
#include <iostream>
using namespace std;// B-树节点模板定义
template<class K, size_t M>
struct BTreeNode
{// 键数组,存储节点的关键字K _keys[M];// 子节点数组,存储指向子节点的指针BTreeNode<K, M>* _Children[M + 1];// 指向父节点的指针BTreeNode<K, M>* _Parent;// 节点中的实际关键字数量size_t _n;// 构造函数,初始化节点BTreeNode(){// 初始化所有键为空for (int i = 0; i < M; i++){_keys[i] = K();_Children[i] = nullptr;}// 初始化最后一个子节点指针为空_Children[M] = nullptr;_Parent = nullptr;_n = 0; // 节点中实际关键字数量为0}
};// B-树模板类定义
template<class K, size_t M>
class BTree
{typedef BTreeNode<K, M> _Node;public:// 查找键的函数pair<_Node*, int> Find(const K& key){_Node* cur = _root; // 从根节点开始查找_Node* parent = nullptr;while (cur){size_t i = 0;// 在当前节点中查找键while (i < cur->_n){if (key < cur->_keys[i]){break; // 键小于当前键,应该在左子树}else if (key > cur->_keys[i]){i++; // 键大于当前键,检查下一个键}else{return make_pair(cur, i); // 找到键,返回节点和键的索引}}// 移动到下一个子节点parent = cur;cur = cur->_Children[i];}// 没有找到键,返回父节点和-1return make_pair(parent, -1);}// 插入键到节点中的函数void InsertKey(_Node* node, const K& key, _Node* child){int end = node->_n - 1;// 找到插入位置并移动键和子节点while (end >= 0){if (key < node->_keys[end]){node->_keys[end + 1] = node->_keys[end];node->_Children[end + 2] = node->_Children[end + 1];end--;}else{break;}}// 插入新的键和子节点node->_keys[end + 1] = key;node->_Children[end + 2] = child;node->_n++;}// 插入键的主函数bool Insert(const K& key){if (_root == nullptr){// 如果树为空,创建根节点并插入键_root = new _Node();_root->_keys[0] = key;_root->_n++;return true;}pair<_Node*, int> ret = Find(key);if (ret.second >= 0){// 键已存在,返回falsereturn false;}_Node* parent = ret.first;K newkey = key;_Node* child = nullptr;while (1){// 在父节点中插入键InsertKey(parent, newkey, child);if (parent->_n < M){// 如果父节点未满,插入成功return true;}else{// 父节点已满,需要分裂size_t mid = M / 2;// 创建一个新节点,并将父节点的一部分键和子节点移动到新节点中_Node* brother = new _Node;size_t j = 0;size_t i = mid + 1;for (; i <= M - 1; i++){brother->_keys[j] = parent->_keys[i];brother->_Children[j] = parent->_Children[i];if (parent->_Children[i]){parent->_Children[i]->_Parent = brother; //父节点分裂,分裂出了父亲的brother}j++;parent->_keys[i] = K();}// 处理新节点的最后一个右孩子节点brother->_Children[j] = parent->_Children[i];if (parent->_Children[i]){parent->_Children[i]->_Parent = brother;}brother->_n = j;parent->_n -= j + 1;// 将父节点的中间键提升到新节点newkey = parent->_keys[mid];child = brother;if (parent->_Parent == nullptr){// 如果父节点是根节点,则创建新的根节点_root = new _Node();_root->_keys[0] = parent->_keys[mid];_root->_Children[0] = parent;_root->_Children[1] = brother;_root->_n = 1;parent->_keys[mid] = K();parent->_Parent = _root;brother->_Parent = _root;break;}else{// 继续向父节点的父节点插入分裂后的节点newkey = parent->_keys[mid];parent->_keys[mid] = K();child = brother;parent = parent->_Parent;}}}return true;}// 中序遍历树的函数void InOrder(){_InOrder(_root);}// 递归实现的中序遍历void _InOrder(_Node* pRoot){if (nullptr == pRoot)return;for (size_t i = 0; i < pRoot->_n; ++i){_InOrder(pRoot->_Children[i]);cout << pRoot->_keys[i] << " ";}_InOrder(pRoot->_Children[pRoot->_n]);}private:// 树的根节点_Node* _root = nullptr;
};// 测试函数
void Test()
{int a[] = { 53, 139, 75, 49, 145, 36, 101, 34, 1, 9, 41 };BTree<int, 3> t;for (auto e : a){t.Insert(e);}t.InOrder();
}
我们可以测试,如果打印的顺序是升序,说明我们代码的逻辑没问题:
写代码要注意几点:
- 插入新结点,有可能改变父子关系(是第一个数据的孩子,插入后有可能会变成第二个数据的孩子)。
- 分裂结点也有可能改变父子关系(变成父亲兄弟的孩子)
相关文章:
数据结构 —— B树
数据结构 —— B树 B树B树的插入操作分裂孩子分裂父亲分裂 我们之前学过了各种各样的树,二叉树,搜索二叉树,平衡二叉树,红黑树等等等等,其中平衡二叉树和红黑树都是控制树的高度来控制查找次数。 但是,这都…...
Redis 深度历险:核心原理与应用实践 - 读书笔记
目录 第一章 基础应用篇Zset并发问题 - 分布式锁再谈分布式锁客户端在请求时加锁失败策略redis异步队列位图Hyperloglog布隆过滤器GeoHashscan 命令字典结构rehash扩容大 key 扫描 第二章 原理篇线程IO模型RESP 序列化协议持久化管道事务PubSub内存管理 第三章 集群篇CAP主从同…...
微服务重启优化kafka+EurekaNotificationServerListUpdater
由于遇到服务重启导致的业务中断等异常,所以计划通过kafkaeureka实现服务下线通知,来尽可能规避这类问题。 如果可以升级spring,则可以考虑nacos等更为方便的方案; 程序优化: 1.默认启用的为 PollingServerListUpdater…...
removeIf 方法设计理念及泛型界限限定
ArrayList 中的 removeIf 方法是 Java 8 中引入的集合操作方法之一。它使用了 Predicate 接口作为参数,以便根据指定的条件移除集合中的元素。以下是对 removeIf 方法入参设计的详细解释: Predicate 接口 Predicate 是一个函数式接口,定义了…...
kubernetes集群部署elasticsearch集群,包含无认证和有认证模式
1、背景: 因公司业务需要,需要在测试、生产kubernetes集群中部署elasticsearch集群,因不同环境要求,需要部署不同模式的elasticsearch集群, 1、测试环境因安全性要求不高,是部署一套默认配置; 2…...
Java 随笔记: 集合与泛型
文章目录 1. 集合框架概述2. 集合接口2.1 Collection 接口2.2 List 接口2.3 Set 接口2.4 Map 接口 3. 集合的常用操作3.1 添加元素3.2 删除元素3.3 遍历元素3.4 判断大小3.5 判断是否为空 4. 迭代器4.1 迭代器的作用4.2 迭代器的使用4.3 迭代器与增强 for 循环4.4 迭代器的注意…...
SurrealDB:高效构建实时Web应用的数据库
SurrealDB:数据驱动,实时协同。用SurrealDB简化你的开发流程- 精选真开源,释放新价值。 概览 SurrealDB,一款专为现代Web应用设计的云原生数据库,以其创新的架构和功能,为开发者提供了一个强大的工具。它整…...
SQL Server查询计划阅读及分析
6.4.5. 查询计划阅读及分析 SQL Server中,SQL语句的查询计划可能会包含多个节点,每个节点除了包含和对应一个操作符外,还包含节点及操作符相关的其他信息,其细节与具体的操作符相关。SQL Server查询计划与Oracle执行计划中,虽然每个节点所包含内容的具体称谓…...
SAP Fiori 实战课程(二):新建页面
课程回顾 上一课中,利用Visual studio Code 新建、并运行了一个Demo工程。可以实现对项目的启动,启动后进入一个List清单。 那么本次课程的目前就是在上一节Demo的基础上,从零开始新建一个完整的页面。实现从首页清单,选择行后,鼠标点击,进入下一个页面。 准备工作 在开…...
【Rust光年纪】超越ORM:探索Rust语言多款数据库客户端库的核心功能和使用场景
数据库操作新选择:从异步操作到连接管理,掌握Rust语言数据库客户端库的全貌 前言 在现代软件开发中,与数据库进行交互是一个常见的任务。Rust语言作为一种高性能、内存安全的编程语言,拥有丰富的生态系统来支持各种数据库操作。…...
解决:事件监听器 addEventListener 被多次调用
背景: 给一个元素添加了事件监听,click 会触发 然而在实际场景中,点击一次,事件会被触发两次 阻止冒泡也没有用 解决: 使用API:event.stopImmediatePropagation() stopImmediatePropagation() 方法可防止…...
配置RIPv2的认证
目录 一、配置IP地址、默认网关、启用端口 1. 路由器R1 2. 路由器R2 3. 路由器R3 4. Server1 5. Server2 二、搭建RIPv2网络 1. R1配置RIPv2 2. R2配置RIPv2 3. Server1 ping Server2 4. Server2 ping Server1 三、模拟网络攻击,为R3配置RIPv2 四、在R…...
前端调试技巧:动态高亮渲染区域
效果: 前端界面的渲染过程、次数,会通过高亮变化来显示,通过这种效果排除一些BUG 高亮 打开方式 F12进入后点击ESC,进入rendering,选择前三个即可(如果没有rendering,点击橘色部分勾选上&…...
深克隆与浅克隆的区别与实现
在软件开发中,克隆对象是一个常见需求。克隆的方式主要有两种:深克隆(Deep Clone)和浅克隆(Shallow Clone)。了解它们的区别及其实现方法,对于编写高效、安全的代码非常重要。 深克隆与浅克隆的…...
【学习笔记】无人机系统(UAS)的连接、识别和跟踪(六)-无人机直接C2通信
目录 引言 5.4 直接C2通信 5.4.1 概述 5.4.2 A2X直接C2通信服务的授权策略 5.4.3 USS使用A2X直接C2通信服务的C2授权程序 5.4.4 直接C2通信建立程序 引言 3GPP TS 23.256 技术规范,主要定义了3GPP系统对无人机(UAV)的连接性、身份识别…...
认识和安装R的扩展包,什么是模糊搜索安装,工作目录和空间的区别与设置
R语言以其强大的功能和灵活的扩展性,成为了无数数据分析师和研究者的首选工具。R的丰富功能和海量扩展包直接相关,但如何高效管理这些扩展包,进而充分发挥R的强大潜力?本文将为您揭示这些问题的答案。 一、R的扩展包 R的包(packages)是由R函数、数据和预编译代码组成的一…...
解决STM32开启定时器时立即进入一次中断程序问题
转自 解决STM32开启定时器时立即进入一次中断程序问题_stm32f407定时器初始化自动进入一次-CSDN博客 配置STM32定时器时,定时器中断使能、定时器使能、清除更新中断标志位,三者不同顺序程序执行时有不同效果,具体如下: TIM_Clea…...
Unity UGUI 之EventSystem
本文仅作学习笔记与交流,不作任何商业用途 本文包括但不限于unity官方手册,唐老狮,麦扣教程知识,引用会标记,如有不足还请斧正 1.EventSystem是什么? 有需要请查看手册:Unity - 手册࿱…...
USB转多路UART - USB 基础
一、 前言 断断续续做了不少USB相关开发,但是没有系统去了解过,遇到问题就很被动了。做这个USB转UART的项目就是,于是专门花了一天的时间学习USB及CDC相关,到写这文章时估计也忘得差不多了,趁项目收尾阶段记录一下&am…...
接近50个实用编程相关学习资源网站
Date: 2024.07.17 09:45:10 author: lijianzhan 编程语言以及编程相关工具等实用性官方文档网站 C语言文档:https://learn.microsoft.com/zh-cn/cpp/c-languageMicrosoft C、C和汇编程序文档:https://learn.microsoft.com/zh-cn/cppJAVA官方文档&#…...
在数据操作中使用SELECT子句
目录 一、INSERT 语句中使用 SELECT子句 二、UPDATE 语句中使用 SELECT子句 三、DELETE 语句中使用 SELECT子句 一、INSERT 语句中使用 SELECT子句 在 INSERT 语句中使用 SELECT子句,可以将一个或多个表或视图中的数据添加到另外一个表中。使用 SELECT 子句还可以…...
Golang | Leetcode Golang题解之第274题H指数
题目: 题解: func hIndex(citations []int) int {// 答案最多只能到数组长度left,right:0,len(citations)var mid intfor left<right{// 1 防止死循环mid(leftright1)>>1cnt:0for _,v:range citations{if v>mid{cnt}}if cnt>mid{// 要找…...
区块链技术在智能家居中的创新应用探索
随着物联网技术的发展和智能家居市场的蓬勃发展,区块链技术作为一种去中心化的数据管理和安全保障技术,正在逐渐引入智能家居领域,并为其带来了新的创新应用。本文将探讨区块链技术在智能家居中的具体应用场景、优势以及未来发展方向。 智能家…...
无需业务改造,一套数据库满足 OLTP 和 OLAP,GaiaDB 发布并行查询能力
在企业中通常存在两类数据处理场景,一类是在线事务处理场景(OLTP),例如交易系统,另一类是在线分析处理场景(OLAP),例如业务报表。 OLTP 数据库擅长处理数据的增、删、改,…...
PHP 表单验证:邮件和URL
PHP 表单验证:邮件和URL 在Web开发中,表单验证是一个至关重要的环节,它确保了用户输入的数据的有效性和安全性。特别是在处理邮件地址和URL时,准确的验证尤为重要。本文将详细介绍如何使用PHP来验证表单中的邮件地址和URL。 邮件…...
前端八股文 路由的懒加载
为什么会有 路由的懒加载 在现代单页应用(SPA)的开发中,路由懒加载是一种提升应用性能的关键技术。通过按需加载组件,而非在应用启动时一次性加载所有模块,可以显著减少初次加载时间和资源消耗。本文旨在深入探讨前端…...
HarmonyOS Web组件(二)
1. HarmonyOS Web组件 官方文档 1.1. 混合开发的背景和好处 混合开发(Hybrid Development)是一种结合原生应用和Web应用的开发模式,旨在同时利用两者的优势。随着移动应用需求的多样化和复杂化,单一的开发方式往往难以满足所有…...
HarmonyOS应用开发者高级认证,Next版本发布后最新题库 - 单选题序号2
基础认证题库请移步:HarmonyOS应用开发者基础认证题库 注:有读者反馈,题库的代码块比较多,打开文章时会卡死。所以笔者将题库拆分,单选题20个为一组,多选题10个为一组,题库目录如下,…...
基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用
目录 专题一、深度学习发展与机器学习 专题二、深度卷积网络基本原理 专题三、TensorFlow与Keras介绍与入门 专题四、PyTorch介绍与入门 专题五、卷积神经网络实践与遥感图像场景分类 专题六、深度学习与遥感图像检测 专题七、遥感图像检测案例 专题八、深度学习与遥感…...
叶再豪降龙精英课程总结
文章目录 1.思维认知1.1 稻盛和夫成功公式1.2 龙头主升模式1.3 龙头主升-两种路径1.4 股市新手的炒股思路1.5 龙头案例1.6 降龙心法 2.情绪周期2.1 情绪周期2.1 情绪演绎周期2.2 情绪的四个部分2.2.1 指数的情绪周期2.2.3 热点情绪周期2.2.4 热点情绪演绎周期2.2.5 大热点支线2…...
来广营做网站公司/cba目前排名
2019独角兽企业重金招聘Python工程师标准>>> 很多人都在用spring开发Java项目,但是配置maven依赖的时候并不能明确要配置哪些spring的jar,经常是胡乱添加一堆,编译或运行报错就继续配置jar依赖,导致spring依赖混乱&…...
中山做网站价格/广东最新疫情
目录 说明 目标 实现方式 应用场景 注意事项 说明 1. 五大创建型模式之一,其他还有抽象工厂模式、单例模式、建造者模式、工厂模式。 2. 原型模式(Prototype Pattern):用原型实例指定创建对象的种类,并且通过拷贝…...
江都建设总部网站/今日头条十大新闻最新
运行行 AndroidStudio 程序。如下图,选择创建一个新的 androidstudio 工程(基于 迅为-i.mx6开发板) 应用名称改为“helloworld”,项目保存路径修改为自己的保存路径。 连续点击下一步,直到如下界面,选择“B…...
潜江资讯网招聘/如何优化关键词排名快速首页
软件功能测试对于保证软件质量至关重要。一个系统由几个组件组成,这些组件必须全部单独工作,也必须相互工作,才能实现稳健的功能。这些方面必须通过深入的功能测试来验证。软件功能测试的重点仍然主要是可访问性、可用性和主要功能测试。那么…...
用asp做网站遇到的问题/线上销售渠道有哪些
查看配置文件:https://raw.githubusercontent.com/antirez/redis/5.0.3/redis.conf 主要参数说明 redis.conf 配置项说明如下: 序号配置项说明1 daemonize no Redis 默认不是以守护进程的方式运行,可以通过该配置项修改,使用 y…...
生态农业网站建设方案/网站建设制作教程
一,数据库初识 Q1:为什么要用数据库 将文件和程序存在一台机器上上很不合理的 操作文件是一件很麻烦的事 Q2:数据库的优势 程序稳定性:这样任意一台服务所在的机器崩溃了都不会影响数据和另外的服务 数据一致性:所有的数据都存储在…...