当前位置: 首页 > news >正文

数据结构——二叉树的基本概念及顺序存储(堆)

fe594ea5bf754ddbb223a54d8fb1e7bc.gif

目录

一.前言

二.树概念及结构

2.1 树的概念

2.2 树的相关概念

2.3 树的表现

2.4 树在实际中的应用(表示文件系统的目录树结构)

三.二叉树的概念及结构

3.1 概念

3.2 特殊的二叉树

3.3 二叉树的性质

3.4 二叉树的存储结构

3.4.1 顺序存储

3.4.2 链式存储

四.二叉树顺序结构及实现

4.1 二叉树的顺序结构

4.2 堆的概念及结构

4.3 堆的实现

4.3.1 堆向下调整算法(略)

4.3.2 堆的创建(略)

4.3.3 建堆时间复杂度(略)

4.3.4 堆的插入(略)

4.3.5 堆的删除(略)

4.3.6 堆代码的实现(详)

 4.3.6.1初始化函数

4.3.6.2 销毁函数

4.3.6.3 插入函数

4.3.6.4 向上调整函数

4.3.6.5 交换函数

 4.3.6.6打印函数

4.3.6.6 删除函数

4.3.6.7 向下调整函数

4.3.6.8 获取根值函数

4.3.6.9 判空函数

4.3.6.10 堆排序 

4.3.6.11向下调整去建堆

4.3.6.12 建堆复杂度的证明 

4.3.6.13 小练习(选看)

五.全部代码

六.结语


8fb442646f144d8daecdd2b61ec78ecd.png一.前言

友情提醒:本文前面对概念涉及颇深,如果有友友了解二叉树的基本概念,想要看核心代码实现可以直接翻找目录移至四.二叉树顺序结构及实现片段开始阅读。码字不易,希望大家多多支持我呀!(三连+关注,你是我滴神!)

二.树概念及结构

2.1 树的概念

树是一种非线性的数据结构,它是由n(n>=0)个有限节点组成一个具有层次关系的集合,把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。

  • 有一个特殊的结点,称为根结点,根结点没有前驱结点。
  • 除根结点外,其余结点被分为m(m>0)个互不相交的集合T1、T2、... 、Tm,其中每一个集合Ti(1<=i<=m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继。
  • 因此,树是递归定义的。

注意:树形结构中,子树之间不能有交集,否则就不是树形结构。

2.2 树的相关概念

下面有一些关于树的术语,大家如有疑惑可以看此解析

结点的度:一个结点含有的子树的个数称为该结点的度;如上图:A的为6

叶结点或终端结点:度为0的结点称为叶结点;如上图:B、C、H、I...等结点为叶结点

非终端结点或分支结点:度不为0的结点;如上图:D、E、F、G...等结点为分支结点

双亲结点或父结点:若一个结点含有子结点,则这个结点称为其子结点的父结点;如上图:A是B的父结点

孩子结点或子结点:一个结点含有的子树的根结点称为该结点的子结点;如上图:B是A的孩子结点

兄弟结点:具有相同父结点的结点互称为兄弟结点;如上图:B、C是兄弟结点

树的度:一棵树中,最大的结点的度称为树的度;如上图:树的度为6

结点的层次:从根开始定义起,根为第一层,根的子结点为第二层,以此类推

树的高度或深度:树中结点的最大层次;如上图:树的高度为4

堂兄弟结点:双亲在同一层的结点互为堂兄弟;如上图:H、I互为兄弟结点

结点的祖先:从根到该结点所经分支上的所有结点;如上图:A是所有结点的祖先

子孙:以某结点为根的子树中任一结点都称为该结点的子孙。如上图:所有结点都是A的子孙

森林:由m(m>0) 棵互不相交的树的集合称为森林

2.3 树的表现

左孩子右兄弟表示法:当A生了3个孩子:B C D时,永远指向最左边的孩子B),然后让孩子B去带孩子C,孩子C去带孩子D

A只生了3个孩子,所以最后的孩子D指向空,而A也没有兄弟,那么根据左孩子右兄弟的指法,A右边也指向空。

最后再看向E F,B有两个孩子是EF,根据右孩子所以指向最右边的孩子E,而E兄弟F,根据右兄弟E指向F,最后F指向空

那么最后我们如何判断一个结点是不是叶子呢?只需要看(firstchild)是否为空就行了。

树结构相对线性表就比较复杂了,要存储表示起来比较麻烦,既要保存值域,也要保存结点和结点之间的关系,实际中树有很多种表示方法如:双亲表示法,孩子表示法,孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单地了解其中最常用的孩子兄弟表示法。 

//树的最优设计
struct  TreeNode
{int val;                     //结点中的数据域struct TreeNode* firstchild; //第一个孩子结点struct TreeNode* nextbrother;//指向其下一个兄弟结点
};

孩子兄弟法演示图: 

拓展:双亲表示法演示图 

  • 判断有几棵树——(看几个-1)。因为A和B找不到父亲的下标就给数值-1。
  • 判断两个结点在不在同一棵树(看根一不一样)。通过对比所在父亲的下标是否相同来判断。

注:链式结构看指针,下标看数组

2.4 树在实际中的应用(表示文件系统的目录树结构)

三.二叉树的概念及结构

3.1 概念

一棵二叉树是结点的一个有限集合,该集合:

  • 或者为空
  • 由一个根结点加上两棵别称为左子树和右子树的二叉树组成

从上图可以看出:

  • 二叉树不存在度大于2的结点
  • 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树

注意:对于任意的二叉树都是由以下几种情况复合而成的:

3.2 特殊的二叉树

  • 满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为K,且结点总数是2^k-1,则它就是满二叉树。
  • 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点——对应时称之为完全二叉树。要注意的是满二叉树是一种特殊的完全二叉树。

假设它的高度是h,每一层都是满的。

假设它的高度是h,前h-1层是满的,最后一层不一定满,从左到右是连续的。

比如我们移动一个结点后最后一层不再是连续的了,那就不叫做完全二叉树。 

下面我们来看看在高度为h中二叉树的结点数是多少~

我们还可以通过结点来反推高度h

至于高度为h完全二叉树的结点范围,最多结点那就是跟满二叉树一样(2^h-1

最少结点呢?我们可以把它拆成高度为h-1满二叉树,此时结点为(2^(h-1)-1)。最后在h层添上一个节点就是最少结点(2^(h-1)

3.3 二叉树的性质

  • 若规定根结点的层数为1,则一棵非空二叉树的第i层上最多有2^(i-1)个结点
  • 若规定根结点的层数为1,则深度为h的二叉树的最大结点数是2^h-1
  • 对任何一棵二叉树,如果度为0其叶结点个数为n0,度为2的分支结点个数为n2,则有n0=n2+1
  • 若规定根结点的层数为1,具有n个结点的满二叉树的深度,h=\log_2(n+1)
  • 对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数值顺序对所有结点从0开始编号,则对于序号为i的结点有:
  1. 若i>0, i位置结点的双亲序号:(i-1)/2;i=0;i为根结点编号,无双亲结点
  2. 若2i+1<n,   左孩子序号:2i+1,  2i+1>=n否则无左孩子
  3. 若2i+2<n,右孩子序号:2i+2,2i+2>=n否则无右孩子

下面来几道练习题~ 

第一问:叶子结点就是度为0的点,通过n0=n2+1公式可以得出为200个,故选A。

第二问:非完全二叉树不适合,会空出数组位置。故选A

第三问:

N1只能是1,因为n只能是整数,故选A。

第四问:

我们可以根据完全二叉树结点数的范围来判断h为多少(把h代入看是否超过范围)。故选B

第五问:

跟第三问一样的特点,只不过767是一个奇数,所以N1只能取0.故选B

3.4 二叉树的存储结构

二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。

3.4.1 顺序存储

顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储,二叉树顺序存储在物理上是一个数组,在逻辑上是一棵二叉树。

左孩子为其父亲所示下标*2+1,右孩子为父亲所示下标*2+2.反过来孩子其父亲的坐标也可以反推——parent = (child-1)/2

注:右孩子都在偶数位上,但6-1=5,5/2还是2公式还是可以用

任意位置通过下标可以找父亲或者孩子

如果是不完全二叉树适不适合用该存储结构呢?——不适合用这样的结构(数组存储)

满二叉树或者完全二叉树适合,不完全二叉树适合用链式结构存储

3.4.2 链式存储

二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给该结点左孩子和右孩子所在的链结点的存储地址。链式结构又分为二叉链和三叉链,当前我们学习中一般都是二叉链。

四.二叉树顺序结构及实现

4.1 二叉树的顺序结构

普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。

4.2 堆的概念及结构

如果有一个关键码的集合k={k0,k1,k2,...k(n-1)},把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中,并满足:ki<=k()2i+1)且ki<=k(2i+2)   (ki>=k(2i+1)且ki>=k(2i+2)) i=0,1,2...,则称为小堆(或大堆)。将根结点最大的堆叫做最大堆或大根堆,根结点最小的堆叫做最小堆或小根堆。

堆的性质:

  • 堆中某个结点的值总是不大于或不小于其父结点的值;
  • 堆总是一棵完全二叉树。

注:说的是数值而不是下标

我们来用练习题来体会其中的规律~

选项A:我们先按照完全二叉树的定义把堆给表现出来(注意连续),后面发现这是大堆树中任意一个父亲都>=孩子

选项D:我们会发现从上面是一个小堆,而下面又是一个大堆,这是明显矛盾的,所以判定为错误。

底层:

  • 物理结构,数组
  • 逻辑结构,完全二叉树

问:如果是小堆,那底层数组是否升序呢?——不一定~

但可以确定的是小堆的根是整棵树的最小值。

堆的运用:

  • topk问题
  • 堆排序(时间复杂度——O(N*logN)

————————————————————————————————以上都是概念。

4.3 堆的实现

4.3.1 堆向下调整算法(略)

4.3.2 堆的创建(略)

4.3.3 建堆时间复杂度(略)

4.3.4 堆的插入(略)

4.3.5 堆的删除(略)

4.3.6 堆代码的实现(详)

 4.3.6.1初始化函数
//初始化函数
void HeapInit(HP* php)
{assert(php);php->a = NULL;php->size = 0;php->capacity = 0;}

这是我们的老朋友了,基本每篇文章都写一遍哈哈~ 

另一种初始化函数

//另一种初始化函数
void HeapInitArray(HP* php, int* a, int n)
{assert(php);assert(a);php->a = (HPDataType*)malloc(sizeof(HPDataType) * n);if (php->a == NULL){perror("malloc fail");exit(-1);}php->size = 0;php->capacity = 0;memcpy(php->a, a, sizeof(HPDataType) * n);for (int i = 1; i < n; i++){AdjustUp(php->a, i);}
}

直接给你一个数组,然后把这个数组直接插入堆里面去。原先的初始化是不给值,然后一个一个慢慢插入堆 

4.3.6.2 销毁函数
//销毁函数
void HeapDestroy(HP* php)
{assert(php);free(php->a);php->a = NULL;php->size = php->capacity = 0;
}
4.3.6.3 插入函数

  假设我们插入的数是90,在小堆中刚好可以直接插入,不需要做其他的变动。

那如果我们插入50呢?这样就破坏的小堆的结构了,所以我们需要调整插入的位置。按照小堆的规则我们不可能去向下进行调整,那只好去找上面的结点了~

所以我们现在就要去找该结点的父亲位置了,通过公式(child-1)/2推出父亲为下标2的56

找到后如果该结点比它父亲大,那就不动如果小,那么就得交换位置。相当于让50当父亲,56当儿子,这样才能维持小堆结构。

当然这样还不算结束,我们交换完还得再跟10这个根进行比较,完成上述操作后才可以算是达成小堆的结构。

最坏情况是要调到根才结束,

//插入函数
void HeapPush(HP* php, HPDataType x)
{assert(php);//扩容if (php->size == php->capacity){int newCapacity = php->capacity == 0 ? 4 : php->capacity * 2;HPDataType* tmp = (HPDataType*)realloc(php->a, sizeof(HPDataType) * newCapacity);if (tmp == NULL){perror("realloc fail");exit(-1);}php->a = tmp;php->capacity = newCapacity;}php->a[php->size] = x;php->size++;AdjustUp(php->a, php->size-1);//不仅要把数组传过去,我们还得把孩子也传过去,而孩子可以通过下标找到}

扩容和插入都是很常见的操作了,在成功插入后(尾插),我们还得去做向上的一个调整(毕竟插入后并不能保证可以维持原来小堆或大堆的结构)。

PS: 之所以要传尾部是因为我们插入的数据是在尾部,所以得从该数据插入起进行调整。

4.3.6.4 向上调整函数

当发现插入的孩子小于父亲时,进行交换。然后再让5去当孩子继续和新的父亲10进行对比。

那要在什么时候才算是结束调整呢?在最坏情况下,孩子5父亲10发现交换,child指向5,而parent则指向数组外,说明当parent小于0时就代表无需调整。

但是这里有一点需要注意,如果按照孩子5已经为根(child==0)的计算规则其父亲下标为(child-1)/2结果将会是0.而不是-0.5,那代表调整还未结束,发生矛盾。

所以我们这里调整结束的条件改为(child>0),当child等于0也意味着调整结束了。

//向上调整函数
void AdjustUp(HPDataType* a, int child)
{int parent = (child - 1) / 2;while (child > 0){if (a[child] < a[parent]){Swap(&a[child], &a[parent]);child = parent;parent = (parent - 1) / 2;}else{break;}}
}
4.3.6.5 交换函数
//交换函数
void Swap(HPDataType* p1, HPDataType* p2)
{HPDataType tmp = *p1;*p1 = *p2;*p2 = tmp;
}
 4.3.6.6打印函数
//打印函数
void HeapPrint(HP* php)
{assert(php);for (size_t i = 0; i < php->size; i++){printf("%d ", php->a[i]);}printf("\n");}

做完以上这些函数,我们就来测试一下:

int main()
{int a[] = { 65, 100, 70, 32, 50, 60 };HP hp;HeapInit(&hp);for (size_t i = 0; i < sizeof(a) / sizeof(int); i++){HeapPush(&hp, a[i]);}HeapDestroy(&hp);return 0;
}

测试完毕,插入后进行调整还是小堆~

PS:我们这里的插入是额外开辟一个空间然后从数组里面取值,在开辟的空间里一个一个插入。

4.3.6.6 删除函数

有一个问题,在堆的删除中,我们删除谁比较有意义呢?

如果只是删除尾,那没有什么意义~最有意义的就是删除根,至于为什么,下面就来演示一番~

注:挪动覆盖数组的方式并不可取,这样无法保证小堆原有的结构。

我们可以这样操作:让根与尾的数据进行交换,再删除,这样的好处是不会破坏原有的左右子树的小堆结构。

然后我们再根据新的根进行向下调整来维持小堆的结构,注:无论是向下调整还是向上调整,它们的前提都是左右子树为小堆或大堆。

向下调整:我们先找出根下面的左右两个孩子,然后和二者中最小的进行对比,这里左孩子50右孩子60更小,让根70左孩子50作对比,发现左孩子比根还小,按照小堆的规则两者需要进行交换。

以此类推,直到最后和叶子65进行对比。向下调整就是把小的往下调,大的往下沉这样一个过程。

其实这里的Pop还有另外一层意义——找出当前二叉树中最小的值。

时间复杂度:O(logN) 具有极高效率的算法排序

//删除函数
void HeapPop(HP* php)
{assert(php);assert(php->size > 0);Swap(&php->a[0], &php->a[php->size - 1]);php->size--;//删除数据AdjustDown(php->a, php->size, 0);
}
4.3.6.7 向下调整函数

在这里我们不去刻意区分左孩子和右孩子,而是先假设左孩子是最小的,如果实际上是右孩子小,那就让它们进行交换。最后换到叶子就终止。——先假设,错误再纠正。

//向下调整函数
void AdjustDown(HPDataType* a, int n, int parent)
{//假设左右孩子中小的为左孩子int child = parent * 2 + 1;while (child<n)//换到叶子就终止,循环结束后child已经是指向数组外了{//找出小的孩子if (child+1<n&&a[child + 1] < a[child])//如果右孩子比左孩子小{child++;//小的孩子变成右孩子}if (a[child] < a[parent]){Swap(&a[child], &a[parent]);//继续向下调整parent = child;child = parent * 2 + 1;//跟向上调整法一样,交换完后把parent和child都移下一层为下一次的循环作准备}else{break;}}
}

点需要注意,在我们规定好child<n的条件后还要判定child+1是否在该范围内

就比如我们把在调整第二行80的位置时(尾部的80已经和堆顶的32交换完毕,接着80和它的右孩子40交换完毕),按照我们的代码是会去找到child+1,可是画圈部分根本没有右孩子,所以为了避免它越界随便找一个值替代,我们要再多加一个判定条件——child+1<n。

4.3.6.8 获取根值函数
//获取根值函数
HeapTop(HP* php)
{assert(php);assert(php->size > 0);return php->a[0];
}
4.3.6.9 判空函数
//判空函数
bool HeapEmpty(HP* php)
{assert(php);return php->size == 0;
}

测试一下:我们去取最小、次小等等的数据

int main()
{int a[] = { 65, 100, 70, 32, 50, 60 };HP hp;HeapInit(&hp);for (size_t i = 0; i < sizeof(a) / sizeof(int); i++){HeapPush(&hp, a[i]);}HeapPrint(&hp);while (!HeapEmpty(&hp)){printf("%d ", HeapTop(&hp));HeapPop(&hp);}HeapDestroy(&hp);return 0;
}

最后会发现取出来的确实都是最小的,最后形成升序的结果。只要我们去修改成大堆或小堆,就可以起到降序或升序的效果~

4.3.6.10 堆排序 

当然现在这样还不算是真正的堆排序,因为我们只是打印出来排序的堆,要想用堆实现数组本身的排序,请看如下解析:

void HeapSort(int* a, int n)
{HP hp;HeapInit(&hp);for (size_t i = 0; i < sizeof(a) / sizeof(int); i++){HeapPush(&hp, a[i]);}int i = 0;while (!HeapEmpty(&hp)){//printf("%d ", HeapTop(&hp));//关键代码,真正实现对数组内部的排序a[i++] = HeapTop(&hp);HeapPop(&hp);}HeapDestroy(&hp);
}int main()
{int a[] = { 65, 100, 70, 32, 50, 60 };HeapSort(a, sizeof(a) / sizeof(int));return 0;
}

但这种写法有两个大缺陷:

  • 先有一个堆的数据结构
  • 空间复杂度的消耗(为了排序额外开辟了一块数组空间)

所以我们还需要进行优化:

我们不用先去开辟空间搞堆,直接把数组当成堆去看

目前数组只能说是排成堆的模样,但还不是堆,所以我们需要对它进行调整——建堆

最核心的部分!!!

在我们前面写的向上调整法中一般都是把最后的数据传递进去再进行调整整个堆,因为我们的插入算是尾插,所以传的也只是尾部数据。而在上图中,我们可以想象该数组只有一个数——70自成堆),然后我们插入65进行向上调整(比如我们想要调成大堆),调整完毕后变成70——65两个数组成堆),就这样以此类推地去插入数据,这样就是建堆的关键!——遍历除堆顶以外的数字,把每一次的调整都看作是尾插。

最后来验证一下:

void HeapSort(int* a, int n)
{//建堆for (int i = 0; i < n; i++){AdjustUp(a, i);}
}int main()
{//int a[] = { 65, 100, 70, 32, 50, 60 };int a[] = { 70, 65, 100, 32, 50, 60 };HeapSort(a, sizeof(a) / sizeof(int));return 0;
}

最后达成建堆效果,也弥补了前面的两大缺陷~接下来我们来实现排序效果~

如果我们想要升序,那就要去建小堆~我们换个数组来建堆

由于是升序,当我们把根(2)选出去后——选出了最小的数据,要选次小,只能把剩下的数据看作堆。但最后发现已经无法构成小堆的结构了~所以我们只能换个思路了,想要升序建小堆不行的话那就试试大堆怎么样~

在建好大堆后用向下调整法先和尾部60进行交换,交换完不用去删除尾部数据,而是把它从数组中隔离开来(就是无视它在数组和堆中的位置)

然后把剩下的数据看作堆,那选次大要怎么选呢?继续用向下调整法即可。

每一次一个数据的调整是logN,一共有N个数据,那时间复杂度就是O(N*logN)

void HeapSort(int* a, int n)
{//建堆for (int i = 0; i < n; i++){AdjustUp(a, i);}//建大堆升序int end = n - 1;//数组尾部数据下标while (end > 0){Swap(&a[0], &a[end]);AdjustDown(a, end, 0);//选出最大end--;//让数组最后数据的前一位和堆顶交换}
}int main()
{//int a[] = { 65, 100, 70, 32, 50, 60 };//int a[] = { 70, 65, 100, 32, 50, 60 };int a[] = { 2, 3, 5, 7, 4, 6, 8 };HeapSort(a, sizeof(a) / sizeof(int));return 0;
}

调试内容:经过不断调试,最终的结果为升序 

4.3.6.11向下调整去建堆

除了可以用向上调整插入的方式去建堆,我们还有另外一种思路:向下调整去建堆

如果我们想要建大堆,能不能直接从2的位置开始向下调呢?

不行~因为向下调整的前提是左右子树都是大堆,这里明显不符合。

那如果3的左子树和右子树都是大堆是不是意味着可以对3进行向下调整,可惜这两棵子树也不是大堆。

那我们不妨逆向思维——从最底层开始向下调整,从最下面一直调整到最上面,这样就能保证每一棵左右子树都是大堆了~不过有一点需要注意,最下面那一行属于叶子的部分没必要调整(叶子自己就可以看成大堆)。

所以我们第一个要找的是倒数第一个非叶子节点(6),然后对它进行向下调整(找出最大的孩子——60并和它交换)。

关于它们的下标也很好找尾部60的下标是n-1,那它的父亲的下标就是(n-1-1)/2,当我们向下调整好6时,按照顺序应该是要调整4这个结点了,而它的下标刚好就在6的前面。以此类推到7这个位置开始调整。

需要找到5的下标跟上面同理下标--就好了,然后进行向下调整。

最后向下调整结束~

关于代码部分的实现也很简单:

void HeapSort(int* a, int n)
{//建堆——向上调整建堆//for (int i = 0; i < n; i++)//{//	AdjustUp(a, i);//}// //建堆——向下调整建堆for (int i = (n-1-1)/2; i >=0; i--){AdjustDown(a, n, i);}//建大堆升序int end = n - 1;//数组尾部数据下标while (end > 0){Swap(&a[0], &a[end]);AdjustDown(a, end, 0);//选出最大end--;//让数组最后数据的前一位和堆顶交换}
}
4.3.6.12 建堆复杂度的证明 

 

一般我们更推荐向下调整建堆,因为它效率更高 。

T(h)是一共要调整的次数——倒数第二层调整1次,倒数第三层调整2次.....一直到第一层调整h-1次。

 画蓝框的总和是我们之前数二叉树节点的个数。

所以向下调整建堆的实际时间复杂度其实要比O(N)小一点点。(因为换算成时间复杂度那得跟N有关,但N又不好表达出来,所以就用h来表达,最后再换成N

———————————————————————————————————————————

现在我们来用向上调整建堆~

我们会发现相比向下调整法,向上调整的数都是多乘多最后一个数据是最大的,,换算过来是(N/2)*logN,所以这就是我们为什么会优先选择向下调整法的原因。

开始错位相减~

最终向上调整法实际实际复杂度差不多是O(N*logN-N),总而言之,向上调整最后一层数据太多,要调整到上层的层数也多,所以在效率上反而是不如向下调整法的。

这里的堆排序其实可以看作有N个数据在进行向下调整,那结果不言而喻~O(N*logN)

4.3.6.13 小练习(选看)

注:有C语言内存文件基本可放心食用~

假设10亿个数据,内存存不下,数据在文件中找出最大的前K个。

基本思路:

  • 读取文件的前100个数据,在内存数组中建立一个小堆
  • 再依次读取剩下数据,跟堆顶数据进行比较,大于堆顶,就替换它进堆,向下调整
  • 所以数据读完,堆里面数据就是最大的前100个

N个数要遍历一遍,每一个数最坏情况都要进堆向下调整logK次,当N足够大时,那时间复杂度就是O(N)了而不是O(N*logK)。空间复杂度——O(K)

void CreateNDate()
{//造数据int n = 1000;srand(time(0));const char* file = "data.txt";FILE* fin = fopen(file, "w");//写操作if (fin == NULL){perror("fopen error");return;}for (int i = 0; i < n; i++){int x = rand() % 1000000;fprintf(fin, "%d\n", x);}fclose(fin);
}void PrintTopK(const char* filename, int k)
{//1. 建堆——用数组a中前k个元素建堆FILE* fout = fopen(filename, "r");//r——读操作if (fout == NULL){perror("fopen fail");return;}int* minheap = (int*)malloc(sizeof(int) * k);//建立所放堆空间大小if (minheap == NULL){perroe("minheap fail");return;}for (int i = 0; i < k; i++){fscanf(fout, "%d", &minheap[i]);//把数组数据放入文件中}//开始构建前K个数小堆for (int i = (k - 2) / 2; i >= 0; i--){AdjustDown(minheap, k, i);}//2.将剩余n-k个元素依次与堆顶元素交换,如果比堆顶还小就换下一个//比堆顶大就替换堆顶int x = 0;while (fscanf(fout, "%d", &x) != EOF){if (x > minheap[0]){minheap[0] = x;AdjustDown(minheap, k, 0);}}//上面的操作我们前面写过了,需要注意的一般是文件那部分代码别写错for (int i = 0; i < k; i++){printf("%d ", minheap[i]);}printf("\n");fclose(fout);
}int main()
{CreateNDate();PrintTopK("Data.txt", 10);return 0;
}

为了验证是否真的找到了10个最大的数,我们先预先写好10个比一百万还大的数字,到时候看看是否可以找到它们——其他数都比一百万小,直接在文件里手动插入比100万大的数不经历取模看能不能找到。

成功实现~

五.全部代码

//Heap.h
#pragma once
#include <stdio.h>
#include <assert.h>
#include <stdlib.h>
#include <stdbool.h>
#include <string.h>
#include <time.h>
typedef int HPDataType;
typedef struct Heap
{HPDataType* a;int size;int capacity;
}HP;//初始化函数
void HeapInit(HP* php);//另一种初始化函数
void HeapInitArray(HP* php, int* a, int n);//销毁函数
void HeapDestroy(HP* php);//插入函数
void HeapPush(HP* php, HPDataType x);//交换函数
void Swap(HPDataType* p1, HPDataType* p2);//打印函数
void HeapPrint(HP* php);//向上调整函数
void AdjustUp(HPDataType* a, int child);//删除函数
void HeapPop(HP* php);//获取根值函数
HeapTop(HP* php);//向下调整函数
void AdjustDown(HPDataType* a, int n, int parent);//判空函数
bool HeapEmpty(HP* php);

————————————————————————————————————————

//Heap.c
#include "Heap.h"//初始化函数
void HeapInit(HP* php)
{assert(php);php->a = NULL;php->size = 0;php->capacity = 0;}//另一种初始化函数
void HeapInitArray(HP* php, int* a, int n)
{assert(php);assert(a);php->a = (HPDataType*)malloc(sizeof(HPDataType) * n);if (php->a == NULL){perror("malloc fail");exit(-1);}php->size = 0;php->capacity = 0;memcpy(php->a, a, sizeof(HPDataType) * n);for (int i = 1; i < n; i++){AdjustUp(php->a, i);}
}//销毁函数
void HeapDestroy(HP* php)
{assert(php);free(php->a);php->a = NULL;php->size = php->capacity = 0;
}//交换函数
void Swap(HPDataType* p1, HPDataType* p2)
{HPDataType tmp = *p1;*p1 = *p2;*p2 = tmp;
}//向上调整函数
void AdjustUp(HPDataType* a, int child)
{int parent = (child - 1) / 2;//再用公式去算父亲的下标来找到父亲while (child > 0){if (a[child] < a[parent]){Swap(&a[child], &a[parent]);child = parent;parent = (parent - 1) / 2;}else{break;}}
}//插入函数
void HeapPush(HP* php, HPDataType x)
{assert(php);//扩容if (php->size == php->capacity){int newCapacity = php->capacity == 0 ? 4 : php->capacity * 2;HPDataType* tmp = (HPDataType*)realloc(php->a, sizeof(HPDataType) * newCapacity);if (tmp == NULL){perror("realloc fail");exit(-1);}php->a = tmp;php->capacity = newCapacity;}php->a[php->size] = x;php->size++;AdjustUp(php->a, php->size - 1);//不仅要把数组传过去,我们还得把孩子也传过去,而孩子可以通过下标找到
}//打印函数
void HeapPrint(HP* php)
{assert(php);for (size_t i = 0; i < php->size; i++){printf("%d ", php->a[i]);}printf("\n");}//向下调整函数
void AdjustDown(HPDataType* a, int n, int parent)
{//假设左右孩子中小的为左孩子int child = parent * 2 + 1;while (child < n)//换到叶子就终止,循环结束后child已经是指向数组外了{//找出小的孩子if (child + 1 < n && a[child + 1] < a[child])//如果右孩子比左孩子小{child++;//小的孩子变成右孩子}if (a[child] < a[parent]){Swap(&a[child], &a[parent]);//继续向下调整parent = child;child = parent * 2 + 1;//跟向上调整法一样,交换完后把parent和child都移下一层为下一次的循环作准备}else{break;}}
}//删除函数
void HeapPop(HP* php)
{assert(php);assert(php->size > 0);Swap(&php->a[0], &php->a[php->size - 1]);php->size--;//删除数据AdjustDown(php->a, php->size, 0);
}//获取根值函数
HeapTop(HP* php)
{assert(php);assert(php->size > 0);return php->a[0];
}//判空函数
bool HeapEmpty(HP* php)
{assert(php);return php->size == 0;
}

————————————————————————————————————————

//Test.c
#include "Heap.h"树的最优设计
//struct  TreeNode
//{
//	int val;
//	struct TreeNode* firstchild;
//	struct TreeNode* nextbrother;
//};
//
//void HeapSort(int* a, int n)
//{
//	HP hp;
//	HeapInit(&hp);
//	for (size_t i = 0; i < sizeof(a) / sizeof(int); i++)
//	{
//		HeapPush(&hp, a[i]);
//	}
//	int i = 0;
//
//	while (!HeapEmpty(&hp))
//	{
//		//printf("%d ", HeapTop(&hp));
//		a[i++] = HeapTop(&hp);
//		HeapPop(&hp);
//
//	}
//
//
//	HeapDestroy(&hp);
//}//void HeapSort(int* a, int n)
//{
//	//建堆
//	for (int i = 0; i < n; i++)
//	{
//		AdjustUp(a, i);
//	}
//	//建大堆升序
//	int end = n - 1;//数组尾部数据下标
//	while (end > 0)
//	{
//		Swap(&a[0], &a[end]);
//		AdjustDown(a, end, 0);//选出最大
//		end--;//让数组最后数据的前一位和堆顶交换
//	}
//}void HeapSort(int* a, int n)
{//建堆——向上调整建堆//for (int i = 0; i < n; i++)//{//	AdjustUp(a, i);//}// //建堆——向下调整建堆for (int i = (n-1-1)/2; i >=0; i--){AdjustDown(a, n, i);}//建大堆升序int end = n - 1;//数组尾部数据下标while (end > 0){Swap(&a[0], &a[end]);AdjustDown(a, end, 0);//选出最大end--;//让数组最后数据的前一位和堆顶交换}
}//int main()
//{
//	//int a[] = { 65, 100, 70, 32, 50, 60 };
//	int a[] = { 70, 65, 100, 32, 50, 60 };
//	HeapSort(a, sizeof(a) / sizeof(int));
//
//	return 0;
//}
void CreateNDate()
{//造数据int n = 1000;srand(time(0));const char* file = "data.txt";FILE* fin = fopen(file, "w");//写操作if (fin == NULL){perror("fopen error");return;}for (int i = 0; i < n; i++){int x = rand() % 1000000;fprintf(fin, "%d\n", x);}fclose(fin);
}void PrintTopK(const char* filename, int k)
{//1. 建堆——用数组a中前k个元素建堆FILE* fout = fopen(filename, "r");//r——读操作if (fout == NULL){perror("fopen fail");return;}int* minheap = (int*)malloc(sizeof(int) * k);//建立所放堆空间大小if (minheap == NULL){perroe("minheap fail");return;}for (int i = 0; i < k; i++){fscanf(fout, "%d", &minheap[i]);//把数组数据放入文件中}//开始构建前K个数小堆for (int i = (k - 2) / 2; i >= 0; i--){AdjustDown(minheap, k, i);}//2.将剩余n-k个元素依次与堆顶元素交换,如果比堆顶还小就换下一个//比堆顶大就替换堆顶int x = 0;while (fscanf(fout, "%d", &x) != EOF){if (x > minheap[0]){minheap[0] = x;AdjustDown(minheap, k, 0);}}//上面的操作我们前面写过了,需要注意的一般是文件那部分代码别写错for (int i = 0; i < k; i++){printf("%d ", minheap[i]);}printf("\n");fclose(fout);
}int main()
{CreateNDate();PrintTopK("Data.txt", 10);return 0;
}

4b12323f94834afd9ec146a3c10df229.jpeg六.结语

本文除了给友友们普及二叉树与堆的概念外,更重要的是关于堆功能的代码实现,其中的方法会帮助提高我们的算法效率。最后感谢大家的观看,友友们能够学习到新的知识是额滴荣幸,期待我们下次相见~

相关文章:

数据结构——二叉树的基本概念及顺序存储(堆)

目录 一.前言 二.树概念及结构 2.1 树的概念 2.2 树的相关概念 2.3 树的表现 2.4 树在实际中的应用&#xff08;表示文件系统的目录树结构&#xff09; 三.二叉树的概念及结构 3.1 概念 3.2 特殊的二叉树 3.3 二叉树的性质 3.4 二叉树的存储结构 3.4.1 顺序存储 3…...

acwing算法基础之基础算法--整数二分算法

目录 1 知识点2 代码模板 1 知识点 有单调性一定可以二分&#xff0c;但在某些情况下&#xff0c;不具有单调性也可以二分。 单调性也可以抽象成某类性质&#xff0c;分界点左边不满足此性质&#xff0c;而右边满足此性质。当然也可以分界点左边满足此性质&#xff0c;而右边不…...

windows C 开发

在win下用C/C开发 非图形界面 应用程序 基础环境包括3个内容1. API : 一般是系统(包括c标准库和其他dll)提供的2. 编译器 : 可以是gnu的,可以是微软提供的3. 编辑器 : 随意都可以 // 不再考虑范围开发方式(API编译器) 原生windows API 使用 Windows API 来编写非视窗代码。…...

C语言——动态内存管理详解(内存结构、动态内存函数、易错题、柔性数组)

本篇概要 本篇文章从基本出发讲述为什么要存在动态内存分配&#xff0c;动态内存函数有哪些&#xff0c;常见的动态内存错误&#xff0c;一些关于内存分配的练习题以及柔性数组的相关知识。 文章目录 本篇概要1.为什么存在动态内存分配1.1为什么要动态分配内存1.2内存结构 2.常…...

2023年全国控制科学与工程学科评估结果 - 自动化考研

考研选择学校时&#xff0c;控制科学与工程考研学校排名情况怎样是广大考研学子十分关心的问题&#xff0c;以下是我们自动化考研联盟为大家整理得最新控制科学与工程学科评估结果情况&#xff0c;还比较权威&#xff0c;供大家参考。 最后祝大家一战成硕,有其他问题欢迎评论区…...

React wangEditor5 使用说明

1、支持包安装 yarn add wangeditor/editor # 或者 npm install wangeditor/editor --saveyarn add wangeditor/editor-for-react # 或者 npm install wangeditor/editor-for-react --save2、使用 import wangeditor/editor/dist/css/style.css // 引入 cssimport { useState…...

vue 实现数字验证码功能

需求&#xff1a;写了一个 手机发送验证码后 输入固定验证码的功能 封装成一个组件,如下: <template><div class"conts"><div class"box"><div class"code_list"><div :class"[ code_item, hideIndex 0 ? co…...

【计算机网络】HTTP协议详解(举例解释,超级详细)

文章目录 一、HTTP协议简单介绍 1、1 什么是HTTP协议 1、2 再次理解“协议” 二、HTTP请求 2、1 HTTP的工作过程 2、1、1 demo代码 2、2 URL 介绍 2、2、1 urlencode 和 urldecode 2、3 HTTP 请求格式 三、HTTP响应 3、1 响应demo 3、2 HTTP 响应格式 四、HTTP 请求和响应中的…...

PCB放置过孔技巧

合理的放置过孔能有效的节约面积。 我们根据嘉立创的pcb工艺能力中写出单双面板最小过孔为0.3mm(内径)/0.5mm(外径) 设置过孔尺寸外直径为24mil&#xff08;0.61mm&#xff09;&#xff09;内直径为12mil&#xff08;0.305mm&#xff09; 嘉立创PCB工艺加工能力范围说明-嘉立…...

淘宝商品详情接口数据采集用于上货,无货源选品上货,采集淘宝天猫商品详情数据

淘宝商品详情接口数据采集可用于上货。先通过关键字搜索接口&#xff0c;抓取到批量的商品ID&#xff0c;再将商品ID传入商品详情数据采集接口的请求参数中&#xff0c;从而达到批量抓取商品详情数据的功能。 接口名称&#xff1a;item_get&#xff0c;获取商品详情数据&#…...

DoS和DDos攻攻击

介绍 DDoS 和 DoS 攻击是我们最常见的网络攻击之一&#xff0c;而且历史相当悠久&#xff0c;算是很经典的两种攻击方式&#xff0c;但它们实际上是如何运作的呢&#xff1f; 虽然两者基本上都能够让工作停摆&#xff0c;但其中有很大的差异&#xff0c;接下来我们将逐一说明&a…...

Python实时采集Windows CPU\MEMORY\HDD使用率

文章目录 安装psutil库在Python脚本中导入psutil库获取CPU当前使用率&#xff0c;并打印结果获取内存当前使用率&#xff0c;并打印结果获取磁盘当前使用情况&#xff0c;并打印结果推荐阅读 要通过Python实时采集Windows性能计数器的数据&#xff0c;你可以使用psutil库。psut…...

【改造中序遍历算法】1038. 从二叉搜索树到更大和树

1038. 从二叉搜索树到更大和树 解题思路 改造中序遍历算法先遍历右子树 然后累加当前节点的值 再遍历左子树 /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* TreeNode() {}* TreeNode…...

克服网络安全压力:如何掌控无限的云数据

管理云中的数字风险比以往任何时候都更加重要。数字化转型引发的云数据呈指数级增长&#xff0c;为安全分析师创造了一个更大的威胁环境。随着威胁行为者继续危害组织最敏感的数据&#xff0c;这一挑战将会加剧。 预计未来五年全球网络犯罪成本将激增&#xff0c;从 2022 年的…...

【数据结构和算法】--N叉树中,返回某些目标节点到根节点的所有路径

目录 一、前言二、具体实现及拓展2.1、递归-目标节点到根节点的路径数据2.2、list转换为tree结构2.3、tree转换为list结构 一、前言 这么多年工作经历中&#xff0c;“数据结构和算法”真的是超重要&#xff0c;工作中很多业务都能抽象成某种数据结构问题。下面是项目中遇到的…...

进程和线程的区别 线程之间共享的资源

线程和进程都是操作系统中的执行单位&#xff0c;但它们在以下几个方面存在区别&#xff1a; 相同处&#xff1a; 1.执行环境&#xff1a;线程和进程都有自己的执行上下文&#xff0c;包括程序计数器、寄存器和栈&#xff0c;可以独立执行指令。 2.并发性&#xff1a;线程和进…...

基于Matlab实现logistic方法(源码+数据)

Logistic回归是一种常用的分类算法&#xff0c;适用于二分类问题。本文将介绍如何使用Matlab实现Logistic回归方法&#xff0c;并通过一个示例演示其应用。 文章目录 引言实现步骤1. 数据准备2. 特征缩放3. 模型训练4. 模型评估 源码数据下载 引言 Logistic回归是一种广泛应用…...

leetCode 121. 买卖股票的最佳时机 贪心算法

给定一个数组 prices &#xff0c;它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。 你只能选择 某一天 买入这只股票&#xff0c;并选择在 未来的某一个不同的日子 卖出该股票。设计一个算法来计算你所能获取的最大利润。 返回你可以从这笔交易中获取的最大利润。…...

《Oracle系列》Oracle 索引使用情况查看

查询用户的索引 select index_name,table_name,tablespace_name,index_type,uniqueness,statusfrom dba_indexeswhere owner <用户名>;查询用户的索引列 select index_name,table_name,column_name,index_owner,table_ownerfrom dba_ind_columnswhere table_owner &l…...

解决Invalid bound statement (not found)错误~

报错如下所示&#xff1a; 找了好久&#xff0c;刚开始以为是名称哪里写的有问题&#xff0c;但仔细检查了好多遍都不是 最后发现了问题如下所示&#xff1a; UserMapper里面的内容被我修改了&#xff0c;但classes中的内容还是原来的内容&#xff0c;所以才导致了编译器报错n…...

基于SpringBoot的反诈宣传平台设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序&#xff08;小蔡coding&#xff09;有保障的售后福利 代码参考源码获取 前言 &#x1f497;博主介绍&#xff1a;✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作…...

【改进哈里鹰算法(NCHHO)】使用混沌和非线性控制参数来提高哈里鹰算法的优化性能,解决车联网相关的路由问题(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…...

【C语言】宏定义

&#x1f6a9; WRITE IN FRONT&#x1f6a9; &#x1f50e; 介绍&#xff1a;"謓泽"正在路上朝着"攻城狮"方向"前进四"&#x1f50e;&#x1f3c5; 荣誉&#xff1a;2021|2022年度博客之星物联网与嵌入式开发TOP5|TOP4、2021|2222年获评百大博…...

库存三层模型概述

库存分层 &#xff08;1&#xff09;电商库存体系分为三层&#xff1a;销售层、调度层、仓库层。 库存三层模型&#xff1a;销售库存&#xff0c;调度层属于订单领域-履约。实物库存属于库存领域 WMS的库存跟调度层是一致的。 但是销售库存跟调度层可能不一致&#xff0c;因为…...

SNERT预备队招新CTF体验赛-Web(SWCTF)

目录 1、F12 2、robots 3、game1-喂青蛙 4、game 2 - flap bird 5、game 3 - Clash 6、Get&Post 7、sql &#xff08;1&#xff09;手工注入 &#xff08;2&#xff09;工具注入 8、命令执行漏洞 9、文件上传漏洞 10、文件泄露 11、php反序列化漏洞 12、PHP绕…...

OpenGLES:绘制一个彩色、旋转的3D圆柱

一.概述 上一篇博文讲解了怎么绘制一个彩色旋转的立方体 这一篇讲解怎么绘制一个彩色旋转的圆柱 圆柱的顶点创建主要基于2D圆进行扩展&#xff0c;与立方体没有相似之处 圆柱绘制的关键点就是将圆柱拆解成&#xff1a;两个Z坐标不为0的圆 一个长方形的圆柱面 绘制2D圆的…...

【QT开发(6)】0926-QT 中加入 fastDDS 通信库的程序使用说明

在智能驾驶中&#xff0c;DDS有可能被广泛使用&#xff0c;因此推出这篇说明教程。 1、基于【QT开发&#xff08;5&#xff09;】教程的项目文档进行开发 2、安装DDS 查看《【eProsima Fast DDS&#xff08;1&#xff09;】安装eProsima Fast DDS》 至少安装: foonathan_m…...

js 判断字符串中是否包含某个字符串

方法一(推荐使用): indexOf() indexOf() 方法&#xff1a;返回某个指定的字符串值在字符串中首次出现的位置。如果要检索的字符串值没有出现&#xff0c;则该方法返回 -1。 var str "LiHeErNAN"; console.log(str.indexOf("A") ! -1 ); // true方法二:m…...

部署在阿里云ECS服务器上的微服务项目中获取到的时间和windows的时间不一样的问题

继上一篇文章《阿里云ECS服务器无法发送邮件问题解决方案》之后&#xff0c;又发现登录的时候发送邮件中的时间和自己windows上的时间不一样&#xff0c;大概找了一下原因&#xff0c;是LocaDateTime使用的时区不一样导致的远程服务器和本机时间不一致。 只需要在LocaDateTime…...

怎么通过portainer部署一个vue项目

这篇文章分享一下今天通过docker打包vue项目&#xff0c;并使用打包的镜像在portainer上部署运行&#xff0c;参考了vue-cli和docker的官方文档。 首先&#xff0c;阅读vue-cli关于docker部署的说明 vue-cli关于docker部署的说明https://cli.vuejs.org/guide/deployment.html#…...

维护网站信息/百度用户服务中心人工电话

Linux中头文件的目录&#xff1a; 两类&#xff1a; 内核源码中的头文件&#xff0c;比如驱动中包含的头文件&#xff1b; 应用软件中包含的头文件。这两类默认放的位置不同。 我们平常写代码用的都是软件中包含的头文件&#xff1a; 路径为&#xff1a; /usr/include内核源码…...

做外贸首先要做网站/seo最新

护士站的客户端采用windows moblie&#xff0c;后台数据通过web service提供&#xff0c;在这次护士站的开发中&#xff0c;我负责的工作就是web service的开发。 首先介绍下什么叫web service&#xff0c;简单来说&#xff0c;web service相当于一种远程的函数调用。我们可以将…...

创个网站怎么弄/汕头网页搜索排名提升

有时候字符串需要做一些左&#xff0c;中&#xff0c;右对齐操作&#xff0c;比如商场打印的发票的&#xff0c;收费项都是左对齐&#xff0c;金额右对齐&#xff0c;抬头中央对齐&#xff0c;在Python的有对应的三个函数ljust(), center(), rjust() 分别对应左、中、右操作! 有…...

网站挂黑链赚钱/企业管理培训机构

Namedtuples在Python中用于命名小型数据集合.以这个命名元组为例&#xff1a;import collectionssesameEpisodeNTC collections.namedtuple(sesameEpisodeNTC,lead_character, has_elmo)se0 sesameEpisodeNTC(lead_characterbigbird, has_elmoFalse)可以将类定义(‘sesameEpi…...

网站一年多少钱/搜索引擎营销的概念及特点

一件复杂的事&#xff0c;一个人如果不能做&#xff0c;两个人又做的不好&#xff0c;一群人就可能很好的解决了。对于线程来说也是&#xff0c;通过多个线程就能完成一个更复杂的功能&#xff0c;这就需要多个线程协作&#xff0c;协作就需要交流&#xff0c;但是交流总是会出…...

python做网站缺点/百度seo原理

前言 上篇对SOA的概述里面&#xff0c;在说SOA构建需要考虑什么时&#xff0c;提到了ESB&#xff0c;它作为SOA的基础设施而存在。 从这篇开始&#xff0c;将对ESB的其中一个实现JBossESB进行一个从头开始的讲解&#xff0c;既然是从头开始&#xff0c;那么不可或缺的就是环境的…...