初识《树》
目录
前言:
树的概念及结构:
1.概念
2.结构
3.树的相关概念
4.树的表示
5.树的实际应用
二叉树的概念及结构:
1.概念
2.特殊二叉树
编辑
3.二叉树的性质
对于满二叉树
对于完全二叉树:
4.二叉树的存储结构
堆
1、二叉树的顺序结构:
2.堆的概念:
总结:
前言:
从本文开始,我们将正式进入到《树》的深度学习之中,本文主要介绍关于树的基础概念,并且在文章后面会引出我们即将让展开讲解的一个重要的概念——“堆”。
树的概念及结构:
1.概念
树是一种非线性数据结构,它由节点和边组成。每个节点可以有零个或多个子节点,而每个节点都有且仅有一个父节点(除了根节点)。根节点没有父节点,而叶子节点没有子节点。树中的节点可以代表任何类型的数据,如数字、字符串、列表等等。树的高度是从根节点到最深层叶子节点的最长路径,而树的深度是从根节点到某个节点的路径长度。树由于具有良好的层次性和结构性,因此在计算机科学中被广泛应用,如搜索算法、数据库、编译器、操作系统等。
2.结构
树(Tree)是一种数据结构,它由多个节点(Node)和它们之间的连接(Edge)构成。树的结构层次化,有一个根节点(Root),其他节点都是它的子节点(Child),子节点可能还有它们自己的子节点和子树(Subtree)。树的节点可以有任意个子节点,但每个节点都只有一个父节点,除了根节点没有父节点。树的结构可以用来表示层级关系,比如文件夹的层级结构、组织机构图、网站的导航栏结构等。在计算机科学中,树的结构被广泛应用于算法和数据结构的设计中。
注意:树形结构中,子树之间不能有交集,否则就不是树形结构
3.树的相关概念
节点的度:一个节点含有的子树的个数称为该节点的度; 如上图:A的为6
叶节点或终端节点:度为0的节点称为叶节点; 如上图:B、C、H、I...等节点为叶节点
非终端节点或分支节点:度不为0的节点; 如上图:D、E、F、G...等节点为分支节点
双亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点; 如上图:A是B的父节点
孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点; 如上图:B是A的孩子节点
兄弟节点:具有相同父节点的节点互称为兄弟节点; 如上图:B、C是兄弟节点
树的度:一棵树中,最大的节点的度称为树的度; 如上图:树的度为6
节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
树的高度或深度:树中节点的最大层次; 如上图:树的高度为4
堂兄弟节点:双亲在同一层的节点互为堂兄弟;如上图:H、I互为兄弟节点
节点的祖先:从根到该节点所经分支上的所有节点;如上图:A是所有节点的祖先
子孙:以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是A的子孙
森林:由m(m>0)棵互不相交的树的集合称为森林;
关于树有许多内容,以上红色的字是我们需要特别注意概念!
4.树的表示
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间
的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法。
typedef int DataType;
struct Node
{
struct Node* _firstChild1; // 第一个孩子结点
struct Node* _pNextBrother; // 指向其下一个兄弟结点
DataType _data; // 结点中的数据域
};
这样对于一个链式结构的树,我们轻而易举的就可以找的各个节点。
5.树的实际应用
我们日后也会对Linux操作系统进行讲解,其中Linux的文件表示系统运用的就是“树”这个数据结构
二叉树的概念及结构:
1.概念
二叉树是一种树状结构,是由n个节点组成的有限集合,其中每个节点最多有两个子节点,称为左子节点和右子节点。二叉树有一个根节点,根节点没有父节点。除根节点外,每个子节点都有一个父节点。如果一棵二叉树的每个节点都有两个子节点,那么它就是一个满二叉树。如果一棵二叉树的每个节点都没有子节点,那么它就是一个空二叉树。二叉树的遍历方式有前序遍历、中序遍历、后序遍历和层次遍历。
关于前序遍历、中序遍历、后序遍历和层次遍历我们以后会逐一讲解。
总结一下:
1、二叉树不存在度大于2的节点。
2、二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树。
2.特殊二叉树
1. 满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为K,且结点总数是 ,则它就是满二叉树。
2. 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。 要注意的是满二叉树是一种特殊的完全二叉树。
同时完全二叉树的最后一层也可以只有一个节点
3.二叉树的性质
对于满二叉树
每一层的节点树都达到最大值
算出来总节点数为(2^h) - 1
假设树有N个节点,那么我们通过 (2^h) - 1 == N
就可以轻易算出h = log(N+1),同时也作为时间复杂度。
对于完全二叉树:
通过完全二叉树与满二叉树的性质相比较,我们不难发现假设完全二叉树有h层,那么对于前h-1层的节点数,肯定是满的节点
简而言之,最大的区别就在于最后一层!
所以我们可以先算前n-1层的总节点数。
不难算出:应当为(2^(h-1))-1
现在我们假设最后一层只有一个节点,那么通过计算一共就有2^(h-1)个节点
如果最后一层的节点数是满的,那么一共就有(2^h) - 1个节点,与满二叉树一致
所以完全二叉树的节点取值
[2^(h-1),(2^h) - 1]
4.二叉树的存储结构
二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
1. 顺序存储
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储,关于堆我们后面的章节会专门讲解。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
2. 链式存储
二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址 。链式结构又分为二叉链和三叉链,当前我们学习中一般都是二叉链,后面课程学到高阶数据结构如红黑树等会用到三叉链
堆
1、二叉树的顺序结构:
普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段
2.堆的概念:
堆(heap)是一种特殊的树形数据结构,它满足两个特性:
- 堆是一个完全二叉树(即除了最后一层,其他层都是满的,最后一层的节点从左到右依次排列),因此它可以用一个数组来表示。
- 对于任意一个节点,它的值不小于(大于)它的子节点的值,这被称为“堆的性质”。
根据堆的性质,堆分为两种:最大堆和最小堆。最大堆的每个节点的值都大于或等于其子节点的值,而最小堆的每个节点的值都小于或等于其子节点的值。堆的主要应用包括排序算法、优先级队列等。
总结:
本文主要对树进行了一个引子,主要以介绍为主,接下来的我们将会对堆的知识模块进行延伸。
动手实现堆。
实现堆排序
解决Top-K问题
如果你对这些感兴趣或是说遇到了种种困难,那么你一定不要错过后续的内容。
记住“坐而言不如起而行”
Action speak louder than words!