当前位置: 首页 > article >正文

[Collection与数据结构] PriorityQueue与堆

1. 优先级队列

1.1 概念

前面介绍过队列,队列是一种先进先出(FIFO)的数据结构,但有些情况下,操作的数据可能带有优先级,一般出队列时,可能需要优先级高的元素先出队列,该中场景下,使用队列显然不合适,比如:在手机上玩游戏的时候,如果有来电,那么系统应该优先处理打进来的电话.
在这种情况下,数据结构应该提供两个最基本的操作,一个是返回最高优先级对象,一个是添加新的对象。这种数据结构就是优先级队列(Priority Queue)。
在这种情况下,数据结构应该提供两个最基本的操作,一个是返回最高优先级对象,一个是添加新的对象。这种数据结构就是优先级队列(Priority Queue)。
在这里插入图片描述

2. 优先级队列的模拟实现

PriorityQueue底层实现使用了这种数据结构,堆实际上就是在完全二叉树的基础上做了一些调整,使得里面的元素按照一定地规则排列,而堆的元素存储在一个数组中.

2.1 堆的概念

如果有一个关键码的集合K = {k0,k1, k2,…,kn-1},把它的所有元素按完全二叉树的顺序存储方式存储 在一个一维数组中,并满足:Ki <= K2i+1 且 Ki<= K2i+2 (Ki >= K2i+1 且 Ki >= K2i+2) i = 0,1,2…,则称为 小堆(或大堆)也就是任意拿出一棵子树来,子结点都比父结点小(或大).将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆
在这里插入图片描述

2.2 堆的性质

  • 堆是一颗完全二叉树
  • 堆中的某个结点的值总是不大于或者不小于父结点的值

2.3 堆的存储方式

从堆的概念可知,堆是一棵完全二叉树,因此可以层序的规则采用顺序的方式来高效存储.
实例如上图所示.
将元素存储到数组中后,可以根据二叉树章节的性质对树进行还原。假设i为节点在数组中的下标,则有:

  • 如果i为0,则i表示的节点为根节点,否则i节点的双亲节点为 (i - 1)/2
  • 如果2 * i + 1 小于节点个数(前提),则节点i的左孩子下标为2 * i + 1,否则没有左孩子
  • 如果2 * i + 2 小于节点个数(前提),则节点i的右孩子下标为2 * i + 2,否则没有右孩子

2.4 堆的创建

2.4.1 向下调整创建堆

对于集合{ 27,15,19,18,28,34,65,49,25,37 }中的数据,如果将其创建成堆呢?
首先将数组中的元素按照二叉树层序遍历的方法进行存放.
在这里插入图片描述
接下来,我们要做的就是对上面这颗二叉树进行向下调整.那么如何向下调整呢:我们以大根堆为例来说明.

  • 从堆的最后一棵子树开始比较父结点和子结点的大小关系(之所以从最后一棵子树开始调整,是因为必须让子树满足堆的特性,后续才好调整).使用parent标记最后一棵子树的父节点,使用child标记最后一棵子树的左孩子.
  • 把parent的值和child的值进行比较:
    • 比较右孩子的值是否大于左孩子,如果大于,child++,child变量引用移动到右孩子上.
    • 比较parent和child的值,如果child的值大于parent的值,则交换两个值,如果不是则停止向下调整.
    • 之后把parent和child向下移动,再次向下调整,即parent = child,child = child*2+1.直到child的值大于存储元素的数组的最后一个下标.
  • 之后把parent向上移动,即parent–,继续上述过程.
    下面画图来举例,我们给定一个任意完全二叉树:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    之后以此类推…
    为什么要从子树开始调整呢?因为首先要保证子树是大根堆,调整根层数更小的树的时候才会好调整.就像我们盖房子一样,先要把地基打牢,才可以盖得起高楼大厦.
    在这里插入图片描述
    完整过程如下:
    在这里插入图片描述

接下来我们通过代码来创建一个大根堆:

public class MyPriorityQueue {
    public int usedSize;
    public int[] elem;//堆通过数组来实现

    public MyPriorityQueue(int[] elem) {
        this.elem = elem;
        usedSize += elem.length;
    }
    public void createBigHeap(){
        for (int parent = (usedSize-2)/2; parent >= 0 ; parent--) {//从最后一棵子树开始调整
            //之后根向上父结点向上走
            shiftDown(parent,usedSize-1);//向下调整
            //子结点永远是这棵树的最后一个结点
        }
    }

    /**
     * 向下调整
     * @param parent 父节点
     * @param end 结束位置
     */
    private void shiftDown(int parent,int end){
        int child = 2*parent+1;//此时child是左孩子
        while (child <= end){
            if (child+1 < usedSize && elem[child] < elem[child+1]){//若右孩子存在,并且大于左孩子
                child++;//让child到右孩子这里
            }
            if (elem[parent] < elem[child]){
                swap(parent,child);
                parent = child;
                child = 2*child+1;
            }else {
                break;//如果父结点不大于子结点,说明已经调整完成,因为是从下往上调的
            }
        }
    }
    private void swap(int s1,int s2){
        int tmp = elem[s1];
        elem[s1] = elem[s2];
        elem[s2] = tmp;
    }
}

接下来我们来看小根堆如何进行调整,小根堆的调整恰好和大根堆相反,小根堆的调整是从根节点开始调整,直到叶子结点.

  1. 让parent标记需要调整的结点,child标记parent的左孩子节点.
  2. 如果parent的左孩子存在,即child<size,进行以下的操作,直到parent的左孩子不存在.
    • parent右孩子是否存在,存在的话,就找到左右孩子中最小的孩子,让child进行标注.
    • 将parent和child进行比较,如果parent的值小于child,停止调整.否则交换parent和child的值,交换完成之后parent的值和child的值向下移动,即parent = child;child = parent*2+1之后重复上述步骤,直到child大于存储元素数组的最后一个位置.
  3. 之后让parent向下移动,即parent++.重复上述步骤,直到parent到达最后一棵子树.
    在这里插入图片描述
    代码实现:
/**
 * 创建小根堆
 */
public void createSmallHeap(){
    for (int parent = 0;parent <= (usedSize-2)/2;parent++){
        shiftDown2(parent,usedSize-1);
    }
}

/**
 * 小根堆向下调整
 */
private void shiftDown2(int parent,int end) {
    int child = parent*2+1;
    if (child+1 < usedSize && elem[child] > elem[child+1]){
        child++;
    }
    while(child <= end){
        if (elem[parent] > elem[child]){
            swap(parent, child);
            parent = child;
            child = 2*child+1;
        }else{
            break;
        }
    }
}

向下调整的时间复杂度: 最坏的情况就是从根节点一直比较到叶子结点,比较的次数为完全二叉树的高度,即时间复杂度为O(log2N).

2.4.1 创建堆的时间复杂度推导

在这里插入图片描述
因此:建堆的时间复杂度为O(N).

2.5 堆的插入与删除

2.5.1 堆的插入

堆的插入分下面两个步骤:

  • 把结点插入树的最后一个位置
  • 把这个结点进行向上调整

那么,向上调整又如何调整呢?我们以大根堆为例

  • 把插入元素所在的结点与父节点进行比较.
  • 如果父结点小于插入结点,则交换两个结点,否则停止向上调整.
  • 如果成功交换,重复上述步骤,知道父结点大于子结点或者比较到根结点.
    下面我们通过代码来展示:
/**
     * 插入元素
     * @param val 要插入的值
     */
    public void offer(int val){
        if (isFull()){
            this.elem = Arrays.copyOf(elem,elem.length*2);//如果数组满了的话,需要进行扩容
        }
        elem[usedSize] = val;
        usedSize++;
        shiftUp(usedSize-1);//这里注意是usedSize-1,因为usedSize++过,现在需要
        //向上调整的元素是usedSize-1位置上的元素
    }

    /**
     * 向上调整
     * @param child 因为向上调整的终点都是根结点,所以传入child
     */
    private void shiftUp(int child){
        int parent = (child - 1)/2;
        while (child > 0){
            if (elem[parent] < elem[child]){
                swap(elem[parent],elem[child]);
                child = parent;
                parent = (parent-1)/2;
            }else {
                break;
            }
        }
    }

    /**
     * 判断堆元素是否为满
     * @return
     */
    private boolean isFull(){
        if (elem.length == usedSize){
            return true;
        }else {
            return false;
        }
    }

2.5.2 堆的删除

注意:在删除元素的时候,一定删除的是堆顶元素.

  • 将堆顶元素和最后一个元素进行交换
  • 删除最后一个元素
  • 将堆顶结点进行向下调整
    在这里插入图片描述
    下面通过代码来展示:
/**
* 删除堆顶元素
*/
public void poll(){
   if (usedSize == 0){
       return;
   }
   swap(elem[0],elem[usedSize-1]);
   usedSize --;
   shiftDown(0,usedSize-1);
}

这里需要注意的是,与堆的创建不同,这里只需要堆根节点进行向下调整即可,不需要堆整棵树进行向下调整.

3. PriorityQueue

3.1 PriorityQueue的性质

Java集合框架中提供了PriorityQueue和PriorityBlockingQueue两种类型的优先级队列,PriorityQueue是线程不安全的,PriorityBlockingQueue是线程安全的,本文主要介绍PriorityQueue.
关于PriorityQueue的使用要注意:

  1. 使用时必须导入PriorityQueue所在的包,即:
    import java.util.PriorityQueue;
  2. PriorityQueue中放置的元素必须要能够比较大小,不能插入无法比较大小的对象,否则会抛出ClassCastException异常
  3. 不能插入null对象,否则会抛出NullPointerException
  4. 没有容量限制,可以插入任意多个元素,其内部可以自动扩容
  5. 插入和删除元素的时间复杂度为O(log2N)
  6. PriorityQueue底层使用了堆数据结构
  7. PriorityQueue默认情况下是小堆—即每次获取到的元素都是最小的元素.要想创建大根堆,必须传入比较器对象.

3.2 PriorityQueue的使用

  1. 构造方法
构造器功能介绍
PriorityQueue()创建一个空的优先级队列,默认容量是11
PriorityQueue(int initialCapacity)创建一个初始容量为initialCapacity的优先级队列,注意:initialCapacity不能小于1,否则会抛IllegalArgumentException异常
PriorityQueue(Collection<? extends E> c)用一个集合来创建优先级队列
public PriorityQueue(Comparator<? super E> comparator)传入比较器----改变元素之间的比较规则

源码如下:

private static final int DEFAULT_INITIAL_CAPACITY = 11;//默认容量
public PriorityQueue() {
       this(DEFAULT_INITIAL_CAPACITY, null);
   }
public PriorityQueue(int initialCapacity) {//用户传入自定义容量
        this(initialCapacity, null);
    }
public PriorityQueue(Comparator<? super E> comparator) {
        this(DEFAULT_INITIAL_CAPACITY, comparator);//通过比较器改变优先级队列中元素的比较规则
    }
public PriorityQueue(Collection<? extends E> c) {
        if (c instanceof SortedSet<?>) {
            SortedSet<? extends E> ss = (SortedSet<? extends E>) c;
            this.comparator = (Comparator<? super E>) ss.comparator();
            initElementsFromCollection(ss);
        }
        else if (c instanceof PriorityQueue<?>) {
            PriorityQueue<? extends E> pq = (PriorityQueue<? extends E>) c;
            this.comparator = (Comparator<? super E>) pq.comparator();
            initFromPriorityQueue(pq);
        }
        else {
            this.comparator = null;
            initFromCollection(c);
        }
    }

使用实例:

static void TestPriorityQueue(){
        // 创建一个空的优先级队列,底层默认容量是11
        PriorityQueue<Integer> q1 = new PriorityQueue<>();
 
        // 创建一个空的优先级队列,底层的容量为initialCapacity
        PriorityQueue<Integer> q2 = new PriorityQueue<>(100);
 
        ArrayList<Integer> list = new ArrayList<>();
        list.add(4);
        list.add(3);
        list.add(2);
        list.add(1);
 
        // 用ArrayList对象来构造一个优先级队列的对象
        // q3中已经包含了三个元素
        PriorityQueue<Integer> q3 = new PriorityQueue<>(list);
        System.out.println(q3.size());
        System.out.println(q3.peek());
   }

通过传入比较器来创建大根堆,需要注意的是,这里在创建比较器的时候,需要实现Comparator接口(注意单词的拼写),在接口之后指定泛型参数,并且重写compare()方法.

public class Compare implements Comparator<Integer> {
    @Override
    public int compare(Integer o1, Integer o2) {
        return o2-o1;
    }
}
public class Main {
    public static void main(String[] args) {
        PriorityQueue<Integer> priorityQueue1 = new PriorityQueue<>(new Compare());
        priorityQueue1.offer(1);
        priorityQueue1.offer(2);
        priorityQueue1.offer(3);
        priorityQueue1.offer(4);
        priorityQueue1.offer(5);
        System.out.println(priorityQueue1);//通过传入比较器对象,可以构建大根堆
    }
}

也可以通过传入比较器使得不可比较的对象变为可比较的对象:

public class Student{
    public String name;
    public int age;

    @Override
    public String toString() {
        return "Student{" +
                "name='" + name + '\'' +
                ", age=" + age +
                '}';
    }

    public Student(String name, int age) {
        this.name = name;
        this.age = age;
    }
}
import java.util.Comparator;

/**
 * 年龄比较规则
 */
public class Compare1 implements Comparator<Student> {
    @Override
    public int compare(Student o1, Student o2) {
        return o2.age - o1.age;
    }
}
public class Main {
    public static void main(String[] args) {
        PriorityQueue<Student> priorityQueue2 = new PriorityQueue<>(new Compare1());
        //由于Student没有默认创建比较方法,所以必须传入比较器对象,否者异常
        priorityQueue2.offer(new Student("zhangsan",12));
        priorityQueue2.offer(new Student("lisi",17));
        priorityQueue2.offer(new Student("wangwu",19));
        System.out.println(priorityQueue2);//按照年龄进行大根堆构建
    }
}

我们也可以使用lambda表达式代替比较器.其中lambda表达式中,括号中的两个参数表示的是优先级队列中的两个对象,箭头后面表示的是比较的规则.

public class Student{
    public String name;
    public int age;

    @Override
    public String toString() {
        return "Student{" +
                "name='" + name + '\'' +
                ", age=" + age +
                '}';
    }

    public Student(String name, int age) {
        this.name = name;
        this.age = age;
    }
}
public class Main {
    public static void main(String[] args) {
        PriorityQueue<Student> priorityQueue2 = new PriorityQueue<>((s1,s2) -> s2.age-s1.age);
        //由于Student没有默认创建比较方法,所以必须传入比较器对象,否者异常
        priorityQueue2.offer(new Student("zhangsan",12));
        priorityQueue2.offer(new Student("lisi",17));
        priorityQueue2.offer(new Student("wangwu",19));
        System.out.println(priorityQueue2);//按照年龄进行大根堆构建
    }
}

也可以不传入比较器,在类中实现Comparable接口,让这个对象变成一个可比较的对象,并重写其中的compareTo方法:

public class Student implements Comparable<Student>{
    public String name;
    public int age;

    @Override
    public String toString() {
        return "Student{" +
                "name='" + name + '\'' +
                ", age=" + age +
                '}';
    }

    public Student(String name, int age) {
        this.name = name;
        this.age = age;
    }

    @Override
    public int compareTo(Student o) {
        return this.name.compareTo(o.name);
    }
}
public class Main {
    public static void main(String[] args) {
        PriorityQueue<Student> priorityQueue3 = new PriorityQueue<>();
        priorityQueue3.offer(new Student("zhang",12));
        priorityQueue3.offer(new Student("li",15));
        priorityQueue3.offer(new Student("wang",17));
        System.out.println(priorityQueue3);
    }
}
  1. 插入,删除,获取优先级队列中的方法
函数名功能介绍
boolean offer(E e)插入元素e,插入成功返回true,如果e对象为空,抛出NullPointerException异常,时间复杂度 ,注意:空间不够时候会进行扩容
E peek()获取优先级最高的元素,如果优先级队列为空,返回null
E poll()移除优先级最高的元素并返回,如果优先级队列为空,返回null
int size()获取有效元素的个数
void clear()清空
boolean isEmpty()检测优先级队列是否为空,空返回true
  1. 优先级队列的扩容
    jdk17 的源码如下:
public boolean offer(E e) {
        if (e == null)
            throw new NullPointerException();
        modCount++;
        int i = size;
        if (i >= queue.length)
            grow(i + 1);//大于队列大小的时候,进行扩容
        siftUp(i, e);
        size = i + 1;
        return true;
    }
private void grow(int minCapacity) {
        int oldCapacity = queue.length;
        // Double size if small; else grow by 50%
        int newCapacity = ArraysSupport.newLength(oldCapacity,
                minCapacity - oldCapacity, /* minimum growth */
                oldCapacity < 64 ? oldCapacity + 2 : oldCapacity >> 1
                                           /* preferred growth */);
        queue = Arrays.copyOf(queue, newCapacity);
    }

优先级队列的扩容说明:

  • 容量小于64的时候,按照2倍扩容.
  • 容量大于64的时候,按照1.5倍扩容.

4. top-k问题

这种算法一般适用于数据比较大的情况下,比如要在1亿,甚至10亿数据中找出前k的数据.
OJ链接
在这里插入图片描述
这里在寻找top-k元素的时候为什么要创建大根堆呢,因为在元素与对顶元素比较的时候,比较的是大根堆中最大的元素,如果说这个元素比大根堆中最大的元素小的话,那么就会替换掉大根堆中最大的元素,每次删除的时候都删除的是堆中最大的元素, 最终保证大根堆中都是比较小的元素, 最终堆顶就是k个元素中最大的元素,即第k小的元素.

class BigComparator implements Comparator<Integer> {

    @Override
    public int compare(Integer o1, Integer o2) {
        return o2-o1;//通过比较器来创建大根堆
    }
}
public class Top_k {
    public int[] smallestK(int[] arr, int k) {
        if (k <= 0){;
            return new int[0];//如果k==0,返回空数组
        }
        PriorityQueue<Integer> priorityQueue = new PriorityQueue<>(new BigComparator());
        //先取前k个元素放入
        for (int i = 0; i < k; i++) {
            priorityQueue.offer(arr[i]);
        }
        //如果堆顶元素大于遍历到的元素,删除堆顶元素,让遍历到的元素进来
        for (int i = k; i < arr.length; i++) {
            if (priorityQueue.peek() > arr[i]){
                priorityQueue.poll();
                priorityQueue.offer(arr[i]);
            }
        }
        int[] array = new int[k];
        //使用数组取出前k个元素
        for (int i = 0; i < k; i++) {
            array[i] = priorityQueue.poll();
        }
        return array;
    }
}

当然我们在每次入队列的时候也可以不与堆顶元素进行比较,直接让元素入队列,只需要保证每次队列中的元素是k个即可.如果队列中的元素个数超过了k个,就把堆顶元素弹出.
这种情况一般用于arr.length < k的情况,如果是上面的代码去跑arr.length < k的情况,会报出数组越界异常.

class Solution {
    public int[] smallestK(int[] arr, int k) {
        PriorityQueue<Integer> q = new PriorityQueue<>((x,y)->y-x);
        int[] ret = new int[k];
        for (int i = 0;i < arr.length;i++){
            q.offer(arr[i]);
            if (q.size() > k){
                q.poll();
            }
        }
        for (int i = 0;i < k;i++){
            ret[i] = q.poll();
        }
        return ret;
    }
}

其实这种做法和上面那种做法本质上是一样的,如果入了一个比堆顶元素大的元素,那么优先级队列在重新调整的时候,这个元素依然会把这个元素调整到堆顶,堆顶还是会被弹出,相当于这个元素没有进来过,如果小于堆顶元素,那么调整后的堆顶元素就不是这个元素,下一次出去的元素也不是这个元素,就相当于这个元素进入了队列.


http://www.kler.cn/a/512988.html

相关文章:

  • 数据结构之堆排序
  • Java 中 final 关键字的奥秘
  • npm run dev 时直接打开Chrome浏览器
  • Java - WebSocket
  • JupyterLab 安装以及部分相关配置
  • 计算机创造的奇迹——C语言
  • 数据结构-LinkedList和链表
  • 《贪心算法:原理剖析与典型例题精解》
  • 2024年AI大模型技术年度总结与应用实战:创新与突破并进
  • Spring Boot Starter探秘:全面了解 spring-boot-starter-web
  • 小程序获取微信运动步数
  • 在 Babylon.js 中使用 BillboardMode:让对象始终面向摄像机
  • 离散数学---期末复习知识点
  • LeetCode 1133:最大唯一数
  • 《A++ 敏捷开发》- 14 精益与敏捷
  • Hadoop 与 Spark:大数据处理的比较
  • MATLAB中while循环例子,for循环嵌套例子
  • 基于深度学习的Lidar 3D点云表面缺陷检测方法
  • 电脑未能成功安装设备驱动程序怎么办 几种有效修复方法
  • Ubuntu离线docker compose安装DataEase 2.10.4版本笔记
  • Maven下载配置
  • Maven 项目管理
  • 跨域cookie携带问题总结
  • Skywalking python agent安装配置
  • 【源码+文档+调试讲解】基于Spring Boot的协作会话平台
  • C++0到1面试点(二)