当前位置: 首页 > article >正文

算法的学习笔记—数据流中的中位数(牛客JZ41)

img

😀前言
在处理动态数据时,实时计算中位数是一个经典问题。中位数是排序后处于中间位置的数值,数据流中的中位数计算面临两个挑战:首先是数据量的动态变化,其次是需要保持元素的有序性。为了高效地解决这个问题,我们可以利用堆(Heap)结构。

🏠个人主页:尘觉主页

文章目录

  • 😀数据流中的中位数
    • 题目链接
    • 😄问题描述
    • 💖示例1
    • 💖示例2
    • 😊解题思路
    • 🤔代码实现
      • 代码解析
    • 😄总结

😀数据流中的中位数

题目链接

牛客网

😄问题描述

假设我们从数据流中不断读取数值,如果从中读取奇数个数值,中位数就是所有数值排序后位于中间的数值;如果读取偶数个数值,中位数就是排序后中间两个数值的平均值。

例如,输入数据流 [5, 2, 3, 4, 1, 6, 7, 0, 8],我们需要依次计算数据流的中位数,得到的结果为:5.00 3.50 3.00 3.50 3.00 3.50 4.00 3.50 4.00

💖示例1

输入:[5,2,3,4,1,6,7,0,8]

返回值:"5.00 3.50 3.00 3.50 3.00 3.50 4.00 3.50 4.00 "

说明:数据流里面不断吐出的是5,2,3…,则得到的平均数分别为5,(5+2)/2,3…

💖示例2

输入:[1,1,1]

返回值:"1.00 1.00 1.00 "

😊解题思路

为了高效地计算数据流的中位数,我们可以使用两个堆:大顶堆和小顶堆。

  • 大顶堆(Max-Heap):用于存储数据流中较小的一半元素,堆顶元素是这部分元素中的最大值。
  • 小顶堆(Min-Heap):用于存储数据流中较大的一半元素,堆顶元素是这部分元素中的最小值。

操作流程:

  1. 每当有新元素插入时,首先根据当前元素个数决定插入哪个堆。
    • 如果总数为偶数,则新元素应插入小顶堆。但为了保证小顶堆的元素都大于大顶堆中的元素,我们可以先将新元素插入大顶堆,再将大顶堆堆顶的最大值弹出并插入小顶堆。
    • 如果总数为奇数,则新元素应插入大顶堆。同样,为了保证大顶堆的元素都小于小顶堆的元素,我们可以先将新元素插入小顶堆,再将小顶堆堆顶的最小值弹出并插入大顶堆。
  2. 插入操作结束后,根据堆中元素的数量计算中位数:
    • 如果总数为偶数,中位数为两个堆顶元素的平均值。
    • 如果总数为奇数,中位数为小顶堆的堆顶元素。

🤔代码实现

以下是用 Java 实现的代码示例

import java.util.PriorityQueue;

public class MedianFinder {
    /* 
     * 大顶堆,存储数据流中较小的一半元素 
     * 比较器设为倒序,这样堆顶为最大值
     */
    private PriorityQueue<Integer> left = new PriorityQueue<>((o1, o2) -> o2 - o1);
    
    /* 
     * 小顶堆,存储数据流中较大的一半元素 
     * 默认是最小堆,堆顶为最小值
     */
    private PriorityQueue<Integer> right = new PriorityQueue<>();
    
    /* 当前数据流中元素的总数 */
    private int N = 0;

    /**
     * 插入新元素到数据流中
     * 
     * @param val 要插入的数据流中的新值
     */
    public void Insert(Integer val) {
        /* 插入操作:首先根据当前元素数量的奇偶性,决定插入哪个堆 */
        if (N % 2 == 0) {
            /*
             * 当 N 为偶数时:
             * - 先将新元素插入大顶堆(左半边),确保左半边堆顶最大。
             * - 然后将大顶堆中的最大值弹出并插入小顶堆(右半边),
             *   这样就保证了右半边的元素都大于左半边的元素。
             */
            left.add(val);
            right.add(left.poll());
        } else {
            /*
             * 当 N 为奇数时:
             * - 先将新元素插入小顶堆(右半边),确保右半边堆顶最小。
             * - 然后将小顶堆中的最小值弹出并插入大顶堆(左半边),
             *   这样就保证了左半边的元素都小于右半边的元素。
             */
            right.add(val);
            left.add(right.poll());
        }
        /* 插入完成后,元素总数加一 */
        N++;
    }

    /**
     * 获取当前数据流的中位数
     * 
     * @return 当前数据流的中位数
     */
    public Double GetMedian() {
        /* 
         * 判断元素总数的奇偶性来决定中位数的计算方式 
         * 如果总数为偶数,中位数为两个堆顶元素的平均值
         * 如果总数为奇数,中位数为小顶堆的堆顶元素
         */
        if (N % 2 == 0)
            return (left.peek() + right.peek()) / 2.0;
        else
            return (double) right.peek();
    }

    public static void main(String[] args) {
        MedianFinder mf = new MedianFinder();
        int[] nums = {5, 2, 3, 4, 1, 6, 7, 0, 8};
        
        /* 
         * 逐个插入元素到数据流,并输出当前的中位数 
         */
        for (int num : nums) {
            mf.Insert(num);
            System.out.print(mf.GetMedian() + " ");
        }
    }
}

代码解析

  • 堆的构建:我们使用了 Java 的 PriorityQueue 类来实现大顶堆和小顶堆。大顶堆通过传入自定义比较器来实现,将较大元素优先弹出。小顶堆则是默认的最小堆。
  • 插入逻辑:根据当前元素数量的奇偶性,决定元素插入的顺序。通过先插入一个堆,再将该堆顶元素移动到另一个堆,保证两个堆中的数据始终保持平衡。
  • 获取中位数:根据元素的奇偶性,决定从哪个堆中获取中位数。如果元素总数为偶数,则取两个堆的堆顶元素平均值;如果为奇数,则直接返回小顶堆的堆顶元素。

😄总结

这种使用双堆(大顶堆和小顶堆)的方法使得我们能够高效地从数据流中计算中位数。由于堆结构的特性,插入元素和获取中位数的时间复杂度都为 O(log n),满足了题目对时间复杂度的要求。这种方法不仅适用于题目给定的范围,还可以扩展到更大规模的数据流处理中。

😁热门专栏推荐
想学习vue的可以看看这个

java基础合集

数据库合集

redis合集

nginx合集

linux合集

手写机制

微服务组件

spring_尘觉

springMVC

mybits

等等等还有许多优秀的合集在主页等着大家的光顾感谢大家的支持

🤔欢迎大家加入我的社区 尘觉社区

文章到这里就结束了,如果有什么疑问的地方请指出,诸佬们一起来评论区一起讨论😁
希望能和诸佬们一起努力,今后我们一起观看感谢您的阅读🍻
如果帮助到您不妨3连支持一下,创造不易您们的支持是我的动力🤞

img


http://www.kler.cn/a/282181.html

相关文章:

  • ssm129办公用品管理系统开发与设计+jsp(论文+源码)_kaic
  • 【数据结构与算法】查找
  • FPGA开发-逻辑分析仪的应用-数字频率计的设计
  • windows工具 -- 使用rustdesk和云服务器自建远程桌面服务, 手机, PC, Mac, Linux远程桌面 (简洁明了)
  • web浏览器环境下使用window.open()打开PDF文件不是预览,而是下载文件?
  • java 读取 有时需要sc.nextLine();读取换行符 有时不需要sc.nextLine();读取换行符 详解
  • 数学建模~~~预测方法--决策树模型
  • pyautogui的一些自动化示例,附代码
  • 新手如何找到正确入行 Web3 路径?揭开职业启航新篇章
  • linux驱动 -- 输入子系统
  • 【STM32】SPI
  • HFM深入技术学习系列之五--FDMEE钻取EBS
  • 单链表——随机链表的复制
  • 开源模型应用落地-LlamaIndex学习之旅-LLMs-集成OpenAI(一)
  • 322.零钱兑换
  • HAL库:串口 不定长数据接收 + 循环收发缓冲区 + 空闲中断 收发数据
  • SpringMVC框架学习
  • 使用ftl文件导出时,多层嵌套循环
  • 如何开Stand Up Meeting
  • 深度学习基础—Softmax回归
  • 虚拟化云管服务奥创的优化升级以及多集群下VPC网络实现
  • XML CSS:结构和样式的完美结合
  • python(9) : docker方式运行python程序(自启动,守护)
  • 恒电流间歇滴定法 (GITT) 测试教程
  • 国产游戏行业的技术突破与未来展望:挑战与机遇并存
  • macos MacPort 包管理工具安装和使用