当前位置: 首页 > article >正文

58-Map和Set练习-LeetCode692前k个高频单词

题目

给定一个单词列表 words 和一个整数 k ,返回前 k 个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率, 按字典顺序 排序。

示例 1:

输入: words = ["i", "love", "leetcode", "i", "love", "coding"], k = 2
输出: ["i", "love"]
解析: "i" 和 "love" 为出现次数最多的两个单词,均为2次。
    注意,按字母顺序 "i" 在 "love" 之前。

示例 2:

输入: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4
输出: ["the", "is", "sunny", "day"]
解析: "the", "is", "sunny" 和 "day" 是出现次数最多的四个单词,
    出现次数依次为 4, 3, 2 和 1 次。

注意:

    1 <= words.length <= 500
    1 <= words[i] <= 10
    words[i] 由小写英文字母组成。
    k 的取值范围是 [1, 不同 words[i] 的数量]

进阶:尝试以 O(n log k) 时间复杂度和 O(n) 空间复杂度解决。


思路:

前k个高频元素

找大用小。

  1. 用Map扫描集合,将每个单词及出现的频率存入Map中。
  2. 声明一个基于最小堆的优先级队列,传入比较器。(题目要求:默认按出现频次大小排序,频次相同再按字典排序。用String默认的compareTo方法即可;String默认实现了Comparable,基于字母的字典序比较)
  3. 依次出队列,找到前k个高频单词。

代码

class Solution {
    public List<String> topKFrequent(String[] words, int k) {
        //1.扫描原数组,将每个单词及出现的次数存储在Map中
        Map<String, Integer> cnt = new HashMap<String, Integer>();
        for (String word : words) {
            cnt.put(word, cnt.getOrDefault(word, 0) + 1);
        }

        //2.扫描Map集合,将前k个出现频次最高的入优先级队列(最小堆)
        //向优先级队列中传入一个比较器
        PriorityQueue<Map.Entry<String, Integer>> pq = new PriorityQueue<Map.Entry<String, Integer>>(new Comparator<Map.Entry<String, Integer>>() {
            public int compare(Map.Entry<String, Integer> entry1, Map.Entry<String, Integer> entry2) {
                return entry1.getValue() == entry2.getValue() ? entry2.getKey().compareTo(entry1.getKey()) : entry1.getValue() - entry2.getValue();
            }
        });

        //将每一个字符串插入到优先队列中,如果优先队列的大小超过了 k,那么就将优先队列顶端元素弹出。这样最终优先队列中剩下的 k 个元素就是前 k 个出现次数最多的单词。
        for (Map.Entry<String, Integer> entry : cnt.entrySet()) {
            pq.offer(entry);
            if (pq.size() > k) {
                pq.poll();
            }
        }

        //3.依次出队列,找到前k个高频单词。
        List<String> ret = new ArrayList<String>();
        //取大用小,每次从最小堆中堆顶取,得到的前k个高频单词的频率是从小到大的
        while (!pq.isEmpty()) {
            ret.add(pq.poll().getKey());
        }
        //将ret集合进行反转,这样就实现找到前k个高频单词的频率是从大到小的
        Collections.reverse(ret);
        return ret;
    }
}


http://www.kler.cn/a/7200.html

相关文章:

  • 数据存储与信息技术领域 - 磁带技术:企业用磁带与音乐磁带
  • 理解AJAX与Axios:异步编程的世界
  • 【华为云开发者学堂】基于华为云 CodeArts CCE 开发微服务电商平台
  • Android Dex VMP 动态加载加密指令流
  • 《自动驾驶与机器人中的SLAM技术》ch2:基础数学知识
  • Kubeflow:云原生机器学习工作流自动化开源框架详解
  • AIGC之Stable Diffusion 提示词学徒库
  • 「ML 实践篇」回归系统:房价中位数预测
  • 使用机器学习opencv看手相
  • 嵌入式学深度学习:1、Pytorch框架搭建
  • 暴刷 SQL 导航
  • 探索五大机器学习技术及其应用
  • SSM整合
  • spring框架注解(纯注解)
  • c++类和对象
  • 通信协议-IIC协议
  • 政务服务一网通办建设方案(ppt)
  • 自己写gpt的软件教程-国内最好的chatgpt软件
  • 西北乱跑娃 -- 全栈开发新手必看客户端与服务的关系
  • 计算机网络 常见网卡信息
  • Solidworks学习一
  • SpringCloud整合Feign基本使用及源码分析-02
  • 团体程序设计天梯赛--5分题
  • ThreeJS-平行光物体投影(十九)
  • 画栋雕梁:定制投资体系4——持有、波动与卖出
  • [oeasy]python0125_汉字打印机_点阵式打字机_汉字字形码