华为OD机试-发现新词的数量(Java 2024 E卷 100分)
题目描述
小华负责公司知识图谱 Q 产品,现在要通过新闻挖掘完善知识图谱。新闻挖掘的任务是:给定一个待挖掘的文本内容字符串 content
和一个词的字符串 word
,找到 content
中所有 word
的新闻。新闻是指使用 word
的字符排列形成的字符串。请帮小华实现新闻挖掘,返回发现的新词的数量。
输入描述
- 第一行输入为待挖掘的文本内容
content
- 第二行输入为词
word
输出描述
在 content
中找到的所有 word
的新闻的数量。
解题思路
- 字符频率统计:首先统计
word
中每个字符的频率。 - 滑动窗口:在
content
中使用滑动窗口的方法,统计每个窗口内字符的频率。 - 匹配判断:如果某个窗口内的字符频率与
word
的字符频率匹配,则说明找到了一个有效的新闻。