UVa 11855 Buzzwords
题目本质是要求统计频次,由于原始字符串长度不超过 1000 1000 1000,而枚举所有长度的子串时间复杂度为 O ( n 2 ) O(n^2) O(n2),因此可以考虑使用字符串散列予以解决。
如果您对字符串散列不熟悉,可以参考:字符串散列。
读入原始字符串,将所有空格去除,令此时的字符串长度为 n n n,接着从 1 1 1 到 n n n 枚举子串的长度,计数对应长度所有子串散列值的频次,按照要求输出即可,可以利用 STL \texttt{STL} STL( Standard Template Library \texttt{Standard Template Library} Standard Template Library)中的 map \texttt{map} map 容器类来统计频次。
参考代码:
#include <bits/stdc++.h>
using namespace std;
const int BASE = 16777213, MOD = 2147483647;
int main(int argc, char *argv[]) {
cin.tie(0), cout.tie(0), ios::sync_with_stdio(false);
string line;
while (getline(cin, line)) {
string s;
for (auto c : line) if (c != ' ') s += c;
int n = (int)s.length();
long long h[1010], b[1010];
h[0] = 0, b[0] = 1;
for (int i = 1; i <= 1000; i++) b[i] = b[i - 1] * BASE % MOD;
for (int i = 1; i <= n; i++) h[i] = (h[i - 1] * BASE + s[i - 1]) % MOD;
bool empty = 0;
for (int i = 1; i <= n; i++) {
map<long long, int> mp;
for (int j = 0; j + i - 1 < n; j++) {
long long sh = (h[j + i] - h[j] * b[i] % MOD + MOD) % MOD;
mp[sh]++;
}
int r = 0;
for (auto p : mp) r = max(r, p.second);
if (r > 1) { cout << r << '\n'; empty = 0; }
else {
if (!empty) cout << '\n';
empty = 1;
}
}
}
return 0;
}