[CTSC2014]企鹅QQ 题解
题目地址:洛谷:【P4503】[CTSC2014]企鹅QQ – 洛谷、BZOJ:Problem 3555. — [Ctsc2014]企鹅QQ
题目描述
PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的n 个账户名称中,有多少对是相似的。
为了简化你的工作,小Q给你的N 个字符串长度均等于L ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。
题意简述
有一些字符串,规定两个长度相同的字符串只有一位不同为相似的,求字符串中相似的字符串对数。保证字符串两两不同。
输入输出格式
输入格式:
第一行包含三个正整数N ,L ,S 。其中N 表示账户名称数量,L 表示账户名称长度,S 用来表示字符集规模大小,它的值只可能为2或64。
若S 等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
若S 等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
随后N 行,每行一个长度为L 的字符串,用来描述一个账户名称。数据保证N 个字符串是两两不同的。
输出格式:
仅一行一个正整数,表示共有多少对相似的账户名称。
输入输出样例
输入样例#1:
4 3 64 Fax fax max mac
输出样例#1:
4
说明
4对相似的字符串分别为:Fax与fax,Fax与max,fax与max,max与mac。
测试点编号 N L S
1 50 10 64
2 500 100 64
3 3000 100 2
4 3000 100 64
5 30000 50 2
6 30000 50 64
7 30000 200 2
8 30000 200 64
9 30000 200 2
10 30000 200 64
题解
参考资料:[BZOJ3555][P4503][CTSC2014]企鹅QQ[Hash] – Ycrpro
看到字符集大小=2的时候,在想能不能转化成二进制表示随便异或一下lowbit一下骗分,然后n大的时候就用bitset搞一搞。
想一下,hash的原理跟上面那个是相似的,因此这题也可以用hash搞。具体来说,就是把hash搞出来,然后枚举忽略哪一位,从hash中把该位的信息删掉,统计相同的串个数即可。由于两个串被统计进去必须仅有一个位置不同,所以这样不会重。
算法的复杂度是O(NL \log N)。
代码
// Code by KSkun, 2018/6
#include <cstdio>
#include <cctype>
#include <algorithm>
typedef long long LL;
const int MAXN = 30005, BASE = 233;
int n, l;
char s[MAXN][205];
LL hsh[MAXN], tmp[MAXN], powb[MAXN];
inline LL gethash(char *str) {
LL res = 0;
for(int i = 1; str[i]; i++) {
res = res * BASE + str[i];
}
return res;
}
int main() {
scanf("%d%d%*d", &n, &l);
powb[0] = 1;
for(int i = 1; i <= l; i++) {
powb[i] = powb[i - 1] * BASE;
}
for(int i = 1; i <= n; i++) {
scanf("%s", s[i] + 1);
hsh[i] = gethash(s[i]);
}
LL ans = 0;
for(int i = 1; i <= l; i++) {
for(int j = 1; j <= n; j++) {
tmp[j] = hsh[j] - powb[l - i] * s[j][i];
}
std::sort(tmp + 1, tmp + n + 1);
int t = 1;
for(int j = 1; j < n; j++) {
if(tmp[j] == tmp[j + 1]) {
t++;
} else {
ans += 1ll * t * (t - 1) / 2; t = 1;
}
}
ans += 1ll * t * (t - 1) / 2;
}
printf("%lld", ans);
return 0;
}