[CTSC2014]企鹅QQ 题解

[CTSC2014]企鹅QQ 题解

题目地址:洛谷:【P4503】[CTSC2014]企鹅QQ – 洛谷、BZOJ:Problem 3555. — [Ctsc2014]企鹅QQ

题目描述

PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的n 个账户名称中,有多少对是相似的。
为了简化你的工作,小Q给你的N 个字符串长度均等于L ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。

题意简述

有一些字符串,规定两个长度相同的字符串只有一位不同为相似的,求字符串中相似的字符串对数。保证字符串两两不同。

输入输出格式

输入格式:
第一行包含三个正整数N ,L ,S 。其中N 表示账户名称数量,L 表示账户名称长度,S 用来表示字符集规模大小,它的值只可能为2或64。
若S 等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
若S 等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
随后N 行,每行一个长度为L 的字符串,用来描述一个账户名称。数据保证N 个字符串是两两不同的。

输出格式:
仅一行一个正整数,表示共有多少对相似的账户名称。

输入输出样例

输入样例#1:

4 3 64
Fax
fax
max
mac

输出样例#1:

4

说明

4对相似的字符串分别为:Fax与fax,Fax与max,fax与max,max与mac。
测试点编号 N L S
1 50 10 64
2 500 100 64
3 3000 100 2
4 3000 100 64
5 30000 50 2
6 30000 50 64
7 30000 200 2
8 30000 200 64
9 30000 200 2
10 30000 200 64

题解

参考资料:[BZOJ3555][P4503][CTSC2014]企鹅QQ[Hash] – Ycrpro
看到字符集大小=2的时候,在想能不能转化成二进制表示随便异或一下lowbit一下骗分,然后n大的时候就用bitset搞一搞。
想一下,hash的原理跟上面那个是相似的,因此这题也可以用hash搞。具体来说,就是把hash搞出来,然后枚举忽略哪一位,从hash中把该位的信息删掉,统计相同的串个数即可。由于两个串被统计进去必须仅有一个位置不同,所以这样不会重。
算法的复杂度是O(NL \log N)

代码

// Code by KSkun, 2018/6
#include <cstdio>
#include <cctype>

#include <algorithm>

typedef long long LL;

const int MAXN = 30005, BASE = 233;

int n, l;
char s[MAXN][205];
LL hsh[MAXN], tmp[MAXN], powb[MAXN];

inline LL gethash(char *str) {
    LL res = 0;
    for(int i = 1; str[i]; i++) {
        res = res * BASE + str[i];
    }
    return res;
}

int main() {
    scanf("%d%d%*d", &n, &l);
    powb[0] = 1;
    for(int i = 1; i <= l; i++) {
        powb[i] = powb[i - 1] * BASE;
    }
    for(int i = 1; i <= n; i++) {
        scanf("%s", s[i] + 1);
        hsh[i] = gethash(s[i]);
    }
    LL ans = 0;
    for(int i = 1; i <= l; i++) {
        for(int j = 1; j <= n; j++) {
            tmp[j] = hsh[j] - powb[l - i] * s[j][i];
        }
        std::sort(tmp + 1, tmp + n + 1);
        int t = 1;
        for(int j = 1; j < n; j++) {
            if(tmp[j] == tmp[j + 1]) {
                t++;
            } else {
                ans += 1ll * t * (t - 1) / 2; t = 1;
            }
        }
        ans += 1ll * t * (t - 1) / 2;
    }
    printf("%lld", ans);
    return 0;
}


发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据