2018年3月29日

[NOI2014]动物园题解

题目地址：洛谷：【P2375】[NOI2014]动物园 – 洛谷、BZOJ：Problem 3670. — [Noi2014]动物园

题目描述

近日，园长发现动物园中好吃懒做的动物越来越多了。例如企鹅，只会卖萌向游客要吃的。为了整治动物园的不良风气，让动物们凭自己的真才实学向游客要吃的，园长决定开设算法班，让动物们学习算法。
某天，园长给动物们讲解KMP算法。
园长：“对于一个字符串S，它的长度为L。我们可以在O(L)的时间内，求出一个名为next的数组。有谁预习了next数组的含义吗？”
熊猫：“对于字符串S的前i个字符构成的子串，既是它的后缀又是它的前缀的字符串中（它本身除外），最长的长度记作next[i]。”
园长：“非常好！那你能举个例子吗？”
熊猫：“例S为abcababc，则next[5]=2。因为S的前5个字符为abcab，ab既是它的后缀又是它的前缀，并且找不到一个更长的字符串满足这个性质。同理，还可得出next[1] = next[2] = next[3] = 0，next[4] = next[6] = 1，next[7] = 2，next[8] = 3。”
园长表扬了认真预习的熊猫同学。随后，他详细讲解了如何在O(L)的时间内求出next数组。
下课前，园长提出了一个问题：“KMP算法只能求出next数组。我现在希望求出一个更强大num数组一一对于字符串S的前i个字符构成的子串，既是它的后缀同时又是它的前缀，并且该后缀与该前缀不重叠，将这种字符串的数量记作num[i]。例如S为aaaaa，则num[4] = 2。这是因为S的前4个字符为aaaa，其中a和aa都满足性质‘既是后缀又是前缀’，同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’，但遗憾的是这个后缀与这个前缀重叠了，所以不能计算在内。同理，num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”
最后，园长给出了奖励条件，第一个做对的同学奖励巧克力一盒。听了这句话，睡了一节课的企鹅立刻就醒过来了！但企鹅并不会做这道题，于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢？
特别地，为了避免大量的输出，你不需要输出num[i]分别是多少，你只需要输出所有num[i]+1的乘积，对1,000,000,007取模的结果即可。

输入输出格式

输入格式：
第1行仅包含一个正整数n ，表示测试数据的组数。随后n行，每行描述一组测试数据。每组测试数据仅含有一个字符串S，S的定义详见题目描述。数据保证S 中仅含小写字母。输入文件中不会包含多余的空行，行末不会存在多余的空格。

输出格式：
包含 n 行，每行描述一组测试数据的答案，答案的顺序应与输入数据的顺序保持一致。对于每组测试数据，仅需要输出一个整数，表示这组测试数据的答案对 1,000,000,007 取模的结果。输出文件中不应包含多余的空行。

输入输出样例

输入样例#1：

3
aaaaa
ab
abcababc

输出样例#1：

36
1
32

说明

测试点编号约定
1 N ≤ 5, L ≤ 50
2 N ≤ 5, L ≤ 200
3 N ≤ 5, L ≤ 200
4 N ≤ 5, L ≤ 10,000
5 N ≤ 5, L ≤ 10,000
6 N ≤ 5, L ≤ 100,000
7 N ≤ 5, L ≤ 200,000
8 N ≤ 5, L ≤ 500,000
9 N ≤ 5, L ≤ 1,000,000
10 N ≤ 5, L ≤ 1,000,000

题解

参考资料：[省选前题目整理][BZOJ 3670][NOI 2014]动物园(KMP) – CSDN博客、【题解】NOI2014动物园 – Twilight_Sx – 博客园
我们回想一下KMP不加优化的时候的fail数组的意义。它指的是当前位置之前的子串中最长的与某一前缀相同的后缀长度。我们利用这个来找num数组。
num数组指的是不重叠的与某一前缀相同的后缀数量，我们退一步，先不求不重叠，用一个数组cnt表示与某一前缀相同的后缀数量。我们可以把fail数组计算出来以后，利用fail算出cnt的值。
$cnt[i] = cnt[fail[i]] + 1$
其中cnt[1] = 1。
举个例子：ababdefghabab，abab是整个串的最长相同前后缀，cnt[3]=2，由于abab内部相同的部分a和ab在后面的abab中出现过，因此cnt[13]至少有cnt[3]中这么多，而abab本身也构成了相同前后缀，因此cnt[13]要比cnt[3]多1。
现在我们拿到了这个串的cnt数组，要怎么求num呢？我们考虑cnt数组是通过fail递推而来的，如果说cnt[i]中计入了某个重叠了的前后缀，那么某个j=若干层嵌套fail[i]的cnt[j]就是不重复的答案。这时候回到fail的前后缀长度的意义上，只要这个前后缀的长度的2倍不超过当前串长，答案是不是就不会重复了，那么j需要满足的条件便是2j≤i。
因此这个算法的复杂度是 $O(n)$ 的。
注意本题的KMP写法与KMP算法原理与实现 | KSkun’s Blog中的并不相同，因为该文章中的算法字符串下标从0开始标，利用-1判断是否到头，这会给计算cnt造成麻烦，因此采用了其他同学的写法。

代码

// Code by KSkun, 2018/3
#include <cstdio>
#include <cstring>

typedef long long LL;

const int MAXN = 1000005, MO = 1e9 + 7;

int n, fail[MAXN], num[MAXN];
LL ans;
char str[MAXN];

inline void calfail() {
    memset(fail, 0, sizeof(fail));
    memset(num, 0, sizeof(num));
    int i = 2, j = 0;
    num[1] = 1;
    for(; str[i]; i++) {
        while(j && str[j + 1] != str[i]) {
            j = fail[j];
        }
        if(str[j + 1] == str[i]) j++;
        fail[i] = j;
        num[i] = num[j] + 1;
    }
}

inline void match() {
    calfail();
    ans = 1;
    int i = 2, j = 0;
    for(; str[i]; i++) {
        while(j && str[j + 1] != str[i]) {
            j = fail[j];
        }
        if(str[j + 1] == str[i]) j++;
        while(j << 1 > i) j = fail[j];
        ans = ((num[j] + 1) * ans) % MO;
    }
}

int main() {
    scanf("%d", &n);
    while(n--) {
        scanf("%s", str + 1);
        match();
        printf("%lld\n", ans);
    }
    return 0;
}

Author: KSkun

Filed Under: 题解, 算法, NOI系列

Tags: 字符串, KMP

KMP算法原理与实现

[SDOI2008]Sandy的卡片题解

1 thought on “[NOI2014]动物园题解”

panda_2134说道：
2018年3月29日下午5:34
膜拜……
回复

发表回复取消回复

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理。