Skip to the content.

leetcode [438] 找到字符串中所有字母异位词


Contact me:

Blog -> https://cugtyt.github.io/blog/index
Email -> cugtyt@qq.com
GitHub -> Cugtyt@GitHub


给定一个字符串 s 和一个非空字符串 p,找到 s 中所有是 p 的字母异位词的子串,返回这些子串的起始索引。

字符串只包含小写英文字母,并且字符串 s 和 p 的长度都不超过 20100。

说明:

字母异位词指字母相同,但排列不同的字符串。
不考虑答案输出的顺序。

示例 1:

输入:
s: "cbaebabacd" p: "abc"

输出:
[0, 6]

解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的字母异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的字母异位词。

示例 2:

输入:
s: "abab" p: "ab"

输出:
[0, 1, 2]

解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的字母异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的字母异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的字母异位词。

注意:这里只保存了p中字母的统计量,注意边界和不在p中字符的判断细节

from collections import defaultdict
class Solution:
    def findAnagrams(self, s: str, p: str) -> List[int]:
        if len(s) < len(p) or s == '':
            return []        

        # 统计字母个数
        count = defaultdict(int)
        for i in range(len(p)):
            count[p[i]] += 1

        # 检查第一个位置
        for i in range(len(p)):
            if s[i] in p:
                count[s[i]] -= 1
        res = []
        if sum(1 for v in count.values() if v != 0) == 0:
            res.append(0)

        # 滑动
        for i in range(len(p), len(s)):
            if s[i] not in p:
                if s[i - len(p)] in p:
                    count[s[i - len(p)]] += 1
                continue
            else:
                count[s[i]] -= 1
            if s[i - len(p)] in p:
                count[s[i - len(p)]] += 1
            if sum(1 for v in count.values() if v != 0) == 0:
                res.append(i - len(p) + 1)
        return res