百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

2025-04-27:统计重新排列后包含另一个字符串的子字符串数目Ⅱ。

itomcoil 2025-05-02 18:58 8 浏览

2025-04-27:统计重新排列后包含另一个字符串的子字符串数目Ⅱ。用go语言,给定两个字符串 word1 和 word2,

如果存在一个字符串 x,将 x 重排后,word2 恰好是该重排字符串的前缀,我们就称这个字符串 x 是“合法的”。

现在需要计算在 word1 中,有多少个子字符串满足“合法”的条件。

此外,因为本题对内存使用有较严要求,解法必须保证时间复杂度为线性,即 O(n)。

1 <= word1.length <= 1000000。

1 <= word2.length <= 10000。

word1 和 word2 都只包含小写英文字母。

输入:word1 = "bcca", word2 = "abc"。

输出:1。

解释:

唯一合法的子字符串是 "bcca" ,可以重新排列得到 "abcc" ,"abc" 是它的前缀。

题目来自leetcode3298。


详细步骤说明:

1. 统计 word2 的字符需求

  • o 创建一个长度为26的数组 diff,代表26个小写字母的计数差异。
  • o 遍历 word2 中的每个字符,将对应位置的计数减1(即 diff[c - 'a']--),表示我们对这些字符的需求。
  • o 例如 word2 是 "abc",diff['a'-'a'] = -1diff['b'-'a'] = -1diff['c'-'a'] = -1,其余为0,表示这三个字符是必须出现的。

2. 统计字符需求未满足的数量

  • o 统计 diff 数组中小于0的元素个数,记为 cnt
  • o 这个 cnt 表示还有多少种字符的需求尚未被满足。
  • o 开始时,cnt 就是 word2 有多少种不同字符,因为它们在 diff 中是负数。

3. 采用滑动窗口遍历 word1,动态调整 diff 和 cnt

  • o 设置两个指针,l(左边界)和 r(右边界),初始均指向字串起点。
  • o 定义一个窗口即子字符串 word1[l:r]。
  • o 通过移动指针,动态更新 diff 和 cnt 来判断当前窗口内字符是否满足条件。
  • o 更新规则
    • o 当右指针 r 指向的字符加入窗口时,更新该字符计数在 diff 中增加1。
    • o 若某字符的计数由负变零,说明该字符需求得到满足,cnt 减1。
    • o 当左指针 l 移出一个字符时,把对应字符计数减少1。
    • o 若某字符计数由零变负了,说明需求被破坏,cnt 增1。

4. 通过移动右指针满足字符需求

  • o 循环让右指针往右移动,直到 cnt 为0,说明当前窗口满足 word2 字符需求(即子串字符集包含 word2所有要求的字符数)。
  • o 注意,右指针可能移动到子串末尾。

5. 统计满足条件的子串数

  • o 当 cnt 为0时:
    • o 代表从当前位置 l 开始的子串,任意以 r 或更右边作为结束位置的子串,均满足条件。
    • o 由于以 r 结尾的窗口是最小满足条件的窗口,从 r 到 word1 末尾,共有 len(word1) - r + 1 个子串以 l 为左边界满足条件。
    • o 将这些子串数累加到结果 res 中。

6. 左指针右移,继续查找其它满足条件的子串

  • o 左指针右移一位,弹出最左字符,更新 diff 和 cnt,再重复上述过程。
  • o 持续执行直到 l 指向 word1 结尾。

总结

通过滑动窗口,维护 diff 和 cnt,实现以线性方式找到所有满足合法条件的子串。

代码中 update 函数负责维护 diff 和 cnt 的值,使得计算更加高效。


时间复杂度

  • o 滑动窗口中左、右指针均在字符串上只移动一遍,整体指针移动次数不超过 O(len(word1))。
  • o 更新 diff 和 cnt 的操作为常数时间。
  • o 整体时间复杂度为 O(n),n = word1 长度。

空间复杂度

  • o 需要一个固定长度为26的数组 diff,用于存储字符差异计数,无论输入多大,空间固定。
  • o 额外空间约为 O(1)

结论

该方法在保证线性时间复杂度 O(n) 的基础上,实现了对字符需求的快速更新和判断,空间复杂度为常量级,符合题目对性能和内存限制的要求。

Go完整代码如下:

package main

import (
    "fmt"
)

func validSubstringCount(word1 string, word2 string)int64 {
    diff := make([]int, 26)
    for _, c := range word2 {
        diff[c-'a']--
    }
    cnt := 0
    for _, c := range diff {
        if c < 0 {
            cnt++
        }
    }
    var res int64
    l, r := 0, 0
    for l < len(word1) {
        for r < len(word1) && cnt > 0 {
            update(diff, int(word1[r]-'a'), 1, &cnt)
            r++
        }
        if cnt == 0 {
            res += int64(len(word1) - r + 1)
        }
        update(diff, int(word1[l]-'a'), -1, &cnt)
        l++
    }

    return res
}

func update(diff []int, c, add int, cnt *int) {
    diff[c] += add
    if add == 1 && diff[c] == 0 {
        // 表明 diff[c] 由 -1 变为 0
        *cnt--
    } elseif add == -1 && diff[c] == -1 {
        // 表明 diff[c] 由 0 变为 -1
        *cnt++
    }
}

func main() {
    word1 := "bcca"
    word2 := "abc"
    result := validSubstringCount(word1, word2)
    fmt.Println(result)
}


Python完整代码如下:

# -*-coding:utf-8-*-

defvalid_substring_count(word1: str, word2: str) -> int:
    diff = [0] * 26
    for c in word2:
        diff[ord(c) - ord('a')] -= 1

    cnt = sum(1for x in diff if x < 0)

    defupdate(diff, c, add):
        nonlocal cnt
        diff[c] += add
        if add == 1and diff[c] == 0:
            # diff[c] 从 -1 变成 0
            cnt -= 1
        elif add == -1and diff[c] == -1:
            # diff[c] 从 0 变成 -1
            cnt += 1

    res = 0
    l = 0
    r = 0
    n = len(word1)

    while l < n:
        while r < n and cnt > 0:
            update(diff, ord(word1[r]) - ord('a'), 1)
            r += 1
        if cnt == 0:
            # 符合条件的子字符串数量
            res += n - r + 1
        update(diff, ord(word1[l]) - ord('a'), -1)
        l += 1

    return res

if __name__ == "__main__":
    word1 = "bcca"
    word2 = "abc"
    result = valid_substring_count(word1, word2)
    print(result)



·



我们相信 Go 语言和算法为普通开发者提供了强有力的“面试利器”,并致力于分享全面的编程知识。在这里,您可以找到最新的 Go 语言教程、算法解析、提升面试竞争力的秘籍以及行业动态。


欢迎关注“福大大架构师每日一题”,让 Go 语言和算法助力您的职业发展

·

相关推荐

Python字符串格式化:你真的会用吗?告别混乱代码,看这一篇就够

大家好!今天我们来聊聊Python中一个看似简单却暗藏玄机的操作——字符串格式化。你是不是还在用%s拼凑变量?或者写了无数个format()却依然被同事吐槽代码太“复古”?别急,这篇干货带你解锁三种神...

Python Unicode字符串编程实用教程

Unicode是现代文本处理的基础,本教程将介绍Python中的Unicode字符串处理,涵盖从基础概念到高级应用等。一、Unicode基础概念1.1Unicode与编码核心概念:Unicode:字...

殊途同归 python 第 6 节:字符串的使用

字符串作为Python的基础数据之一,以下是字符串的几种最常用情形,直接上代码1.声明字符串a="helloworld"b='竹杖芒鞋轻胜马,谁怕,一蓑烟雨任平生...

python爬虫字符串定位开始跟结束(find方法的使用)

python爬虫采集的时候会需要对采集的内容进行处理行为,处理什么?简单的说就是处理多余的HTML代码跟确定文章标题跟结尾,还有内容区间,方法如下:首先先是定位,我们先假设我们采集到了一批数据,数据里...

python 入门到脱坑 基本数据类型—字符串string

以下是Python字符串(String)的入门详解,包含基础操作、常用方法和实用技巧,适合初学者快速掌握:一、字符串基础1.定义字符串#单引号/双引号s1='hello's...

python字符串知识点总结

Python字符串知识点总结1.字符串基础字符串是不可变的序列类型可以用单引号(')、双引号(")或三引号('''或""")创建三引号...

在 Python 中使用 f-String 格式化字符串

在Python3.6中引入的f字符串提供了一种既简洁又可读的字符串格式新方法。f字符串的正式名称为格式化字符串文字,是以f或F为前缀的字符串,其中包含大括号内的表达式。这些表达式在...

零起点Python机器学习快速入门-4-3-字符串常用方法

Python中字符串的多种操作。包括去除字符串首尾的空格和特定字符、字符串的连接、查找字符在字符串中的位置、字符串之间的比较、计算字符串的长度、大小写转换以及字符串的分割。通过这些操作,我们可以对字...

Python 中 字符串处理的高效方法,不允许你还不知道

以下是Python中字符串处理的高效方法,涵盖常用操作、性能优化技巧和实际应用场景,帮助您写出更简洁、更快速的代码:一、基础高效操作1.字符串拼接:优先用join()代替+原因:join()预...

Python字符串详解与示例

艾瑞巴蒂字符串的干货来了,字符串是程序中最常见的数据类型之一,用来表示数据文本,下面就来介绍下字符串的特性,操作和方法,和一些示例来吧道友:1.字符串的创建在python中字符串可以永单引号(...

Python中去除字符串末尾换行符的方法

技术背景在Python编程中,处理字符串时经常会遇到字符串末尾包含换行符的情况,如从文件中读取每一行内容时,换行符会作为字符串的一部分被读取进来。为了满足后续处理需求,需要将这些换行符去除。实现步骤1...

表格编程之争:Python VS VBA?Excel用户:新编程语言才真香!

Python和VBA哪个更好用?Python和VBA是两种不同的编程语言,它们都有自己的特点和优缺点。在表格编程方面,VBA在Excel中的应用非常广泛,可以通过宏来实现自动化操作和数据处理,也可以通...

用Python把表格做成web可视化图表

Python中有一个streamlit库,Streamlit的美妙之处在于您可以直接在Python中创建Web应用程序,而无需了解HTML、CSS或JavaScrip,今天我们就用st...

使用 Python 在 PowerPoint 演示文稿中创建或提取表格

PowerPoint中的表格是一种以结构化格式组织和呈现数据的方法,类似于Excel或Word等其他应用程序中表格的使用方式。它们提供了一种清晰简洁的方式来显示信息,使您的受众更容易消化和理...

用python实现打印表格的方法

最近在做表格输出的任务,一般有两种方法实现在控制台打印,一种是根据表格的输出规则自己写代码实现,另外一种是安装python的第三方依赖包prettytable实现这个效果。方法1:根据表格规则写代码...