百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

python散装笔记——41: 字符串的方法(1)

itomcoil 2025-02-09 12:36 17 浏览

1: 更改字符串的大小写

Python 的字符串类型提供了许多对字符串的大小写起作用的函数。这些函数包括

  • str.casefold
  • str.upper
  • str.lower
  • str.capitalize
  • str.title
  • str.swapcase

对于 unicode 字符串(Python 3 中的默认值),这些操作不是 1:1 映射或可逆的。大多数这些操作都是为了显示目的,而不是为了规范化。

Python 3.x Version ≥ 3.3

str.casefold()

str.casefold创建的字符串小写,适用于大小写不敏感的比较。它比 str.lower 更激进,可能会修改已经小写的字符串或导致字符串长度增加,并且不用于显示目的。

"X?Σ".casefold()
# 'xssσ'yuyu

"X?Σ".lower()
# 'x??'

统一码联盟在其网站上的 CaseFolding.txt 文件中定义了在大小写折叠下进行的转换。

str.upper()

str.upper 获取字符串中的每个字符并将其转换为大写字母,例如

"This is a 'string'.".upper()
# "THIS IS A 'STRING'."

str.lower()

str.lower 的作用与此相反;它获取字符串中的每个字符,并将其转换为小写字母:

"This IS a 'string'.".lower()
# "this is a 'string'."

str.capitalize()

str.capitalize 返回字符串的大写版本,即第一个字符大写,其余字符小写:

"this Is A 'String'.".capitalize() # Capitalizes the first character and lowercases all others
# "This is a 'string'."

str.title()

str.title 返回字符串的标题大小写版本,即单词开头的每个字母都大写,其他字母小写:

"this Is a 'String'".title()
# "This Is A 'String'"

str.swapcase() str.swapcase 返回一个新的字符串对象,其中所有小写字母被替换为大写字母,所有大写字母被替换为小写字母:

"this iS A STRiNG".swapcase() #Swaps case of each character
# "THIS Is a strIng"

作为 str 类方法使用

值得注意的是,这些方法既可以在字符串对象上调用(如上图所示),也可以作为 str 类的类方法调用(明确调用 str.upper 等)。

str.upper("This is a 'string'")
# "THIS IS A 'STRING'"

例如,在 “映射 ”函数中对许多字符串同时应用其中一种方法时,这种方法最为有用。

map(str.upper,["These","are","some","'strings'"])
# ['THESE', 'ARE', 'SOME', "'STRINGS'"]

2: str.translate: 翻译字符串中的字符

Python 支持 str 类型上的 translate 方法,它允许您指定翻译表(用于替换)以及在此过程中应删除的任何字符。

str.translate(table[, deletechars])

Parameter

Description

table

它是一个查找表,定义了从一个字符到另一个字符的映射。

deletechars

要从字符串中删除的字符列表。

使用 maketrans 方法 (Python 3 中的 str.maketrans 和 Python 2 中的 string.maketrans),可以生成翻译表。

>>> translation_table = str.maketrans("aeiou", "12345")
>>> my_string = "This is a string!"
>>> translated = my_string.translate(translation_table)
'Th3s 3s 1 str3ng!'

translate 方法返回的字符串是原始字符串的翻译副本。

如果只需要删除字符,可以将表参数设置为 "None"。

>>> 'this syntax is very useful'.translate('aeiou')
'ths syntx s vry sfl'

3: str.format 和 f-strings: 将数值格式化为字符串

Python 通过 2.6 版引入的 str.format 函数和 3.6 版引入的 f-strings 函数提供了字符串插值和格式化功能。

给定以下变量

i = 10
f = 1.5
s = "foo"
l = ['a', 1, 2]
d = {'a': 1, 2: 'foo'}

以下陈述都是等价的

"10 1.5 foo ['a', 1, 2] {'a': 1, 2: 'foo'}"

>>> "{} {} {} {} {}".format(i, f, s, l, d)

>>> str.format("{} {} {} {} {}", i, f, s, l, d)

>>> "{0} {1} {2} {3} {4}".format(i, f, s, l, d)

>>> "{0:d} {1:0.1f} {2} {3!r} {4!r}".format(i, f, s, l, d)

>>> "{i:d} {f:0.1f} {s} {l!r} {d!r}".format(i=i, f=f, s=s, l=l, d=d)

>>> f"{i} {f} {s} {l} {d}"

>>> f"{i:d} {f:0.1f} {s} {l!r} {d!r}"

作为参考,Python 也支持用于字符串格式化的 C 风格限定符。下面的示例与上面的示例是等价的,但由于 str.format 版本在灵活性、符号一致性和可扩展性方面的优势,我们更倾向于使用 str.format

"%d %0.1f %s %r %r" % (i, f, s, l, d)

"%(i)d %(f)0.1f %(s)s %(l)r %(d)r" % dict(i=i, f=f, s=s, l=l, d=d)

str.format 中用于插值的大括号也可以编号,以减少格式化字符串时的重复。例如

"I am from Australia. I love cupcakes from Australia!"

>>> "I am from {}. I love cupcakes from {}!".format("Australia", "Australia")

>>> "I am from {0}. I love cupcakes from {0}!".format("Australia")

Python 官方文档一如既往地详尽,pyformat.info: PyFormat: Using % and .format() for great good! 则提供了大量带有详细解释的示例。

此外,{} ”字符可以用双括号转义:

"{'a': 5, 'b': 6}"

>>> "{{'{}': {}, '{}': {}}}".format("a", 5, "b", 6)

>>> f"{{'{'a'}': {5}, '{'b'}': {6}}}"

更多信息请参阅字符串格式化。PEP 3101 PEP 3101 – Advanced String Formatting | peps.python.orgFollowing system colour schemeSelected dark colour schemeSelected light colour scheme 中提出了 str.format(),PEP 498 PEP 498 – Literal String Interpolation | peps.python.orgFollowing system colour schemeSelected dark colour schemeSelected light colour scheme 中提出了 f-strings

4: 字符串模块的实用常量

Python 的 string 模块为字符串相关操作提供了常量。要使用它们,请导入 string 模块:

import string

string.ascii_letters:

ascii_lowercase 和 ascii_uppercase 的并集:

>>> string.ascii_letters
'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'

string.ascii_lowercase:

包含所有小写 ASCII 字符:

>>> string.ascii_lowercase
'abcdefghijklmnopqrstuvwxyz'

string.ascii_uppercase:

包含所有大写 ASCII 字符:

>>> string.ascii_uppercase
'ABCDEFGHIJKLMNOPQRSTUVWXYZ'

string.digits:

包含所有十进制数字字符:

>>> string.digits
'0123456789'

string.hexdigits:

包含所有十六进制数字字符:

>>> string.hexdigits
'0123456789abcdefABCDEF'

string.octdigits:

包含所有八进制数字字符:

>>> string.octdigits
'01234567'

string.punctuation:

包含所有在 C 语言区被视为标点符号的字符:

>>> string.punctuation
'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'

string.whitespace:

包含所有视为空白的 ASCII 字符:

>>> string.whitespace
' \t\n\r\x0b\x0c'

在脚本模式下,print(string.whitespace) 将打印实际字符,使用 str 可以获得上面返回的字符串。

string.printable:

包含所有可打印的字符;由 string.digitsstring.ascii_lettersstring.punctuationstring.whitespace组合而成。

>>> string.printable
'0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~\t\n\r\x0b\x0c'

5: 删除字符串中不需要的前导字符/尾随字符

本程序提供了三种方法,用于从字符串中去除前导字符和尾部字符: str.stripstr.rstripstr.lstrip。这三个方法具有相同的签名,都会返回一个已删除多余字符的新字符串对象。

str.strip([chars])

str.strip 作用于给定的字符串,并删除(strips)参数 chars 中包含的任何前导字符或尾部字符;如果未提供 charscharsNone,则默认删除所有空白字符。例如

>>> " a line with leading and trailing space ".strip()
'a line with leading and trailing space'

如果提供 chars,则会从返回的字符串中删除其中包含的所有字符。例如

>>> ">>> a Python prompt".strip('> ') # strips '>' character and space character
'a Python prompt'

str.rstrip([chars])str.lstrip([chars])

这些方法的语义和参数与 str.strip() 类似,区别在于它们的起始方向。str.rstrip() 从字符串的末尾开始,而 str.lstrip() 则从字符串的开始分割。

例如,使用 str.rstrip

>>> " spacious string ".rstrip()
' spacious string'

而使用 str.lstrip

>>> " spacious string ".lstrip()
'spacious string '

相关推荐

selenium(WEB自动化工具)

定义解释Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7,8,9,10,11),MozillaF...

开发利器丨如何使用ELK设计微服务中的日志收集方案?

【摘要】微服务各个组件的相关实践会涉及到工具,本文将会介绍微服务日常开发的一些利器,这些工具帮助我们构建更加健壮的微服务系统,并帮助排查解决微服务系统中的问题与性能瓶颈等。我们将重点介绍微服务架构中...

高并发系统设计:应对每秒数万QPS的架构策略

当面试官问及"如何应对每秒几万QPS(QueriesPerSecond)"时,大概率是想知道你对高并发系统设计的理解有多少。本文将深入探讨从基础设施到应用层面的解决方案。01、理解...

2025 年每个 JavaScript 开发者都应该了解的功能

大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发。1.Iteratorhelpers开发者...

JavaScript Array 对象

Array对象Array对象用于在变量中存储多个值:varcars=["Saab","Volvo","BMW"];第一个数组元素的索引值为0,第二个索引值为1,以此类推。更多有...

Gemini 2.5编程全球霸榜,谷歌重回AI王座,神秘模型曝光,奥特曼迎战

刚刚,Gemini2.5Pro编程登顶,6美元性价比碾压Claude3.7Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。谷歌,彻底打了一场漂亮的翻...

动力节点最新JavaScript教程(高级篇),深入学习JavaScript

JavaScript是一种运行在浏览器中的解释型编程语言,它的解释器被称为JavaScript引擎,是浏览器的一部分,JavaScript广泛用于浏览器客户端编程,通常JavaScript脚本是通过嵌...

一文看懂Kiro,其 Spec工作流秒杀Cursor,可移植至Claude Code

当Cursor的“即兴编程”开始拖累项目质量,AWS新晋IDEKiro以Spec工作流打出“先规范后编码”的系统工程思维:需求-设计-任务三件套一次生成,文档与代码同步落地,复杂项目不...

「晚安·好梦」努力只能及格,拼命才能优秀

欢迎光临,浏览之前点击上面的音乐放松一下心情吧!喜欢的话给小编一个关注呀!Effortscanonlypass,anddesperatelycanbeexcellent.努力只能及格...

JavaScript 中 some 与 every 方法的区别是什么?

大家好,很高兴又见面了,我是姜茶的编程笔记,我们一起学习前端相关领域技术,共同进步,也欢迎大家关注、点赞、收藏、转发,您的支持是我不断创作的动力在JavaScript中,Array.protot...

10个高效的Python爬虫框架,你用过几个?

小型爬虫需求,requests库+bs4库就能解决;大型爬虫数据,尤其涉及异步抓取、内容管理及后续扩展等功能时,就需要用到爬虫框架了。下面介绍了10个爬虫框架,大家可以学习使用!1.Scrapysc...

12个高效的Python爬虫框架,你用过几个?

实现爬虫技术的编程环境有很多种,Java、Python、C++等都可以用来爬虫。但很多人选择Python来写爬虫,为什么呢?因为Python确实很适合做爬虫,丰富的第三方库十分强大,简单几行代码便可实...

pip3 install pyspider报错问题解决

运行如下命令报错:>>>pip3installpyspider观察上面的报错问题,需要安装pycurl。是到这个网址:http://www.lfd.uci.edu/~gohlke...

PySpider框架的使用

PysiderPysider是一个国人用Python编写的、带有强大的WebUI的网络爬虫系统,它支持多种数据库、任务监控、项目管理、结果查看、URL去重等强大的功能。安装pip3inst...

「机器学习」神经网络的激活函数、并通过python实现激活函数

神经网络的激活函数、并通过python实现whatis激活函数感知机的网络结构如下:左图中,偏置b没有被画出来,如果要表示出b,可以像右图那样做。用数学式来表示感知机:上面这个数学式子可以被改写:...