百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

python字符串编码解码基础知识(python字符串解析)

itomcoil 2025-05-02 18:57 7 浏览

python字符串编码解码基础知识



python通过ord(c)获取字符c的unicode的编码值,为整数。通过chr(i)获取i对应的unicode的字符。通过str.encode()将字符串编码为原始字节,b.decode()将原始字节解码为字符串。

1 字符串基础知识

python通过ord(c)获取字符c的unicode的编码值,为整数。

通过chr(i)获取i对应的unicode的字符。

1.1 字符编码方法

ASCII码定义0-127的字符代码,每个字符存储在一个8位的字节中。

#

内置函数

描述

1

ord(c)

返回字符c的unicode的编码值,为整数

2

chr(i)

返回unicode编码为i的字符

3

help(encodings)

先import encodings,再help,查看python支持的编码名称


从字符串编码为原始字节,从原始字节解码字符串。

#

名称

描述

1

编码

根据编码名称,把字符串翻译为原始字节

2

解码

根据编码名称,把原始字节翻译为字符串

示例

>>> ord('梯')
26799
>>> chr(26799)
'梯'

1.2 python字符串类型


#

版本

描述

1

py2.x

str表示8位文本和二进制数据

2

unicode表示宽字符unicode文本


3

py3.x

str表示unicode文本

4

bytes表示二进制数据


5

bytearray,可变的bytes类型




1.3 文本和二进制文件

#

模式

描述

1

bytes和二进制模式

处理图像文件、解压的打包数据、设备数据流

2

str和文本模式

用于程序输出、HTML、CSV、XML文件


2 python3.0的字符串应用


2.1 常量和基本属性

#

项目

描述

1

‘xxx’和”xxx”

创建str,单字节或者更长的字节,存放字符串

2

‘’’xxx’’’和”””xxx”””

创建str

3

‘xxx’和”xxx”前面加b或B

创建bytes,单字节,存放字符对应原始字节的整数

4

‘’’xxx’’’和”””xxx”””前加b或B

创建bytes

示例

>>> b=b'abc' # 返回每个字符的原始字节的整数
>>> s='abc'
>>> type(b),type(s)
(<class 'bytes'>, <class 'str'>)
>>> b,s
(b'abc', 'abc')
>>> b[0],s[0]
(97, 'a')
>>> b[1:],s[1:]
(b'bc', 'bc')
>>> list(b),list(s)
([97, 98, 99], ['a', 'b', 'c'])
# bytes 和 str 不可修改
>>> b[0]='d'
Traceback (most recent call last):
  File "<pyshell#32>", line 1, in <module>
    b[0]='d'
TypeError: 'bytes' object does not support item assignment
>>> s[0]='d'
Traceback (most recent call last):
  File "<pyshell#33>", line 1, in <module>
    s[0]='d'
TypeError: 'str' object does not support item assignment
>>> c=b'''
abc
def
'''
>>> c
b'\nabc\ndef\n'

2.2 转换

#

项目

描述

1

str.encode()和 bytes(s,encoding)

编码,把字符串转换为bytes形式,根据str创建一个bytes。

2

bytes.decode()和 str(b,encoding)

解码,把bytes转换为字符串形式,根据bytes创建一个str。

3

sys.getdefaultencoding()

查看系统默认编码

描述

str.encode(encoding),根据编码名encoding将字符串str编码为原始字节,encoding默认为utf-8。

bytes(s,encoding),根据编码名encoding将字符串s编码为原始字节,encoding必填。

bytes.decode(encoding),根据编码名encoding将原始字节解码为字符串,encoding默认为utf-8。

str(b,encoding),根据编码名encoding将原始字节解码为字符串,encoding不填则打印原始字节。

示例

>>> import sys
# 查看系统
>>> sys.platform
'win32'
# 查看系统默认编码
>>> sys.getdefaultencoding()
'utf-8'
>>> s='梯'
# encode 和 bytes 编码,字符串转原始字节
>>> s.encode()# encoding 默认为 utf-8
b'\xe6\xa2\xaf'
>>> s.encode(encoding='utf-8')
b'\xe6\xa2\xaf'
>>> s.encode(encoding='gbk')
b'\xcc\xdd'
>>> bytes(s,encoding='gbk')
b'\xcc\xdd'
>>> bytes(s,encoding='utf-8')
b'\xe6\xa2\xaf'
# decode 和 str 解码,原始字节转字符串
>>> b=b'\xe6\xa2\xaf'
>>> b.decode()
'梯'
>>> str(b,encoding='utf-8')
'梯'
# str() 没有 encoding ,则 进行打印
>>> str(b)
"b'\\xe6\\xa2\\xaf'"
# bytes() 没有 encoding ,则 报错
>>> bytes(s)
Traceback (most recent call last):
  File "<pyshell#62>", line 1, in <module>
    bytes(s)
TypeError: string argument without an encoding

3 END

本文首发微信公众号:梯阅线条

更多内容参考python知识分享或软件测试开发目录。






相关推荐

Python字符串格式化:你真的会用吗?告别混乱代码,看这一篇就够

大家好!今天我们来聊聊Python中一个看似简单却暗藏玄机的操作——字符串格式化。你是不是还在用%s拼凑变量?或者写了无数个format()却依然被同事吐槽代码太“复古”?别急,这篇干货带你解锁三种神...

Python Unicode字符串编程实用教程

Unicode是现代文本处理的基础,本教程将介绍Python中的Unicode字符串处理,涵盖从基础概念到高级应用等。一、Unicode基础概念1.1Unicode与编码核心概念:Unicode:字...

殊途同归 python 第 6 节:字符串的使用

字符串作为Python的基础数据之一,以下是字符串的几种最常用情形,直接上代码1.声明字符串a="helloworld"b='竹杖芒鞋轻胜马,谁怕,一蓑烟雨任平生...

python爬虫字符串定位开始跟结束(find方法的使用)

python爬虫采集的时候会需要对采集的内容进行处理行为,处理什么?简单的说就是处理多余的HTML代码跟确定文章标题跟结尾,还有内容区间,方法如下:首先先是定位,我们先假设我们采集到了一批数据,数据里...

python 入门到脱坑 基本数据类型—字符串string

以下是Python字符串(String)的入门详解,包含基础操作、常用方法和实用技巧,适合初学者快速掌握:一、字符串基础1.定义字符串#单引号/双引号s1='hello's...

python字符串知识点总结

Python字符串知识点总结1.字符串基础字符串是不可变的序列类型可以用单引号(')、双引号(")或三引号('''或""")创建三引号...

在 Python 中使用 f-String 格式化字符串

在Python3.6中引入的f字符串提供了一种既简洁又可读的字符串格式新方法。f字符串的正式名称为格式化字符串文字,是以f或F为前缀的字符串,其中包含大括号内的表达式。这些表达式在...

零起点Python机器学习快速入门-4-3-字符串常用方法

Python中字符串的多种操作。包括去除字符串首尾的空格和特定字符、字符串的连接、查找字符在字符串中的位置、字符串之间的比较、计算字符串的长度、大小写转换以及字符串的分割。通过这些操作,我们可以对字...

Python 中 字符串处理的高效方法,不允许你还不知道

以下是Python中字符串处理的高效方法,涵盖常用操作、性能优化技巧和实际应用场景,帮助您写出更简洁、更快速的代码:一、基础高效操作1.字符串拼接:优先用join()代替+原因:join()预...

Python字符串详解与示例

艾瑞巴蒂字符串的干货来了,字符串是程序中最常见的数据类型之一,用来表示数据文本,下面就来介绍下字符串的特性,操作和方法,和一些示例来吧道友:1.字符串的创建在python中字符串可以永单引号(...

Python中去除字符串末尾换行符的方法

技术背景在Python编程中,处理字符串时经常会遇到字符串末尾包含换行符的情况,如从文件中读取每一行内容时,换行符会作为字符串的一部分被读取进来。为了满足后续处理需求,需要将这些换行符去除。实现步骤1...

表格编程之争:Python VS VBA?Excel用户:新编程语言才真香!

Python和VBA哪个更好用?Python和VBA是两种不同的编程语言,它们都有自己的特点和优缺点。在表格编程方面,VBA在Excel中的应用非常广泛,可以通过宏来实现自动化操作和数据处理,也可以通...

用Python把表格做成web可视化图表

Python中有一个streamlit库,Streamlit的美妙之处在于您可以直接在Python中创建Web应用程序,而无需了解HTML、CSS或JavaScrip,今天我们就用st...

使用 Python 在 PowerPoint 演示文稿中创建或提取表格

PowerPoint中的表格是一种以结构化格式组织和呈现数据的方法,类似于Excel或Word等其他应用程序中表格的使用方式。它们提供了一种清晰简洁的方式来显示信息,使您的受众更容易消化和理...

用python实现打印表格的方法

最近在做表格输出的任务,一般有两种方法实现在控制台打印,一种是根据表格的输出规则自己写代码实现,另外一种是安装python的第三方依赖包prettytable实现这个效果。方法1:根据表格规则写代码...