图片由作者提供 |Canva 餐厅
你有没有在 Python 中遇到过一些古怪的东西,导致了那些 “等等,什么 ”的时刻?
是的,Python 以其可读性和简单性而闻名,但它也有一些令人惊讶的行为,即使是一些经验丰富的开发人员也会措手不及。
1. 可变默认参数
函数中的可变默认参数是 Python 的常见陷阱!下是可能会让您感到惊讶的事情:
def add_item(item, list_of_items=[]):
list_of_items.append(item)
return list_of_items
为了便于理解,将函数调用和输出放在一个代码块中。
print(add_item(1))
Output >>> [1]
print(add_item(2))
Output >>> [1, 2]
为什么会这样?关键是了解 Python 何时评估默认参数。
默认参数在定义函数时计算,而不是在调用函数时计算。
这意味着在定义函数时,空列表 [] 会创建一次,并且该列表会在未提供第二个参数的每个函数调用中重复使用。
以下是解决此问题的方法:
def add_item(item, list_of_items=None):
if list_of_items is None:
list_of_items = []
list_of_items.append(item)
return list_of_items
在这个更正的版本中,我们使用 None 作为默认参数,并在每次调用函数时创建一个新列表。
print(add_item(1))
Output >>> [1]
print(add_item(2))
Output >>> [2]
2. 后期绑定闭包
这是一个经常出现在循环中的棘手问题:
functions = []
for i in range(3):
functions.append(lambda: i)
print([f() for f in functions])
以下是您得到的:
Output >>> [2, 2, 2]
您可能希望它打印 [0, 1, 2],但事实并非如此。为什么?这种行为称为 “后期绑定”,它与 Python 处理闭包的方式有关。
当 lambda 函数引用变量 i 时,它不会在创建函数时捕获 i 的值,而是捕获变量本身。
让我们打个比方。
可以这样想:想象一下,你正在写一张便条,上面写着 “check the number on the whiteboard”当你稍后阅读笔记时,你会查看白板上当前的任何数字,而不是你写笔记时的数字,是吗?在我们的代码中,当我们调用这些函数时,循环已经完成,i 只剩下其最终值 (2)。
以下是获取您可能想要的行为的方法:
functions = []
for i in range(3):
functions.append(lambda x=i: x) # Using default argument to capture current value
print([f() for f in functions])
Output >>> [0, 1, 2]
通过使用 default 参数,我们实际上是在创建每个函数时对 i 的值进行快照。
3. 身份与恒等
Python 的恒等运算符有时会让您感到惊讶
# Integer caching
a = 256
b = 256
print(a is b)
Output >>> True
c = 257
d = 257
print(c is d)
Output >>> False
这是怎么回事?此行为与 Python 的内存优化功能有关。对于小整数(通常为 -5 到 256),Python 会缓存对象并重用它们。
对于字符串,Python 使用一种称为 “字符串暂存” 的技术,它可能会重用字符串对象以节省内存。但是,并非所有字符串都保证此行为,并且可能因 Python 实现而异。
# String interning
x = "hello"
y = "hello"
print(x is y)
Output >>> True
p = "hello!"
q = "hello!"
print(p is q)
Output >>> False (check at your end!)
这就是为什么您应该始终使用:
- == 用于比较值
- 仅用于与 None 进行比较或检查两个变量是否引用完全相同的对象
is 运算符检查两个变量是否引用内存中的完全相同的对象,而 == 检查两个对象是否具有相同的值。
4. 可变的解包惊喜
如果您对 Python 的解包方式不满意,解包作有时会令人困惑。让我们直接来看例子。
这按预期工作:
a, b = 1, 2
print(a, b)
Output >>> 1 2
这也有效:
a, *b = 1, 2, 3, 4
print(a, b)
Output >>> 1 [2, 3, 4]
但这可能会让您感到惊讶:
a, *b, = 1,
print(a, b)
Output >>> 1 []
这也是有效的:
(*a,) = [1, 2, 3]
print(a)
Output >>> [1, 2, 3]
所以这是你应该知道的:解包中的星号运算符 (*) 将多个值收集到一个列表中,即使没有要收集的值!
5. 列表乘法
乍一看,将列表乘以一个数字似乎很简单,但它可能会导致一些令人惊讶的行为,尤其是对于嵌套列表。
让我们先举一个简单的例子:
# Simple list multiplication
simple_list = [1] * 3
print(simple_list)
Output >>> [1, 1, 1]
现在看看下面带有嵌套列表的示例:
nested_list = [[1, 2]] * 3
print(nested_list)
Output >>> [[1, 2], [1, 2], [1, 2]]
nested_list[0][0] = 5
print(nested_list)
你能猜出输出吗?
Output >>> [[5, 2], [5, 2], [5, 2]]
这里发生了什么?当你将列表相乘时,Python 不会创建元素的深层副本 - 它会创建对相同对象的多个引用。因此,当您在 nested_list[0][0] 处修改内部列表时,您正在修改所有三个元素都引用的单个内部列表。
以下是创建真正独立副本的一种方法:
nested_list = [[1, 2] for _ in range(3)]
nested_list[0][0] = 5
print(nested_list)
列表推导式为每个元素创建新的内部列表。
Output >>> [[5, 2], [1, 2], [1, 2]]