百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

在Python中使用Asyncio系统(3-6)优雅地开启和关闭协程

itomcoil 2025-01-24 12:17 39 浏览

优雅地开启和关闭协程

大多数基于异步的程序都是基于网络的并且长期运行的应用程序。这个领域在处理如何启动和关闭的过程中有惊人的复杂性。

在这两个操作中,启动一般比较简单。启动异步应用程序的标准方式是有一个main()协程函数,并用asyncio.run()调用它,就像本章开头的示例3-2所演示的那样。

一般来说,启动都会相当的简单直接;比如前面描述的服务器案例,你可能在文档中不止一次的阅读到它。我们待会儿要在后面的章节简要通过代码来介绍一个服务器启动的演示。

关闭程序一般更复杂一些。为了关闭,我之前提到了在asyncio.run()中的准备步骤。当async def main()函数退出时,要采取以下操作:

  1. 收集所有仍在排队的任务对象(如果有的话)。
  2. 取消这些任务(这个步骤会在每个运行的协程中抛出CancelledError异常,就是你在协程函数的代码里使用try/except来处理的那个异常)。
  3. 把所有这些任务放到一个组任务中。
  4. 在组任务中使用run_until_complete()等待所有这些任务完成,然后抛出或者处理CancelledError。

asyncio.run()为你执行上面提到的这些操作,但尽管有这些帮助,在构建最初几个重要的asyncio应用程序的过程中,仍将尝试在关闭期间清除错误消息,就像这样:“Task was destroyed but it is pending!”。发生这种情况是因为应用程序没等到执行完前面的一个或几个步骤就关闭主程序了。例3-29是一个引发这个烦人错误的示例。

示例 3-29 未决任务的销毁程序

# taskwarning.py
import asyncio


async def f(delay):
  await asyncio.sleep(delay)


loop = asyncio.get_event_loop()
t1 = loop.create_task(f(1))  
t2 = loop.create_task(f(2))  
loop.run_until_complete(t1) 
loop.close()
  • (L8)任务1将运行1秒。
  • (L9)任务2将运行2秒。
  • (L10)只能在任务1完成前才运行。

运行这段代码将会有以下输出:

$ python taskwarning.py
Task was destroyed but it is pending!
task: 

这个错误信息告诉你当循环关闭时,有些任务还没有完成。我们想要避免这种情况,这就是为什么一般的关闭过程是收集所有未完成的任务,终止这些未完成的任务,然后等它们在关闭循环之前全部完成。asyncio.run()为你完成了所有这些步骤,但重要的是要详细了解流程,这样你就能够处理更复杂的情况。

我们再看一个更详细的演示了所有这些阶段的代码示例。示例3-30是一个基于telnet的echo服务器的迷你案例研究。

示例 3-30 异步应用程序的生命周期

# telnetdemo.py
import asyncio
from asyncio import StreamReader, StreamWriter


async def echo(reader: StreamReader, writer: StreamWriter): 
    print('New connection.')
    try:
        while data := await reader.readline():  
            writer.write(data.upper())  
            await writer.drain()
        print('Leaving Connection.')
    except asyncio.CancelledError:  
        print('Connection dropped!')


async def main(host='127.0.0.1', port=8888):
    server = await asyncio.start_server(echo, host, port) 
    async with server:
        await server.serve_forever()


try:
    asyncio.run(main())
except KeyboardInterrupt:
    print('Bye!')
  • (L5) 服务器将使用echo()协程函数为每个连接创建一个协程。这个函数使用streams API与asyncio进行网络连接。
  • (L8) 为了保持连接的活性,我们要使用一个无限循环来等待消息接入。
  • (L9) 然后把数据直接原样返回给发送方,就是把字母全部变成大写。
  • (L12) 如果这个任务被终止,我们会打印一条消息。
  • (L16) 这段启动TCP服务器的代码直接取自Python 3.8的官方文档。

启动echo服务器后,你可以使用telnet连接到它并跟它交互:

$ telnet 127.0.0.1 8888
Trying 127.0.0.1...
Connected to 127.0.0.1.
Escape character is '^]'.
hi!
HI!
stop shouting
STOP SHOUTING
^]
telnet> q/
Connection closed.

这次会话的服务器输出如下所示(服务器继续运行,直到我们按Ctrl-C):

$ python telnetdemo.py
New connection.
Leaving Connection.
^CBye!

在刚才展示的Telnet会话中,客户机(即Telnet)在服务器停止之前关闭了连接,现在让我们看看如果在连接处于活跃状态时关闭服务器会发生什么。我们会看到服务器进程的如下输出:

$ python telnetdemo.py
New connection.
^CConnection dropped!
Bye!

这时你可以看到CancelledError的异常处理程序被触发。现在我们假设这是一个真实的生产级应用程序,我们希望把所有关于断开连接的事件发送到监控服务。代码示例可能被修改为示例3-31。

示例 3-31 在取消步骤中创建任务

# telnetdemo.py
import asyncio
from asyncio import StreamReader, StreamWriter


async def send_event(msg: str):  
    await asyncio.sleep(1)


async def echo(reader: StreamReader, writer: StreamWriter):
    print('New connection.')
    try:
        while (data := await reader.readline()):
            writer.write(data.upper())
            await writer.drain()
        print('Leaving Connection.')
    except asyncio.CancelledError:
        msg = 'Connection dropped!'
        print(msg)
        asyncio.create_task(send_event(msg))  


async def main(host='127.0.0.1', port=8888):
    server = await asyncio.start_server(echo, host, port)
    async with server:
        await server.serve_forever()


try:
    asyncio.run(main())
except KeyboardInterrupt:
    print('Bye!')
  • (L5) 假设这个协程实际上要联系外部服务器以提交事件通知。
  • (L18) 因为事件通知器涉及网络访问,所以这样的调用通常是在单独的异步任务中进行的;这就是我们在这里使用create_task()函数的原因。

但是,这段代码有一个错误。如果我们重新运行这个示例,并确保在连接处于活跃状态时停止服务器(使用Ctrl-C),这个bug就变得很明显了:

$ python telnetdemo.py
New connection.
^CConnection dropped!
Bye!
Task was destroyed but it is pending!
task: 

要理解为什么会发生这种情况,我们必须回到asyncio.run()在关闭阶段所做的清理事件的顺序;特别要注意更重要的部分是,当我们按下Ctrl-C时,所有当前活跃的任务都会被收集和注销。这时候,只有那些当前活跃的任务会被等待直到完成,并且asyncio.run()在所有那些任务完成之后才返回。修改后的代码中的错误是,我们在现有的“echo”任务的注销处理步骤中创建了一个发送事件的新任务。只有在asyncio.run()收集并注销了流程中的所有任务之后,才会创建这个新任务。

这就是为什么了解asyncio.run()是怎么运行的很重要。

建议:一般的经验法则是,尽量避免在CancelledError异常处理程序中创建新任务。如果必须,也一定要等待同一函数范围内的新任务或未来任务。

最后:如果你正在使用一个库或框架,请确保按照它的文档来执行启动和关闭操作。第三方框架通常提供自己的启动和关闭函数,并提供自定义的事件钩子。你可以在第115页的“案例研究:缓存失效”中看到Sanic框架中使用这些钩子的例子。

gather()函数中的return_exceptions=True是什么意思?

你可能已经注意到,示例3-3和示例3-1,在关闭步骤中调用gather()时的关键字参数return_exceptions=True,但我当时故意悄悄地没有提到它。asyncio.run()也在内部使用gather()和return_exceptions=True,现在是进一步讨论这个的时候了。

不幸的是,这个参数默认是gather(…return_exceptions = False)。这个默认值对于大多数情况都是有问题的,包括关闭过程,这就是为什么asyncio.run()把参数设置为True。直接解释有点复杂;相反,让我们通过一系列详细解释来理解以上的观点会更容易:

  1. run_until_complete()函数里面操作的是一个future;在关闭任务期间,它是gather()返回的future。
  2. 如果里面的future引发异常,这个异常就会从run_until_complete()抛出,这将导致循环停止运行。
  3. 如果run_until_complete()函数操作的是一个组future,在任何子任务中引发的任何异常如果不在子任务中处理掉,就会在这个组future中引发异常。注意,这种情况也包括CancelledError。
  4. 如果只有一部分任务处理CancelledError,而其他任务不处理CancelledError,那么不处理CancelledError的任务将导致循环停止。这意味着循环在所有任务完成之前就会异常终止。
  5. 在关闭任务的过程中,我们真的不想发生这种行为。我们希望run_until_complete()只在在它组中的所有子任务都已完成时才能终止,不管其中的一些任务是否引发异常。
  6. 于是我们gather(*, return_exceptions=True):这个设置会让组future把来自于子任务的异常视为返回值,这样它们就不会冒出来干扰到run_until_complete()。

这样就知道了return_exceptions=True和run_until_complete()之间的关系。用这种方式捕获异常的一个不良后果是:有些错误可能没有引起你的注意,因为它们现在正在一组任务的内部处理。如果这是一个麻烦,你可以从run_until_complete()获取输出列表,并扫描它以查找Exception的任何子类,然后编写适合你情况的日志消息。示例3-32演示了这种方法。

示例 3-32 所有的任务都会完成

# alltaskscomplete.py
import asyncio


async def f(delay):
    await asyncio.sleep(1 / delay)  
    return delay


loop = asyncio.get_event_loop()
for i in range(10):
    loop.create_task(f(i))
pending = asyncio.all_tasks()
group = asyncio.gather(*pending, return_exceptions=True)
results = loop.run_until_complete(group)
print(f'Results: {results}')
loop.close()
  • (L5) 这里一定会触发一个异常

这是运行输出:

$ python alltaskscomplete.py
Results: [6, 9, 3, 7, ...
          ZeroDivisionError('division by zero',), 4, ...
          8, 1, 5, 2]

如果没有设置return_exceptions=True,就会从run_until_complete()引发ZeroDivisionError,停止循环,从而阻止其他任务完成。

在下一节中,我们将讨论信号处理(KeyboardInterrupt之外的信号),但在此之前,有必要记住,优雅地关闭是网络编程中比较困难的方面之一,对于asyncio来说也是这样。本节中的信息仅仅是一个开始。我鼓励你在自己的自动化测试中使用明确的关闭测试。不同的应用程序通常需要不同的策略。

建议:我在Python包索引(PyPI)上发布了一个名为aiorun的小包,主要用于我自己在处理asyncio关闭方面的实验和学习,它整合了本节中的许多想法。可能对于你在代码进行修改,并围绕asyncio关闭场景试验你自己的想法方面是有用的。

相关推荐

《Queendom》宣布冠军!女团MAMAMOO四人激动落泪

网易娱乐11月1日报道据台湾媒体报道,南韩女团竞争回归的生死斗《Queendom》昨(10/31)晚播出大决赛,并以直播方式进行,6组女团、女歌手皆演唱新歌,并加总前三轮的赛前赛、音源成绩与直播现场投...

正确复制、重写别人的代码,不算抄袭

我最近在一篇文章提到,工程师应该怎样避免使用大量的库、包以及其他依赖关系。我建议的另一种方案是,如果你没有达到重用第三方代码的阈值时,那么你就可以自己编写代码。在本文中,我将讨论一个在重用和从头开始编...

HTML DOM tr 对象_html event对象

tr对象tr对象代表了HTML表格的行。HTML文档中出现一个<tr>标签,就会创建一个tr对象。tr对象集合W3C:W3C标签。集合描述W3Ccells返回...

JS 打造动态表格_js如何动态改变表格内容

后台列表页最常见的需求:点击表头排序+一键全选。本文用原生js代码实现零依赖方案,涵盖DOM查询、排序算法、事件代理三大核心技能。效果速览一、核心思路事件入口:为每个<th>绑...

连肝7个晚上,总结了66条计算机网络的知识点

作者|哪吒来源|程序员小灰(ID:chengxuyuanxiaohui)计算机网络知识是面试常考的内容,在实际工作中经常涉及。最近,我总结了66条计算机网络相关的知识点。1、比较http0....

Vue 中 强制组件重新渲染的正确方法

作者:MichaelThiessen译者:前端小智来源:hackernoon有时候,依赖Vue响应方式来更新数据是不够的,相反,我们需要手动重新渲染组件来更新数据。或者,我们可能只想抛开当前的...

为什么100个前端只有1人能说清?浏览器重排/重绘深度解析

面试现场的"致命拷问""你的项目里做过哪些性能优化?能具体讲讲重排和重绘的区别吗?"作为面试官,我在秋招季连续面试过100多位前端候选人,这句提问几乎成了必考题。但令...

HTML DOM 介绍_dom4j html

HTMLDOM(文档对象模型)是一种基于文档的编程接口,它是HTML和XML文档的编程接口。它可以让开发人员通过JavaScript或其他脚本语言来访问和操作HTML和XML文档...

JavaScript 事件——“事件流和事件处理程序”的注意要点

事件流事件流描述的是从页面中接收事件的顺序。IE的事件流是事件冒泡流,而NetscapeCommunicator的事件流是事件捕获流。事件冒泡即事件开始时由最具体的元素接收,然后逐级向上传播到较为不...

探秘 Web 水印技术_水印制作网页

作者:fransli,腾讯PCG前端开发工程师Web水印技术在信息安全和版权保护等领域有着广泛的应用,对防止信息泄露或知识产品被侵犯有重要意义。水印根据可见性可分为可见水印和不可见水印(盲水印)...

国外顶流网红为流量拍摄性侵女学生?仅被封杀三月,回归仍爆火

曾经的油管之王,顶流网红DavidDobrik复出了。一切似乎都跟他因和成员灌酒性侵女学生被骂到退网之前一样:住在950万美元的豪宅,开着20万美元的阿斯顿马丁,每条视频都有数百万观看...人们仿佛...

JavaScript 内存泄漏排查方法_js内存泄漏及解决方法

一、概述本文主要介绍了如何通过Devtools的Memory内存工具排查JavaScript内存泄漏问题。先介绍了一些相关概念,说明了Memory内存工具的使用方式,然后介绍了堆快照的...

外贸独立站,网站优化的具体内容_外贸独立站,网站优化的具体内容有哪些

Wordpress网站优化,是通过优化代码、数据库、缓存、CSS/JS等内容,提升网站加载速度、交互性和稳定性。网站加载速度,是Google搜索引擎的第一权重,也是SEO优化的前提。1.优化渲染阻塞。...

这8个CSS工具可以提升编程速度_css用什么编译器

下面为大家推荐的这8个CSS工具,有提供函数的,有提供类的,有提取代码的,还有收集CSS的统计数据的……请花费两分钟的时间看完这篇文章,或许你会找到意外的惊喜,并且为你的编程之路打开了一扇新的大门。1...

vue的理解-vue源码 历史 简介 核心特性 和jquery区别 和 react对比

一、从历史说起Web是WorldWideWeb的简称,中文译为万维网我们可以将它规划成如下的几个时代来进行理解石器时代文明时代工业革命时代百花齐放时代石器时代石器时代指的就是我们的静态网页,可以欣...