Python 异步调用命令行工具

  当你在自己的 python 程序中采用了基于事件循环的异步编程方法之后,你就会发现自己不自觉地被其牢牢吸引住,并不是说这一方法多么棒,而是因为你不得不想办法保证程序中的任意环节都不能是阻塞的!

  例如当前的场景是希望从 mongodb 中读取每一条未处理过的数据,下载并保存其中的图片信息,然后更新数据库的内容。python 常用的 mongodb 异步驱动是 motor:    

 结合 asyncio 使用方法如下: 

import motor.motor_asyncio  import asyncio  client = motor.motor_asyncio.AsyncIOMotorClient()  db = client.test_database  async def run():  async for mm in db.test_database.find({"status": 0}):  print(mm['img_src'])  # Download Image Here  # dl_img(mm['img_src'])  await db.test_database.update({"_id": mm['_id']}, {"$set": {"status":1}})  loop = asyncio.get_event_loop()  loop.run_until_complete(run())

登录后复制

此时如果 dl_img() 处的操作是阻塞的,那么异步处理就没有意义了。当然这里依然可以借助异步网络请求库 aiohttp 来实现图片下载:

  async with session.get(img) as resp:  with open(img.split("/")[-1], 'wb') as fd:  while True:  chunk = await resp.content.read(1024)  if not chunk:  break  fd.write(chunk)

登录后复制

当然也可以不需要自己动手下载,直接调用系统命令行工具(例如 wget)来完成下载任务。Python 通过 subprocess 标准库实现系统命令调用(取代旧的os.system(cmd)),执行下载任务只需要:

import subprocess as sbsb.run(['wget', img], shell=True)

登录后复制

但是这种调用方式是无法直接在asyncio的事件循环中使用的,但是asyncio提供了对应的 subprocess接口:

立即学习“Python免费学习笔记(深入)”;

asyncio.create_subprocess_exec(*args, ...)asyncio.create_subprocess_shell(cmd, ...)

登录后复制

这两个方法均返回一个 asyncio.subprocess.Process 实例,而它的接口设计完全模仿了 subprocess.Popen(上面提到 subprocess.run()的底层实现),因此很容易将其用法移植到事件循环中:  

async def dl_img(src):  dl = await asyncio.create_subprocess_shell('wget {} -O {}'.format(src, src.split("/")[-1])  await dl.wait()

登录后复制

除了上面场景中的用法,也可以直接将命令行的执行作为任务放入事件循环:

  loop = asyncio.get_event_loop()  sb = asyncio.create_subprocess_shell('exit 7', loop=loop)  proc = loop.run_until_complete(sb)  exitcode = loop.run_until_complete(proc.wait())

登录后复制

小结

在 Python 异步编程的意义就在于不要让 CPU 堵在 IO 上,因此需要在每一处涉及到阻塞的操作都需要注意使用正确的异步方法,而一旦这些操作被封装成异步的 Task 之后,其后续的调度执行就无需再顾虑了。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2282817.html

(0)
上一篇 2025年2月27日 19:43:03
下一篇 2025年2月25日 21:31:55

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • python冷冻及虚拟环境

    python freeze python应用在开发中会使用各种各样的包,通常我们会用venv来对各应用项目依赖的python解释器版本及其包进行隔离。 应用中import的各种包如何“固定”住呢? pip提供方法 freeze,将依赖的包名…

    2025年2月27日
    200
  • 对于python socket编程的初探

    socket编程步骤 服务端创建一个socket,绑定地址和端口,然后监听端口上传入的连接,一旦有连接进来,就通过accept函数接收传入的连接。 客户端也是创建一个socket。绑定远程地址和端口,然后建立连接,发送数据。 服务端sock…

    编程技术 2025年2月27日
    200
  • 记录一次用Python写爬虫的心得

    现在网络爬虫有很多方式可以写,比如node.js或者go, 甚至php都行,我之所以选择python的原因是因为教程多,可以系统学习,因为光懂得使用html选择器来爬去页面是不够的,我还要想学习一些爬虫过程中常见的坑,以及一些注意事项,比如…

    编程技术 2025年2月27日
    200
  • python列表生成器

    在实际情况中,我们常常需要生成一些列表。除了比较低效的用for循环来一个一个往列表中append外,还有什么比较好的方法呢?python给我们提供了非常强大的创建列表的方式。 例如我们需要创建1~100的一个数据列表。 range(1,10…

    编程技术 2025年2月27日
    200
  • 怎么样用Python实现地理编码

    以物流行业为例,分析了 postgresql 与 greenplum 在地理位置信息处理,最佳路径算法,机器学习等方面的物流行业应用方法。其中提到了地址转换成坐标的问题,更专业些的名词应该是“地理编码”,即知道一个地址,如北京市海淀区上地十…

    2025年2月27日
    200
  • python-切片

    取一个list或者tuple的一部分是十分常见的操作。我们除了利用循环通过索引一个个获取元素外,python还为我们提供了方便的切片(slice)操作符:。 我们定义一个list,以供下面举例使用。 L = [‘apple&#8…

    编程技术 2025年2月27日
    200
  • Python 有序字典

    有序字典-OrderedDict简介 示例 有序字典和通常字典类似,只是它可以记录元素插入其中的顺序,而一般字典是会以任意的顺序迭代的。参见下面的例子: import collectionsprint ‘Regular dictionary…

    编程技术 2025年2月27日
    200
  • Python linecache模块

    linecache 今天分享一个python的小模块: linecache, 可以用它方便地获取某一文件某一行的内容。而且它也被 traceback 模块用来获取相关源码信息来展示。用法很简单: >>> import li…

    编程技术 2025年2月27日
    200
  • Python 信号处理 signal 模块

    signal模块简介 最近在看linux signal 相关内容,signal可以被用来进程间通信和异步处理。python标准库提供了signal包可以用来处理信号相关。这里讨论的是unix系统中python的signal模块。 signa…

    编程技术 2025年2月27日
    200
  • Python中单线程、多线程和多进程的效率对比实验

    对比实验 资料显示,如果多线程的进程是cpu密集型的,那多线程并不能有多少效率上的提升,相反还可能会因为线程的频繁切换,导致效率下降,推荐使用多进程;如果是io密集型,多线程进程可以利用io阻塞等待时的空闲时间执行其他线程,提升效率。所以我…

    2025年2月27日
    200

发表回复

登录后才能评论