Python 下载大文件，哪种方式速度更快！

PHP中文网 • 2025年2月26日 20:22:35 • 编程技术 • 阅读 2

通常，我们都会用 requests 库去下载，这个库用起来太方便了。

方法一

使用以下流式代码，无论下载文件的大小如何，Python 内存占用都不会增加：

def download_file(url):local_filename = url.split('/')[-1]# 注意传入参数 stream=Truewith requests.get(url, stream=True) as r:r.raise_for_status()with open(local_filename, 'wb') as f:for chunk in r.iter_content(chunk_size=8192): f.write(chunk)return local_filename

登录后复制

如果你有对 chunk 编码的需求，那就不该传入 chunk_size 参数，且应该有 if 判断。

def download_file(url):local_filename = url.split('/')[-1]# 注意传入参数 stream=Truewith requests.get(url, stream=True) as r:r.raise_for_status()with open(local_filename, 'w') as f:for chunk in r.iter_content(): if chunk:f.write(chunk.decode("utf-8"))return local_filename

登录后复制

iter_content[1] 函数本身也可以解码，只需要传入参数 decode_unicode = True 即可。另外，搜索公众号顶级Python后台回复“进阶”，获取一份惊喜礼包。

请注意，使用 iter_content 返回的字节数并不完全是 chunk_size，它是一个通常更大的随机数，并且预计在每次迭代中都会有所不同。

方法二

使用 Response.raw[2] 和 shutil.copyfileobj[3]

import requestsimport shutildef download_file(url):local_filename = url.split('/')[-1]with requests.get(url, stream=True) as r:with open(local_filename, 'wb') as f:shutil.copyfileobj(r.raw, f)return local_filename

登录后复制

这将文件流式传输到磁盘而不使用过多的内存，并且代码更简单。

注意：根据文档，Response.raw 不会解码，因此如果需要可以手动替换 r.raw.read 方法

response.raw.read = functools.partial(response.raw.read, decode_content=True)

登录后复制

速度

方法二更快。方法一如果 2-3 MB/s 的话，方法二可以达到近 40 MB/s。

参考资料

[1]iter_content: https://requests.readthedocs.io/en/latest/api/#requests.Response.iter_content

[2]Response.raw: https://requests.readthedocs.io/en/latest/api/#requests.Response.raw

[3]shutil.copyfileobj: https://docs.python.org/3/library/shutil.html#shutil.copyfileobj

以上就是Python 下载大文件，哪种方式速度更快！的详细内容，更多请关注【创想鸟】其它相关文章！

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2240554.html

Python

0 0

关于作者

PHP中文网签约作者

264.4K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

Python图像处理：频域滤波降噪和图像增强

上一篇 2025年2月26日 20:22:21

Whoosh：Python 的轻量级搜索工具

下一篇 2025年2月26日 20:22:44

Python图像处理：频域滤波降噪和图像增强

图像处理已经成为我们日常生活中不可或缺的一部分，涉及到社交媒体和医学成像等各个领域。通过数码相机或卫星照片和医学扫描等其他来源获得的图像可能需要预处理以消除或增强噪声。频域滤波是一种可行的解决方案，它可以在增强图像锐化的同时消除噪声。快速…

PHP中文网
2025年2月26日 • 编程技术
2000
细思恐极，插上U盘就开始执行Python代码

一个突发奇想，当你把usb插进去的时候，能不能自动执行usb上的程序。查了一下，发现只有windows上可以，具体的大家也可以搜索(搜索关键词usb autorun)到。但是，如果我想，比如，当一个usb插入时，在后台自动把usb里的重要文…

PHP中文网
2025年2月26日 • 编程技术
2000
编程技术

Python 中的万能之王 Lambda 函数

Lambda 函数简介 Lambda函数也被称为匿名(没有名称)函数，它直接接受参数的数量以及使用该参数执行的条件或操作，该参数以冒号分隔，并返回最终结果。为了在大型代码库上编写代码时执行一项小任务，或者在函数中执行一项小任务，便在正常过程…

PHP中文网
2025年2月26日
2000
三十个 Python 函数，解决99%的数据处理任务！

我们知道 Pandas 是 Python 中最广泛使用的数据分析和操作库。它提供了许多功能和方法，可以快速解决数据分析中数据处理问题。为了更好的掌握 Python 函数的使用方法，我以客户流失数据集为例，分享30个在数据分析过程中最常使用…

PHP中文网
2025年2月26日 • 编程技术
2000
一种编译器视角下的Python性能优化

“Life is short，You need python”！老码农很喜欢python的优雅，然而，在生产环境中，Python这样的没有优先考虑性能构建优化的动态语言特性可能是危险的，因此，流行的高性能库如TensorFlow 或PyT…

PHP中文网
2025年2月26日 • 编程技术
2000
Python 数据可视化的三大步骤

1、首先，要知道我们用哪些库来画图? matplotlib Python中最基本的作图库就是matplotlib，是一个最基础的Python可视化库，一般都是从matplotlib上手Python数据可视化，然后开始做纵向与横向拓展。 Se…

PHP中文网
2025年2月26日 • 编程技术
2000
用 NumPy 在 Python 中处理数字

这篇文章讨论了安装 NumPy，然后创建、读取和排序 NumPy 数组。 numpy（即 numerical python）是一个库，它使得在 python 中对线性数列和矩阵进行统计和集合操作变得容易。我在 python 数据类型的笔记中…

PHP中文网
编程技术 2025年2月26日
2000
编程技术

学会这招真实用！复制粘贴，快速将Python程序打包成exe！

大家好，我是菜鸟哥。为了将Python程序发送给不懂代码和没有安装Python的同事、朋友使用，最好的方式就是将Python程序打包成exe可执行文件，再发送给他们。我之前曾经打包过几次，操作并没有难度，但不会记打包命令，每次打包时都需…

PHP中文网
2025年2月26日
2000
TIOBE 1月编程语言排行榜出炉：Python蝉联冠军，C和Java分列二三

作者丨齐健【51CTO.com原创稿件】根据 TIOBE 公布的最新一期编程语言排行榜，Python 荣获 2021 年度编程语言称号，第二名和第三名则分别由 C 和 Java 占据。这是 Python 连续两次摘得 TIOBE 年度…

PHP中文网
2025年2月26日 • 编程技术
2000
用Python处理Excel的14个常用操作

大家好，我是菜鸟哥！数据是网上找到的销售数据，长这样：一、关联公式:Vlookup vlookup是excel几乎最常用的公式，一般用于两个表的关联查询等。所以我先把这张表分为两个表。 df1=sale[[‘订单明细号’,’单据日期’,…

PHP中文网
2025年2月26日 • 编程技术
2000

发表回复

登录后才能评论

Python 下载大文件，哪种方式速度更快！

方法一

方法二

速度

参考资料

关于作者

AD推荐 黄金广告位招租... 更多推荐

相关推荐

发表回复

AD推荐黄金广告位招租... 更多推荐