许多开发者在使用Python下载网络文件时,可能会遇到从blob URL下载文件失败的情况。本文以法兰克福证券交易所的Excel文件下载为例,详细说明如何解决此问题。
问题描述: 直接使用urllib或wget库从法兰克福证券交易所下载文件(例如,“主数据”文件),下载的文件大小异常小且内容无法读取。这是因为原始URL指向一个blob URL,它并非指向实际文件,而是浏览器中的一个数据块。
解决方案: 问题根源在于服务器在未识别用户代理的情况下拒绝了访问请求。解决方法是模拟浏览器请求,伪造一个用户代理。
立即学习“Python免费学习笔记(深入)”;
以下提供Python 3和Python 2的解决方案代码:
Python 3 代码:
import urllib.request as requesturl = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/all-tradable-etfs-etcs-and-etns.xlsx'# 模拟Safari浏览器用户代理headers = {'User-Agent': 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'}req = request.Request(url, headers=headers)with request.urlopen(req) as response: file_content = response.read() # 将文件内容写入本地文件 with open('downloaded_file.xlsx', 'wb') as f: f.write(file_content)print("文件下载成功!")
登录后复制
Python 2 代码:
import urllib2url = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/All-tradable-ETFs-ETCs-and-ETNs.xlsx'# 模拟Safari浏览器用户代理headers = {'User-Agent': 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'}req = urllib2.Request(url, headers=headers)with urllib2.urlopen(req) as response: file_content = response.read() # 将文件内容写入本地文件 with open('downloaded_file.xlsx', 'wb') as f: f.write(file_content)print("文件下载成功!")
登录后复制
通过添加User-Agent头部信息模拟浏览器请求,从而绕过服务器限制,成功下载文件。 代码中已将print(f.read())修改为将文件内容写入本地文件downloaded_file.xlsx,避免直接打印到控制台。 请注意,如果目标URL发生变化,需要更新代码中的URL。
以上就是Python下载法兰克福证券交易所文件失败怎么办?的详细内容,更多请关注【创想鸟】其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。
发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/3170756.html