Python下载法兰克福证券交易所文件失败怎么办?

python下载法兰克福证券交易所文件失败怎么办?

解决Python下载法兰克福证券交易所文件失败问题

许多开发者在使用Python下载网络文件时,可能会遇到从blob URL下载文件失败的情况。本文以法兰克福证券交易所的Excel文件下载为例,详细说明如何解决此问题。

问题描述: 直接使用urllib或wget库从法兰克福证券交易所下载文件(例如,“主数据”文件),下载的文件大小异常小且内容无法读取。这是因为原始URL指向一个blob URL,它并非指向实际文件,而是浏览器中的一个数据块。

解决方案: 问题根源在于服务器在未识别用户代理的情况下拒绝了访问请求。解决方法是模拟浏览器请求,伪造一个用户代理。

立即学习“Python免费学习笔记(深入)”;

以下提供Python 3和Python 2的解决方案代码:

Python 3 代码:

import urllib.request as requesturl = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/all-tradable-etfs-etcs-and-etns.xlsx'# 模拟Safari浏览器用户代理headers = {'User-Agent': 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'}req = request.Request(url, headers=headers)with request.urlopen(req) as response:    file_content = response.read()    # 将文件内容写入本地文件    with open('downloaded_file.xlsx', 'wb') as f:        f.write(file_content)print("文件下载成功!")

登录后复制

Python 2 代码:

import urllib2url = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/All-tradable-ETFs-ETCs-and-ETNs.xlsx'# 模拟Safari浏览器用户代理headers = {'User-Agent': 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'}req = urllib2.Request(url, headers=headers)with urllib2.urlopen(req) as response:    file_content = response.read()    # 将文件内容写入本地文件    with open('downloaded_file.xlsx', 'wb') as f:        f.write(file_content)print("文件下载成功!")

登录后复制

通过添加User-Agent头部信息模拟浏览器请求,从而绕过服务器限制,成功下载文件。 代码中已将print(f.read())修改为将文件内容写入本地文件downloaded_file.xlsx,避免直接打印到控制台。 请注意,如果目标URL发生变化,需要更新代码中的URL。

以上就是Python下载法兰克福证券交易所文件失败怎么办?的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/3170756.html

(0)
上一篇 2025年3月31日 10:00:21
下一篇 2025年2月24日 16:08:44

AD推荐 黄金广告位招租... 更多推荐

相关推荐

发表回复

登录后才能评论