CrawlSpider 中 Deny 设置不起作用？如何正确使用 Deny 阻止特定 URL 链接？

PHP中文网 • 2025年2月25日 16:58:00 • 编程技术 • 阅读 2

scrapy crawlspider 中 deny 设置不起作用？

在 crawlspider 中，deny 设置可用于阻止爬取特定 url 链接。然而，根据提供的代码片段，deny 设置似乎没有正常工作，仍然爬取了包含 “guba” 的链接。

此问题可能是由于以下原因造成的：

deny 参数不是正则表达式

deny 参数必须是正则表达式，否则只有 url 完全匹配才可以被阻止。代码片段中使用的字符串不是正则表达式，因此它将只阻止完全匹配这些字符串的 url。

为了解决这个问题，需要将 deny 参数中的字符串修改为正则表达式。例如：

deny=(r'guba', r'data', r'fund.*.eastmoney.com/d+.html', r'.*so.eastmoney.*', r'/gonggao/')

登录后复制

这样一来，代码将阻止包含 “guba”、”data”、符合正则表达式 “fund..eastmoney.com/d+.html”、符合正则表达式 “.so.eastmoney.*” 和 “/gonggao/” 的链接。

以上就是CrawlSpider 中 Deny 设置不起作用？如何正确使用 Deny 阻止特定 URL 链接？的详细内容，更多请关注【创想鸟】其它相关文章！

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2186692.html

领商品

0 0

关于作者

PHP中文网签约作者

243.6K 文章

0 评论

0 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

为什么反爬虫在当今互联网环境中如此困难？

上一篇 2025年2月25日 16:57:54

怎么查看php版本

下一篇 2025年2月25日 03:02:23

编程技术

Python 新手如何找到全面描述数据类型和方法的文档？

寻找全面的 Python 技术文档作为 Python 新手，您可能会在寻找详细的技术文档时遇到困难。如果您正在寻找全面描述每种数据类型及其属性和方法的文档，以下是一些建议：官方 Python 文档官方 Python 文档提供了大量的信…

PHP中文网
2025年2月25日
2000
编程技术

Python 中的“functoolspartial”是什么？

阅读 global news one 上的完整文章什么是 functools.partial？ functools.partial 通过将参数部分应用于现有函数来创建新函数。这有助于在某些参数重复或固定的场景中简化函数调用。 python…

PHP中文网
2025年2月25日
2000
编程技术

在线Python编辑器中，如何使用PHP后端处理input元素提交的代码？

在线Python编辑器与PHP后端数据交互详解本文介绍如何在在线Python编辑器中，利用PHP后端处理input元素提交的代码。不同的后端技术处理方式有所不同，以下重点讲解PHP后端实现方法。使用PHP后端处理Python代码实现…

PHP中文网
2025年2月25日
2000
编程技术

如何保障PHP 8应用程序的安全性？

PHP 8 应用程序的安全保障需要遵循以下步骤：基础功：输入验证和输出转义：对用户输入进行验证和过滤，防止恶意代码注入和 XSS 攻击。进阶：数据库安全：使用预处理语句防止 SQL 注入，定期备份数据库以防万一。高级：代码审计和安全测试：进…

PHP中文网
2025年2月25日
2000
编程技术

如何确保PHP 8应用安全

PHP 8 本身与之前版本一样安全，但新特性带来新挑战：输入验证、数据库安全、文件上传安全和会话管理仍很重要。PHP 8 的新特性包括命名参数、属性和联合类型，需要注意验证严谨、访问控制和类型检查。示例函数演示了如何安全处理用户输入。安全与…

PHP中文网
2025年2月25日
2000
编程技术

PHP 8应用安全需要关注哪些方面

PHP 8带来了新风险，如类型转换漏洞和用户输入处理不当。为了抵御这些风险，应采取以下措施：验证和过滤用户输入，使用预处理语句防止SQL注入和使用htmlspecialchars函数防止跨站脚本攻击。使用库辅助文件上传验证和安全扫描。采用多…

PHP中文网
2025年2月25日
2000
编程技术

PHP 8如何防止XSS攻击

PHP 8 XSS防御要求采取多层次策略，包括：1. 输入验证（包括数据类型检查、长度限制、正则表达式过滤）；2. 输出编码（根据输出上下文选择合适的函数，如 htmlspecialchars、js_encode 等）；3. 安全头设置（如…

PHP中文网
2025年2月25日
2000
编程技术

PHP 8如何防范SQL注入

PHP 8 提供了多个防御 SQL 注入的方法：参数化查询、PDO 强化功能和输入验证过滤。参数化查询将 SQL 查询和数据分开处理，防止恶意代码执行。 PDO 具有数据类型检查、错误处理和跨数据库兼容性。输入验证过滤在使用参数化查询前检查…

PHP中文网
2025年2月25日
2000
PHP 8如何安全处理用户输入

PHP 8安全处理用户输入：趟过那片荆棘很多开发者都栽过跟头，用户输入，这玩意儿看起来人畜无害，实则暗藏杀机。你以为它只是个简单的字符串，其实它可能是sql注入的利器，也可能是跨站脚本攻击（xss）的导火索，甚至可能是一个精心设计的命令…

PHP中文网
编程技术 2025年2月25日
2000
编程技术

PHP 8如何安全处理API请求

要安全地处理 PHP 8 API 请求，需要验证和授权，防止未经授权的访问；进行输入验证，防止恶意输入；输出编码，防止 XSS 攻击；谨慎处理错误，避免暴露敏感信息；性能优化，在确保安全的同时提升效率；通过定期审计、更新和使用加密等措施提升…

PHP中文网
2025年2月25日
2000