百度蜘蛛抓取不存在目录 对应的解决方法

相信大家在分析百度蜘蛛日志的时候经常会发现一个问题,就是百度蜘蛛经常会抓取一些不存在的目录,比如:我网站没有这些目录,但是百度蜘蛛一直在抓取,或者你会发现百度蜘蛛在抓取自己的隐私目录,或者说php文件,这个是为什么哪?今天就为大家进行详细解析,讲解对应的解决办法,本篇文章干货较多,建议仔细阅读。

百度蜘蛛抓取不存在目录 对应的解决方法

1,如果蜘蛛只抓取首页,打死不抓取内页,是什么情况!

很简单,域名有问题,一般来讲,如果遇到这种情况,域名目前可能在审核期,也就是说,做过违规行业,或者你的程序有作弊的嫌疑,但是域名的占比较大,如果程序有问题,开始百度蜘蛛也会抓取一些的。

百度蜘蛛抓取不存在目录 对应的解决方法

2,如果百度蜘蛛抓取一些隐私文件,例如php、zip、rar什么情况!

对于这种情况,你要去判断当前这个IP是不是假蜘蛛文件,因为现在很多IP会自动更改自己的UA,跟百度蜘蛛一样,你无法从蜘蛛日志中分辨,你可以去识别下IP,通过ip138看看是不是蜘蛛IP,如果不是,果断屏蔽掉,如果太多,按照IP段进行屏蔽。

百度蜘蛛抓取不存在目录 对应的解决方法百度蜘蛛抓取不存在目录 对应的解决方法

3,如果百度蜘蛛抓取一些隐私目录,真蜘蛛的情况下,怎么处理。

如果你确认是真的百度蜘蛛,百度可能是在抓取你的页面内部程序,考察你用的程序的版本,等,这些百度都会有分辨策略的,一般来讲,自己编写的程序,百度都会优先给予高评分,是这样的。我们为了防止蜘蛛抓取我们的隐私目录,我们一般都会用robots.txt进行屏蔽,记住:生效时间24小时左右。

百度蜘蛛抓取不存在目录 对应的解决方法

4,如果蜘蛛抓取一些不存在的目录,一些不存在的文件,怎么办?

首先依然是判断是否是真蜘蛛,如果是真蜘蛛,百度抓取一些不存在的目录,是因为,你这个域名之前做过一些站点,现在又开始做,百度会根据之前的评分、URL进行抓取,看看是不是之前的站点又恢复了,一般来讲,这种抓取会在30天内自动消失的,如果30天后一直存在,你就要屏蔽这类链接了,总之:这种抓取对于你的站点,没有太大的伤害,只是排查而已。

另外还有一种情况,如果你把其他的站点301到你当前的域名上,蜘蛛就会按照其他站点的URL来抓取你的网站,这个时候你也会发现百度在抓取一些不存在的目录,不过不用怕,这种对于你的站点没有伤害的。

百度蜘蛛抓取不存在目录 对应的解决方法

5,蜘蛛抓取,301、304,、200、403、404、444状态码怎么办?

首先我们要明白,301状态码,就是重定向,如果你的顶级域名,例如daidaiseo.com-》www.daidaiseo.com当百度抓取daidaiseo.com上面的资源时,就会出现301重定向的代码,如果抓取www.daidaiseo.com上面的资源,就会是200状态码,意思是抓取成功。

而抓取304状态码是为什么那?如果你在日志上看到了304状态码,则表示,你的资源一直都没有变化,属于静态页面资源,304状态码,对于网站的影响比较小,一般来讲是做了百度cdn,有缓存,就容易出现304状态码,但只要你每天给百度提交资源,时时保持更新,就没事。

403是权限问题,禁止访问,是你服务器进行了设置,而444则是未找到服务器,404则是空页面,这个页面丢失,这三个状态码,则表示网站出现问题,记住:不要让网站出现大量404,你可以让状态码变成403只是限制访问,如果都是404,则表明网站大量页面不可用,百度评分就会降低,好了,今天就讲解到这么多,后面会陆续分享这方面的知识点。

文章来源:代代SEO博客

来源地址:https://www.daidaiseo.com/seoti/10949.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:SEO优化专员,转转请注明出处:https://www.chuangxiangniao.com/p/896874.html

(0)
上一篇 2025年1月4日 00:47:40
下一篇 2025年1月4日 00:48:15

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • seo优化让蜘蛛经常来的方法

    对于seoer来说,对搜索引擎爬虫都应该有所了解,因为在进行seo优化时都会和搜索引擎爬虫有所接触,所以我们要了解搜索引擎爬虫的工作原理。seo优化外包公司今天来给大家介绍一下。 什么是搜索引擎爬虫? 搜索引擎爬虫程序,其实就是搜索引擎的一…

    搜索优化 2025年1月4日
    100
  • 提高seo优化蜘蛛抓取的方法

    搜索引擎,对于很多外行人或者新手来说,都不了解,但对于资深站长来说,都是很熟悉的SEO推广内容,只有搜索引擎蜘蛛抓取率有所提升,才能够让网站更多的页面参与排名。那么提高搜索引擎抓取方法有哪些? 1、接入熊掌号 做SEO推广中百度的熊掌号很重…

    搜索优化 2025年1月4日
    100
  • 逆冬 浅析引蜘蛛软件原理 分享2个最新SEO知识

    最近一直有徒弟说、要我写一下市面上【引蜘蛛】软件的实现原理、经过一些大佬的帮助、终于研究明白了软件实现原理。我们今天来浅析一下、需要说明的是:本人仅以技术的角度剖析、希望大家不要用在非法途径。 1.【引蜘蛛软件】根本原理 前面公众号文章里也…

    2025年1月4日
    100
  • 百度蜘蛛Baiduspider的真假如何分辨

    实际上,我们的日志中,有很多的baiduspider是他人伪装的,要想解决这个问题。我们必须在验证baiduspider真伪上下功夫,这篇文章详细的介绍了爬虫的鉴别方法。 我们在根据网站日志分析搜索引擎蜘蛛抓取网页的记录时,实际上很多站点都…

    搜索优化 2025年1月4日
    100
  • 逆冬:2天百度权重蜘蛛40w+、分享3个蜘蛛池实战干货!

    最近两天一直在折腾蜘蛛池、终于在24号的时候、折腾明白了很多东西,最初收过来蜘蛛池的时候、1天蜘蛛量5w左右,这是24号23点数据、当天超过了40万,整整8倍,而且这些百度蜘蛛都是220和116的蜘蛛、过滤了【百度渲染蜘蛛】以及其他无用的百…

    2025年1月4日
    100
  • 搜索引擎及搜索引擎蜘蛛是什么?

    搜索引擎及搜索引擎蜘蛛是什么? 我在实战培训第一课讲搜索引擎基本工作原理时,都会给新人讲搜索引擎是什么,然后再来讲,搜索引擎蜘蛛是什么。那么,在这里再讲一下。主要分类如下: 1、按国内与国外分 国内: 百度、搜狗、360、神马(UC)、头条…

    搜索优化 2025年1月4日
    100
  • 逆冬:一招教你识别百度真假蜘蛛!

    最近一个使用众火的徒弟问我、说220和116的蜘蛛不是真蜘蛛,因为他nslookup的时候,并没有出现“baidu”类的字样、反而出现了别的字样,所以他感觉不真,而同样的ip,我本地用windows电脑nslookup的确实可以出现“bai…

    2025年1月4日
    100
  • 怎么识别百度蜘蛛Baiduspider的真假呢 官方推荐方法

    实际上,我们的日志中,有很多的baiduspider是他人伪装的,要想解决这个问题。我们必须在验证baiduspider真伪上下功夫,这篇文章详细的介绍了爬虫的鉴别方法。 我们在根据网站日志分析搜索引擎蜘蛛抓取网页的记录时,实际上很多站点都…

    编程技术 2025年1月4日
    100
  • 只需两步,教你正确识别百度蜘蛛

    经常听到站长们问,百度蜘蛛是什么?最近百度蜘蛛来的太频繁服务器抓爆了,最近百度蜘蛛都不来了怎么办,还有很多站点想得到百度蜘蛛的IP段,想把IP加入白名单,但IP不固定,这些百度方面并未透露相关信息。 那怎么才能识别正确的百度蜘蛛呢?来来来,…

    2025年1月4日
    100
  • 百度抓取js么 百度蜘蛛识别js么 js需要屏蔽抓取么

    今天我们来讨论一个比较重要的内容,百度是否抓取我们网站js,百度蜘蛛是否识别我们网站js中的内容,百度抓取js有哪些坏处,需要屏蔽js么,我们当前这篇文章会详细的讲解这一块的内容! 百度是否会抓取网站js文件? 其实大家可以通过分析蜘蛛发现…

    2025年1月4日
    100

发表回复

登录后才能评论

联系我们

156-6553-5169

在线咨询: QQ交谈

邮件:253000106@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

联系微信