503状态码的使用场景及与404的区别
Html状态码也是网站与spider进行交流的渠道之一,会告诉spider网页目前的状态,spider再来决定下一步该怎么做——抓or不抓or下次再来看看。对于200状态码大家已经很熟了,那么我们来介绍几种常见的失效网页使用的状态码:
【404】404返回码的含义是“NOT FOUND”,百度会认为网页已经失效,那么通常会从搜索结果中删除,并且短期内spider再次发现这条url也不会抓取。绵阳微网站制作,公司网页设计推荐阅读>>> 站点抓取报错中404页面与死链工具数据处理的关系说明,
【503】503返回码的含义是“Service Unavailable”,百度会认为该网页临时不可访问,通常网站临时关闭,带宽有限等会产生这种情况。对于网页返回503,百度spider不会把这条url直接删除,短期内会再访问。届时如果网页已恢复,则正常抓取;如果继续返回503,短期内还会反复访问几次。但是如果网页长期返回503,那么这个url仍会被百度认为是失效链接,从搜索结果中删除。
【301】301返回码的含义是“Moved Permanently”,百度会认为网页当前跳转至新url。当遇到站点迁移,域名更换、站点改版的情况时,推荐使用301返回码,尽量减少改版带来的流量损失。虽然百度spider现在对301跳转的响应周期较长,但我们还是推荐大家这么做。
一些网站把未建好的页面放到线上,并且这些页面在被百度抓取的时候返回码是404,于是页面被百度抓取后会被当成死链直接删除。但是这个页面在第二天或者过几天就会建好,并上线到网站内展现出来,但是由于之前已经被百度当做死链删除,所以要再次等这些链接被发现,然后抓取才能展现,这样的操作最终会导致一些页面在一段时间内不会在百度出现。比如某个大型门户网站爆出大量新闻时效性很强的专题未被百度及时收录的问题,经检查验证后发现就是因为页面未建成就放置在线上,并返回404状态码,被百度当成死链删除,造成收录和流量损失。绵阳建站公司,网站制作公司推荐阅读>>> 404错误是什么,
对于这样的问题,建议网站使用503返回码,这样百度的抓取器接到503返回码后,会在隔一段时间再去访问这个地址,在您的页面建好上线后,就又能被重新抓取,保证页面及时被抓取和索引,避免未建好的内容设为404后带来不必要的收录和流量损失。陕西网站制作,建设网站制作推荐阅读>>> 404页面制作详解,
其它建议和总结:
1、如果百度spider对您的站点抓取压力过大,请尽量不要使用404,同样建议返回503。这样百度spider会过段时间再来尝试抓取这个链接,如果那个时间站点空闲,那它就会被成功抓取了
2、如果站点临时关闭或者页面暂未建好上线,当网页不能打开时以及没有建好时,不要立即返回404,建议使用503状态。503可以告知百度spider该页面临时不可访问,请过段时间再重试。
相关文章:
-
404页面设置方法 1:虚拟空间设置方法 现在的idc提供商基本都提供404设置的功能,直接上传文件设置即可。每个空间商的控制面板都不同,我在这里就不多说了。 2:IIS下设置404页面 在IIS管理...
-
要了解网站404错误页面制作步骤,首先要了解什么是404错误页面。 所谓404错误页面就是链接指向的网页不存在,网页URL生成规则改变、网页文件更名或移动位置、导入链接拼写错误等,导致原...
-
前面有一篇文章专门写 网站404错误 怎么办的,其中最后一个大杀手锏就是自定义404页面,那么如何自定义404页面呢? 操作步骤 1.制作自己的404静态页面 2.上传404静态页面到网站根目录 3.指定...
-
任何一个网站,或多或少都会有一些404页面,可是这些404页面非常影响用户体验,那么网站404错误怎么办呢? 解决办法 1.如果页面是因为链接地址改变而形成的404页面,那么就将404页面301重定...
-
没人会想到网站访客会在错误页面上停留,但实际上这种情况确实存在。特别是在404页面上,访客会经常逗留。所以,你可以将404错误页面设计的更加吸引用户,而不应让用户迫不及待离开。...
-
小谈一下网站的404, 算是对这一段时间的一个总结吧. 先说一下什么是404? 网站404是服务器对ua请求一个不存在或已删除页面返回的一个状态码, 判断一个404页面不是看它长的像不像404页, 而是要...
-
404错误:当baiduspider在抓取您网站时,发现大量的404页面(协议死链或内容死链)时,会在抓取异常工具中将这类页面进行展示,建议通过百度站长平台--死链工具提交死链的方式进行处理,以...
-
一、简介概念 404页面是客户端在浏览网页时,服务器无法正常提供信息,或是服务器无法回应,且不知道原因。404错误信息通常是在目标页面被更改或移除,或客户端输入页面地址错误后显示...
-
作SEO时,我们经常会在日志上看到类似这样的代码: 61.135.166.232 - - [31/Dec/2007:02:30:11 +0800] GET /category21.html HTTP/1.1 200 10968 - Baiduspider+(+http://www.baidu.com/search/spider.htm) 66.249.70.172 - - [31/Dec/2007:03:36...
-
作者:百度站长平台lee 发布时间:2013年5月3日 今天为什么要说一下404问题呢,最近看case过程中发现个很有意思的网站,该网站被灌了大量的垃圾信息,被其发现后及时地进行了删除,这一点...
- 上一篇:404错误是什么?
- 下一篇:404页面详解_404页面设置