详谈404问题,以及处理方法。
作者:百度站长平台lee 发布时间:2013年5月3日
今天为什么要说一下404问题呢,最近看case过程中发现个很有意思的网站,该网站被灌了大量的垃圾信息,被其发现后及时地进行了删除,这一点是值得肯定的。通常情况下,正常网站将自动返回404状态码,搜索引擎进行更新并删除,避免对网站用户及搜索引擎带来负面影响。但问题来了,该网站只删除了内容,没有任何主体内容的页面被保存了下来,未做404处理。当然,存在一类网站只删除内容后返回正常200状态码,提醒一句"该内容已删除",但其都没有。可以发现目前这个搜藏中的url仍然正常返回200,http://cang.baidu.com/Lee/snap/3b0a0cc8e7d7899facd36fad.html,造成的后果:搜索引擎将花费大量的资源在这种无效页面上,那么,同等耗损下用在重要页面上的资源将被大量挤占,可想而知,正常优质页面在搜索引擎的部分表现将受到影响。经过我们运营同学的多方沟通下至今仍未进一步处理。我觉得,21世纪第二个十年了,这种问题不应该再存在了的。绵阳广告网站制作,绵阳网页制作公司推荐阅读>>> 404页面制作详解,
好吧,承认我被打败了。简单说一下:
404状态码代表‘Not Found’,spider更新时会认为该页面已失效,此时呢将在索引库中删除,短期内spider再次发现该url不再会抓取。因此,出来了两类问题:第一,网页临时性打不开;第二,页面永远无法打开。针对第一类问题,我建议不要立刻返回404,而是使用503.503等同于告诉spider该页面临时访问不了,过段时间再来光临。关于503,spider会认为该网页临时无法访问,短期内会再光临。如果网页已经恢复,即刻正常抓取;如果继续返回503,短期内还会再光临几次,但如果该页面长时间返回503,该url仍会被认作失效链接,从索引库中删除。针对第二类问题,永远无法打开的页面,404,不用考虑。各种web2类页面删除后同样需要返回404告知搜索引擎该页面已失效。绵阳哪有制作网站的,网站制作公司推荐阅读>>> 快速制做404错误页面,
回归之前那个网站,删除内容后该页面没有任何价值。最恰当的处理是:
1、直接做死链处理并返回404;
2、在百度站长平台死链提交工具中提交死链sitemap.
最后呢,提醒一下各位站长朋友,当您的网站存在被发布大量垃圾信息时,请:
1、及时删除相关垃圾页面,并做404处理;绵阳做手机网站,绵阳网站设计推荐阅读>>> 404页面设置方法_404页面案例,
2、制作符合要求的死链sitemap;
3、登录百度站长平台,进入死链提交工具提交死链sitemap.
相关文章:
-
404页面设置方法 1:虚拟空间设置方法 现在的idc提供商基本都提供404设置的功能,直接上传文件设置即可。每个空间商的控制面板都不同,我在这里就不多说了。 2:IIS下设置404页面 在IIS管理...
-
要了解网站404错误页面制作步骤,首先要了解什么是404错误页面。 所谓404错误页面就是链接指向的网页不存在,网页URL生成规则改变、网页文件更名或移动位置、导入链接拼写错误等,导致原...
-
前面有一篇文章专门写 网站404错误 怎么办的,其中最后一个大杀手锏就是自定义404页面,那么如何自定义404页面呢? 操作步骤 1.制作自己的404静态页面 2.上传404静态页面到网站根目录 3.指定...
-
任何一个网站,或多或少都会有一些404页面,可是这些404页面非常影响用户体验,那么网站404错误怎么办呢? 解决办法 1.如果页面是因为链接地址改变而形成的404页面,那么就将404页面301重定...
-
没人会想到网站访客会在错误页面上停留,但实际上这种情况确实存在。特别是在404页面上,访客会经常逗留。所以,你可以将404错误页面设计的更加吸引用户,而不应让用户迫不及待离开。...
-
小谈一下网站的404, 算是对这一段时间的一个总结吧. 先说一下什么是404? 网站404是服务器对ua请求一个不存在或已删除页面返回的一个状态码, 判断一个404页面不是看它长的像不像404页, 而是要...
-
Html状态码也是网站与spider进行交流的渠道之一,会告诉spider网页目前的状态,spider再来决定下一步该怎么做抓or不抓or下次再来看看。对于200状态码大家已经很熟了,那么我们来介绍几种常见的...
-
404错误:当baiduspider在抓取您网站时,发现大量的404页面(协议死链或内容死链)时,会在抓取异常工具中将这类页面进行展示,建议通过百度站长平台--死链工具提交死链的方式进行处理,以...
-
一、简介概念 404页面是客户端在浏览网页时,服务器无法正常提供信息,或是服务器无法回应,且不知道原因。404错误信息通常是在目标页面被更改或移除,或客户端输入页面地址错误后显示...
-
作SEO时,我们经常会在日志上看到类似这样的代码: 61.135.166.232 - - [31/Dec/2007:02:30:11 +0800] GET /category21.html HTTP/1.1 200 10968 - Baiduspider+(+http://www.baidu.com/search/spider.htm) 66.249.70.172 - - [31/Dec/2007:03:36...
- 上一篇:IIS开启Gzip压缩
- 下一篇:网站日志中的HTTP状态码详解