网站收录怪象: 那些关于收录的秘密
SEO之路上难免会碰到一些奇葩的事情,比如网站改版了还收录旧的URL地址、测试网址无缘无故就被收录了导致正式网址不被收录、换了IP结果导致百度收录不更新了等等,大多数的时候大家都把问题的原因归结于百度,百度实在有些冤枉,中国服装网seo负责人飞鹰正义在工程师的指点下为大家揭开这奥秘。
在开始前先简单的给大家讲解一点小知识:
域名和IP相当于站点的名字和身份证,IP相当于现如今的身份证,但是身份证IP地址很难记,所以就产生了域名。这里不是给大家普及历史知识,只是现在大多数情况下都采用域名来访问所以导致大家忽略了一个事实:最终寻址的是身份证号码也就是IP,不是域名!来看个域名解析的简化过程图
通过这里大家应该明白一些了吧?域名只是方便我们记忆,而真正的寻址的应该是IP!大家都知道域名DNS服务器在全球有N个节点,我们新域名刚解析的时候常会碰到某些区域因为DNS数据同步慢而导致访问不了的情况,而老域名换IP的时候也会碰到用户访问的还是老IP的想象。这你都知道?别急你还有不知道的!绵阳著名的网站建设公司,绵阳网页制作公司推荐阅读>>> 如何加快百度对新站点的收录,以及如何快速提示新站点排名?
然而我们的搜索引擎蜘蛛大多数分布式抓取,自身都建有DNS,一来解决抓取的时候的效率,不必每次都要解析IP后抓取,二来我们站点的主体表现形式都是域名,而不是IP,所以带着我们的域名host头去访问我们的老IP还是会访问的到,因此就会导致我们开头提到的一些奇葩怪象。说完基本概念,我们再来详细分析一下这几个怪象的具体成因!
一、网站改版了还收录旧的URL地址
这个问题其实跟上面的基础没啥太大关系,但每天在百度站长社区问的人实在是太多了,也算是收录的一大奇葩现象,所以在这里还是拿出来叨一下。
很多站长网站改版了启用了新的URL结构,也在站长平台进行了改版提交,但是还是出现收录旧的URL,遇到这个问题首先我们还是从站点自身的问题找起:
1.是否已经去除所有旧地址入口?
这是个严肃的问题,很多朋友因为站点大、结构复杂、改版不彻底导致并没有去除所有入口页面,导致新内容产生的同时在一些角落里还是产生了老的入口,只要链接地址还是老的就有可能被收录。所以要改版要换URL必须彻头彻尾的把所有链接替换为新的URL。为了加速生效新的链接除了站点自身链接外尽可能修改一下外部的链接,例如友情链接。
2.老的URL是否做了301到新的URL上?
老的URL是否真的是301到新的URL上面?我也遇到一些奇葩的朋友使用js之类的技术,看起来好像也是跳转,也像那么回事,但其实根本不是一回事!绵阳网站建设制作,绵阳网页设计公司推荐阅读>>> 百度站内搜索如何提升收录如何提交sitemap,
3. 关于百度方面
在做好1和2的基础上,即使百度收录了旧的链接,也不必担心,因为百度对跳转属性的站点和链接识别和确认需要一定的时间,而且只要是稳定的跳转,最终都会转换成新链接的流量,当然记得通过网站改版工具及时提交改版规则。
二、测试网址无缘无故就被收录了导致了正式网址不被收录
这里我建议大家以后测试的时候尽量环境保证本地或者在特定测试环境下才能访问,否则现在的各种浏览器可能会把地址透露出去,也有不小心把地址拿去搜索等渠道导致被搜索引擎收录那么对你的站点上线影响还是蛮大的。
1.没有关闭测试服务器
上面普及知识有提到过,大家换IP或者换URL地址的时候因为老的服务器没有关闭,而搜索引擎缓存了IP,导致搜索引擎还是可以访问到这些页面;
2.没有删除IIS绑定
还有一些朋友换了IP地址,但是并没有在老的IP上的网页服务器上删除网站绑定,导致搜索引擎带HOST头访问该IP的时候能够访问到旧的内容;
一般情况下搜索引擎缓存的时候较长,或者因cdn等因素导致IP同步失败的都会导致上述情况发生,更换ip以后,可以通过抓取诊断工具测试一下百度是否能够正确抓取,如果解析到的ip有误,可点击抓取诊断详情中的“报错”,通知百度更新您站点的ip。
三、换IP后导致百度不收录
上面提到搜索引擎会缓存IP,百度在换IP的时候也说过尽量保证老服务器一段时间内可以访问,为什么要这样?因为服务器真的需要时间去同步内容同步IP,而且直接断了老的服务器很容易导致短时间突发404,因此会给站点造成不可预估的问题;
换IP后不收录原因也是这样,因为换了新服务器数据迁移后导致老服务器的内容并没有更新,所以这个时候其实是百度根本抓取不到你的更新。因此需要通过上面的方式尽快告诉百度,您站点ip的变动,减少站点流量损失。绵阳网站 建设,建企业网站推荐阅读>>> 四大搜索引擎对新站的收录标准分析,
结束语:
其实收录奇葩问题很多,我列举了大部分可能遇到的一些奇葩问题,大部分情况下都是站长存在的一些误区所导致的。【作者飞鹰正义】
相关文章:
-
搜狗网站收录提交入口 一个网站只需提交一次。 您只需要提交网站的首页地址,无需提交详细的内容页面。 符合相关标准的网站,会在您提交的一周内按照搜狗搜索引擎的收录标准被处理。...
-
这个问题估计很多SEOer在网站优化过程中都会遇到过,就是网站的内容拿网址去搜索是已经收录了,但是如果拿文章的题目去搜索的话,却完全找不到自己的网站了,只出来一大堆相似的结果,...
-
一、 概述与分析; 二、 网站建设前期的准备 三、 网站建设中的设置 四、 网站完成后的操作 五、 提升排名的几点因素与影响排名的几个因素 一、 概述与分析 如何让百度快速的收录网站?...
-
百度对站点的收录不理想,导致站内搜索结果数太少? 收录不及时,导致最新的页面搜不到? 您可以在结果页管理的提升收录效果功能中提交数据,从而提升您的站内搜索收录时效性和覆盖率...
-
做SEO的同学一定都希望自己的站点能够被快速收录,能够获得良好的排名。于是,在工作中就针对各大搜索引擎展开攻击,对于一个新站来说,这样做显 然是不理智的。我们只有摸清各大搜索...
-
关于SEO优化的问答很多,今天我想再跟大家说说关于伪原创的话题,伪原创是做站的人最喜欢的更新网站的方式,可是有些人的伪原创被搜索引擎大大喜欢,而有的却一篇不收,为什么区别如...
-
1、网页使用框架 框架内的内容通常不在搜索引擎抓取的范围之内。 2、图片太多,文本太少。 3、提交页面转向另一网站 搜索引擎可能完全跳过这个页面。绵阳科技风格网站建设,公司网页制作...
-
站内搜索工具升级了!为站长又开辟了一条收录绿色通道。站长安装站内搜索工具后,可以在工具后台提交种子页面,Baiduspider将从这个页面出发,沿着该页面发出的所有超链接进行抓取,且层...
-
新站为什么会收录不稳定?经常听到一些站长朋友讨论自己的网站收录每天都会减少一些,甚至是昨天收录的,今天基本上都被百度删除了,其实博客也正处于这个时期,为什么呢,采集是其...
-
最近几个网站都遇到了收录不稳定的情况。经过整站的分析后发现。今天收录明天就删除属于是一种权重低而导致的情况,想要解决这类的情况,就只有做到每日更新更多的原创的文章。我还...