浅谈URL优化与重要性
本人从事SEO多年,优化的案例从几千到几十万IP的都有,正规灰色都有,正规站从未主动发过外链。也很不理解为什么非要去做外链。就非企业站点来说,单锚本文提升单词效果不大,可能是因为优化的站点原因。我接手的都是比较中大型的网站,不会刻意的去堆砌某个关键字的排名,更不用说去专门做某词的锚文本进行投票了。那么应该如何优化大型站点呢。我觉得最重要的因素就是架构/结构。今天跟大家分享首要的架构:url优化。
URL优化的效果跟站点在百度的权重关联性不大,但是对收录、蜘蛛爬行和传递权重有明显的提升。我虽然不常发贴但是经常观察到大部分SEO的提问都是收录怎么怎么不好,权重怎么怎么不高,我也观看过很多站点,很多基础的工作完全都处于迷糊的状态。试想换一种思路,站长变成spider来爬行你的站,我相信大部分站长自己都跑不通。这里我只给出url优化的几个重要点。绵阳微网站设计,网站制作推荐阅读>>> 网站url优化策略大全,
1.URL一致性:URL 一致性是一个非常重要的指标,推荐大家一本书《走进搜索引擎》里面有介绍spider是一种机器程序,而非人脑,虽然也有学习的过程,但是国内网站千千万,每个网站有不同的url规范,你如果url命名规则杂乱无章spider又怎能高效的辨别你的内容规范? 这里举个个人觉得做的比较好的case:“下载吧”。读者可以去翻阅下载吧的网站。他的主体结构为:首页=>列表页=>内容页 。这里因地制宜,只是举例可能并不适合你的站点。
下载吧我分析到他的优化权重承载页为他的内容页。而百度有“偏权重”的说法(见2),所以他把所有的列表页统一用downlist/1~*.html的写法。没有给予列表页过于集权也避免了“偏权重”的影响。 这样子spider可以很自由的识别,只要在downlist目录下面的(数字.html)都属于他的列表页,层次清晰,爬取也很流畅。而他的集权重心在于内容页。内容页统一url为html/1~*.html 通过标签优化和链轮把权重导向给html下面的目录。“偏权重”集中在html目录下。spider也很清晰的可以判断/html目录下面的(数字.html)都属于内页,层次清晰、爬取流畅,权重传递的也很集中,这也属于集权的一种做法。自然收录好权重高了。百度搜索竞价托管,绵阳建站公司推荐阅读>>> 如何优化URL利于网站优化,
2.偏权重:偏权重可能是我自己创造的一个首发词,大神们勿喷。通过我多年的分析发现,每个站点的流量是有集中点的。这个从爱站的工具里面大家可以看出来,这里拿我一个客户和朋友的网站给大家做做案例。
同一个网站 90%的流量都出自于某个目录,在这里面内容类型内容质量都是一样的。相信大家在自己作站过程中也有所体会,百度会偏向给权重到某个目录。考虑到这个问题,url一致性和目录规划就更重要了。
3.爬行原理:蜘蛛爬行原理有 深度优先和宽度优先这里分开说一下:
(1)深度优先:深度优先适用于一些大站,蜘蛛很渴望得到他的内容,比如新浪网易他们的目录很长,也能收录。假如我们给蜘蛛一个线程只能爬取一个页面,爬行轨迹:首页-封面页-频道页-内容页,那么你网站的结构是:首页=> xxx/a=> xxx/a/b=> xxx/a/b/c/1.html=>。蜘蛛会沿着你的深度爬行进去,但是无论多大的站,你的深度也必须有限,否则蜘蛛不可能无穷尽的挖掘进去,爬累了自然就会离开。并且内容也没带回去。绵阳哪家做网站的公司做的好,网站制作设计推荐阅读>>> 各种类型URL的SEO权重比较,
(2)宽度优先:这个是我非常推崇的,而且我所有新站都是这种效果。我自己建了5天的站蜘蛛爬行800次。效果说明在扁平化的今天,宽度优先是可以让蜘蛛非常高效的爬行和返回的。url结构 xxx/a/ xxx/b/ xxx/c/ 这类的叫宽度优化,爬行轨迹 :首页-频道页A-频道页B-频道页C/首页-频道页A-内容页A1-内容页A2-内容页A*
综上所述。其实可以看出:宽度优先的效率明显高于深度优先。而且蜘蛛的任务类别也单一,非常容易识别。同一线程爬取的几乎是同一类型页面,页面样式,外观相同。蜘蛛不必花时间过于的去分析你的页面内结构,层次清晰。
4.爬虫黑洞:这个问题不是什么新问题了。百度也有做专门的阐述,因为一些url处理不当产生的动态参数后缀,或是刻意圈住蜘蛛所做的无限循环,这种的效果明显是弊大于利。对URL 的规划上一定要想办法尽可能的处理掉无限动态参数后缀,并且也要合理的给蜘蛛出口,这才是真正有利于SEO 的做法,关于处理爬虫黑洞的办法这里我不做多讲解。《巧用robots避免蜘蛛黑洞》。
官方声明:百度没有“权重”,文章中提及的“权重”字样仅为站长个人观点。
作者:站长社区 Zewer
相关文章:
-
域名解析DNS分为显性URL和隐形URL,显性URL和隐形URL有什么区别?隐形URL和显性URL哪个更有利于SEO?显性URL相当于域名了302重定向,隐形URL使用iframe框架技术隐藏真实目标地址,显性URL更有利于...
-
插件介绍 wordpress程序网站在发布文章时可以给每一片文章添加与之相关的TAG标签,对于TAG标签可以生成很多页面,增加搜索引擎对内容的抓取量。 WP Auto Keywords插件就是一款能自动给文章添加...
-
使用百度编辑器上传附件后,附件的图标,引用的是绝对URL,一下子完整暴露了编辑器所在目录,甚至后台入口也完全暴露了: 要解决这个问题,有两个方法: 前提是要把ueditor\dialogs\attachm...
-
1. (function(){}())与(function(){})() 这两种写法,都是一种 立即执行函数 的写法,即IIFE (Immediately Invoked Function Expression)。这种函数在函数定义的地方就直接执行了。 通常的函数声明和调用分开的写...
-
matchHeight使所有选定元素的高度完全相等。 尽管这曾经是一个棘手的问题,但如今建议在可能的地方使用CSS Flexbox和CSS Grid,尽管该库对于旧版浏览器仍然有用。 特征 自动匹配元素组的高度 使...
-
用来兼容jquery1.7 版本, jquery版本之间有一些方法可能不同或废弃,会有报错, 可以引入一个 jquery-migrate.min.js 来兼容。 比如1.9版本对于 live(),die(),toggle(),sub(),$.browser 等等都已经不支持了...
-
1.breakpoints.js是什么? breakpoints.js是一个jQuery插件。定义响应性设计的断点,Breakpoints.js 将在浏览器进入和/或者退出断点时消除自定义事件。 breakpoints下载文件夹中readme.txt文件中有这么一句话...
-
%{QUERY_STRING} 服务器变量%{QUERY_STRING}可以获取查询字符串内容。也就是链接问号后面的内容 %{HTTP_HOST}获取域名,是一个服务器变量,可以获取访问的域名 ^(.*)$获取URL除去协议、域名和查询字符...
-
User-agent: * Disallow: / Allow: /complain/ Allow: /media_partners/ Allow: /about/ Allow: /user_agreement/ User-agent: ByteSpider Allow: / User-agent: ToutiaoSpider Allow: / 以上是今日头条的robots.txt,禁止所有搜索引擎收录,同时又...
-
Rewrite重写任务基本上都是由RewriteCond和RewriteRule两个命令配合完成。 RewriteBase /规定根目录为基准路径, RewriteCond规定重写的条件,如果条件成立,那么将会执行RewriteRule所规定的重写规则。...