URL规范化

作者:鼎极网络发布日期:2019-11-13浏览次数:14

  网址规范化指的是搜索引擎挑选合适的URL作为真正(规范化的)网址的过程。

  一、首先,为什么会出现不规范网址?

  如图所示:

  http://maxseo.cn

  http://www.maxseo.cn

  http://www.maxseo.cn/index.html

  http://maxseo.cn/index.html

  上面这几个URL指的是同一个文件:首页

  从技术上来说,这几个URL都是不同的网址,搜索引擎也确实把他当作不同的网址,虽然这些网址返回的都是相同的文件,也就是首页。但从技术上来说:主机完全可以对这几个网址返回不同的内容。那么,除了图上带与不带www造成的,以及结尾是否带有index.html后缀造成的不规范网址外,其实还有以下几种原因会造成。例如:

  ①:网站程序的原因,不少CMS系统经常出现一篇文章可以通过几种不同的URL去访问。

  ②:URL静态化设置存在错误,同一篇文章中有多个静态化URL可以访问。如图(截图URL和访问的标题):

  

1.png

  

2.png

  

3.png

  ③:URL静态化后,静态和动态URL共存,都有链接,也都可以访问。

  ④:网站的目录后带与不带斜杠。如图:

  下图为不同的网址,但其实是一个页面。

  http://www.baidu.com

  http://www.baidu.com/

  ⑤:加密网址。如图:

  下图的URL同时存在,但都可以访问。

  http://www.baidu.com

  https://www.baidu.com

  ⑥:URL中有端口号。如图:

  http://www.baidu.com80/

  http://www.baidu.com/

  ⑦:跟踪代码。有喜欢做网络推广的人,习惯在URL后面加跟踪代码。如图:

  http://www.baidu.com/?*100

  二:其次,出现网址不规范会给网站带来什么问题?

  网站出现多个不规范网址会给搜索引擎收录和排名带来很多的麻烦,为什么不规范的URL会给搜索引擎和排名带来很多麻烦?为了让站长彻底的明白,我们举个例子,比如:网站首页是固定的且只有一个,但很多站长在链接回首页的时候所使用的URL并不是的,而是一会连到http://www.esobao.cn,一会连到http://www.esobao.cn/index.html。

  一般来说,虽然不会给用户造成什么麻烦,但因为这些网址都是同一个文件,会间接性的给搜索引擎造成困惑,搜索引擎会认为:到底哪一个网址才是真正的首页?哪一个网址应该被当作首页返回?那么,这里有个重点:如果网站上不同版本的网址同时出现,就会很可能被搜索引擎收录。被收录之后,后果就可想而知了。而此时,搜索引擎在计算排名的时候必须要找到所谓规范化的网址,也就是搜索引擎认为的合适的URL版本。

  不规范化会造成的问题,笔者简单的来说下:

  ①: 网站上有多个URL,这样会分散页面权重,不利于排名。

  ②:搜索引擎判断的规范化网址并不是站长想要的那个网址。如图(站长想要的是不带后缀的,搜索引擎去把带后缀的给收录了):

  

4.png

  ③:如果网址规范化问题太严重,也可能影响收录。因为:一个权重不是很高的域名,能收录的总页面数和蜘蛛总爬行时间是有限的,而搜索引擎把资源花在收录不规范的网址上,留给独特内容的资源就变得越来越少了。

  ④:重复页面过多,搜索引擎可能认为有作弊嫌疑。

  ⑤:对于搜索引擎来说,浪费资源、浪费宽带。

  三、后,如何解决网址规范化的问题

  关于如何解决网址规范化问题,可能这个对于站长而言是重点也是核心内容了。那么,可以解决URL规范化问题的方法有很多,比如接下来我们要说的这些:

  ①:现在企业、个人站长用的程序多的就是CMS,那么此时你就要确定你使用的这个CMS系统是否只能产生规范化网址,无论是否有静态化,比如DEDE、帝国CMS等。

  ②:所有内链要保持统一,都指向规范化网址。比如:以带与不带www为例子,确定一个版本为规范化网址后,网站的内部链接都要统一使用这个版本,这样搜索引擎就会明白哪一个是站长希望的网站规范化网址。而从用户体验的角度去看:用户通常选择就是带www的版本为规范化网址。

  ③:301转向。这个常用也是普遍的一个方法,站长可以通过301转向把不规范化URL全部转向到规范化URL。

  ④:canonical标签。目前也是站长使用比较多的一种了,而且百度也是全面支持这个标签了。

  ⑤:制作XML地图,地图中全部使用规范化网址,然后提交给搜索引擎。

  虽然方法很多,但很多方法都有局限性,比如:有的网站因为技术的缺失或不成熟,导致301无法实现。再比如:很多CMS系统经常无法受自己控制等等。那么,笔者这里主要针对301和canonical做下具体的说明,因为这两种规范化方式是站长常用的手段,而且也是百度认同的。

关键词:

  随着近之年网络技术的发展,seo的概念、属性、技术等等,可以说都发生了很大的变化。他不在仅仅局限于在代码、内容和链接上了,随着这种优化方式的在网络普及化的今天其重要性在逐步下降,越来越多具备基础SEO技术的网民不断的改良自己的网站,这其中也丰富发展了seo技术,其算法种类也不断上升,开始偏向搜索体验和用户口碑的方向在走。

  1、SEO的术语解释

  SEO在2000-2011年之间都是针对于主流搜索引擎友好度的一种网站站内外技术与内容的优化。通过接近搜索引擎算法的一种手段,所以称之为Search Engine Optimization (搜索引擎优化)。

  而从2011 – 2014年开始,搜索引擎优化不只局限在代码、内容和链接上了,因为这种优化方式的重要性在逐年下降,更多具备基础SEO技术改良的网站逐年上升。因此算法开始偏向搜索体验和用户口碑的方向在走,所以SEO如今更应该理解为Search Experience Optimization (搜索体验优化)

  2、SEO优化的属性

  不同营销都有自己的属性,如今的SEO也从之前大家都知晓的概念慢慢在转变,产品本身的属性也在发生微妙的变化。我们来看一下对比:

  【当下的SEO与以往的SEO有何不同】

  (1)以往的SEO入门和实施成本是比较低的,只要有意识的公司都可以在网上做SEO,效果相对也出现比较快,所以成为一种基础配备的营销手段。而当前SEO优化是一种豪华设施了,它的效果不是用则既有,而是需要公司投入更多的资源和时间,配备更多技术人员、公关人员、市场人员和内容营销人员,而大部分小公司无法做到团队的完整性。

  (2)以往SEO基本上都是推崇长期有效的概念,所以投资回报率比较高。而当前SEO不能再简单说是个长期效果的了,因为大家更注重是多久能出效果,长与不长已不是一个核心角色。所以SEO成为了中期出效的营销方法,若你的项目寻求短期出效的话,SEO并不合适。

  (3)这是大家很多年都在说的一个概念:SEO是免费流量。其实不然,所谓的免费只是基于流量入口是不是付了门票,但是别忘了去这个景点你在路上所要投入的路费和住宿费。所以当今,更建议大家把其成为回报流量,只要投入更多时间和资金才能获得回报的,并不是真正意义上的免费流量。

  (4)以往SEO都是经验当道,算法只是大家对于操作中的一种规律而不是一种公开化的规则。而如今这种规律一直在变较难定述,简单粗暴的一招鲜手法已经不存在了,取而代之的是更加勤勤恳恳的细活多工的实操。谁做的更多更细,工种越广,所能产生的效果合力就越强!

  3、SEO的优化金字塔

  当下的SEO与以往的SEO有何不同:

  当今SEO是贯穿、具有一定的连续性,并不是彰显独立的一个时代;无论你给它带上任何什么标签,它都不会脱离过去,废弃现在。所以原先三大块网站结构代码+关键词优化+链接广泛度是舍弃不了的。只是在于其基础上更要切实地贯穿用户体验融入+社媒力量宣导,从而使整个SEO体验和用户口碑给做上去。总结来说就是:打好底子的基础上+让内容和产品说话,前者是和搜索引擎做朋友,后者是迎合正真的用户。

  【以前的做法】 :

  以前做内容都是在网上随便找两篇相关的文章更新,在标题加入关键词,文章里面加几个关键词锚文本指向首页;外链也是随随便便的找几篇文章,然后在文章底部放一个网址;基本上没有什么技术活。

  【现在的做法】 :

  我们需要从建设网站前就把一些详细的东西规划好,比如做网站前:选择关键词(关键词要确定那些是主关键词的、哪个是品牌词、那些是长尾词都是需要我们一一的分析出来;然后再分析关键词是不是具有发展做的可能;确定好了,通过用户需求分析;用户想了解的是什么;然后做出一一的记录,也可以通过实际的市场来分析用户的需要)、规划好网站草图(分析出用户一些习惯)。

  总结一句话来说,即是如今的竞赛了,当一个职业有更多人参加时,天然加重了一个职业的竞赛度。

  几年前,去做一个对于“网上赚钱”的关键字,记得其时用的是zblog的程序,每天写一两篇文章,顺便发几个外链,半年的时刻,博客的流量就已经有600多IP/天,。而如今,想做一个日IP600的博客,是多么的不容易,这600IP都要从搜索引擎获取,就更显得难上加难了。但是我们做seo的朋友们永运把用户体验放在位,那么搜索引擎市场再怎么变化也不会偏离用户体验的,必须做到用户喜欢的,那么我们才可以长久不衰。