URL规范化

作者:鼎极网络发布日期:2019-11-13浏览次数:41

  网址规范化指的是搜索引擎挑选合适的URL作为真正(规范化的)网址的过程。

  一、首先,为什么会出现不规范网址?

  如图所示:

  http://maxseo.cn

  http://www.maxseo.cn

  http://www.maxseo.cn/index.html

  http://maxseo.cn/index.html

  上面这几个URL指的是同一个文件:首页

  从技术上来说,这几个URL都是不同的网址,搜索引擎也确实把他当作不同的网址,虽然这些网址返回的都是相同的文件,也就是首页。但从技术上来说:主机完全可以对这几个网址返回不同的内容。那么,除了图上带与不带www造成的,以及结尾是否带有index.html后缀造成的不规范网址外,其实还有以下几种原因会造成。例如:

  ①:网站程序的原因,不少CMS系统经常出现一篇文章可以通过几种不同的URL去访问。

  ②:URL静态化设置存在错误,同一篇文章中有多个静态化URL可以访问。如图(截图URL和访问的标题):

  

1.png

  

2.png

  

3.png

  ③:URL静态化后,静态和动态URL共存,都有链接,也都可以访问。

  ④:网站的目录后带与不带斜杠。如图:

  下图为不同的网址,但其实是一个页面。

  http://www.baidu.com

  http://www.baidu.com/

  ⑤:加密网址。如图:

  下图的URL同时存在,但都可以访问。

  http://www.baidu.com

  https://www.baidu.com

  ⑥:URL中有端口号。如图:

  http://www.baidu.com80/

  http://www.baidu.com/

  ⑦:跟踪代码。有喜欢做网络推广的人,习惯在URL后面加跟踪代码。如图:

  http://www.baidu.com/?*100

  二:其次,出现网址不规范会给网站带来什么问题?

  网站出现多个不规范网址会给搜索引擎收录和排名带来很多的麻烦,为什么不规范的URL会给搜索引擎和排名带来很多麻烦?为了让站长彻底的明白,我们举个例子,比如:网站首页是固定的且只有一个,但很多站长在链接回首页的时候所使用的URL并不是的,而是一会连到http://www.esobao.cn,一会连到http://www.esobao.cn/index.html。

  一般来说,虽然不会给用户造成什么麻烦,但因为这些网址都是同一个文件,会间接性的给搜索引擎造成困惑,搜索引擎会认为:到底哪一个网址才是真正的首页?哪一个网址应该被当作首页返回?那么,这里有个重点:如果网站上不同版本的网址同时出现,就会很可能被搜索引擎收录。被收录之后,后果就可想而知了。而此时,搜索引擎在计算排名的时候必须要找到所谓规范化的网址,也就是搜索引擎认为的合适的URL版本。

  不规范化会造成的问题,笔者简单的来说下:

  ①: 网站上有多个URL,这样会分散页面权重,不利于排名。

  ②:搜索引擎判断的规范化网址并不是站长想要的那个网址。如图(站长想要的是不带后缀的,搜索引擎去把带后缀的给收录了):

  

4.png

  ③:如果网址规范化问题太严重,也可能影响收录。因为:一个权重不是很高的域名,能收录的总页面数和蜘蛛总爬行时间是有限的,而搜索引擎把资源花在收录不规范的网址上,留给独特内容的资源就变得越来越少了。

  ④:重复页面过多,搜索引擎可能认为有作弊嫌疑。

  ⑤:对于搜索引擎来说,浪费资源、浪费宽带。

  三、后,如何解决网址规范化的问题

  关于如何解决网址规范化问题,可能这个对于站长而言是重点也是核心内容了。那么,可以解决URL规范化问题的方法有很多,比如接下来我们要说的这些:

  ①:现在企业、个人站长用的程序多的就是CMS,那么此时你就要确定你使用的这个CMS系统是否只能产生规范化网址,无论是否有静态化,比如DEDE、帝国CMS等。

  ②:所有内链要保持统一,都指向规范化网址。比如:以带与不带www为例子,确定一个版本为规范化网址后,网站的内部链接都要统一使用这个版本,这样搜索引擎就会明白哪一个是站长希望的网站规范化网址。而从用户体验的角度去看:用户通常选择就是带www的版本为规范化网址。

  ③:301转向。这个常用也是普遍的一个方法,站长可以通过301转向把不规范化URL全部转向到规范化URL。

  ④:canonical标签。目前也是站长使用比较多的一种了,而且百度也是全面支持这个标签了。

  ⑤:制作XML地图,地图中全部使用规范化网址,然后提交给搜索引擎。

  虽然方法很多,但很多方法都有局限性,比如:有的网站因为技术的缺失或不成熟,导致301无法实现。再比如:很多CMS系统经常无法受自己控制等等。那么,笔者这里主要针对301和canonical做下具体的说明,因为这两种规范化方式是站长常用的手段,而且也是百度认同的。

关键词:

  关键词的选择步骤,如何选择网站的目标关键词?

  选择关键词:内容相关,搜索次数多,竞争小,不能太广泛(旅游),也不能太特殊(公司名称)找到平衡点

  搜索引擎下拉框,收录量(intitle:)(越多竞争越大),百度指数(Index.baidu.com),竞争对手网站的关键词,内页排名情况,百度推广位置

  本文将讲述选择关键词的具体步骤。此处提供的仅仅是一种方法,每个人完全可以根据自己的习惯和偏好发展出自己的有效的方法。

  1、列出大量相关关键词

  要找出合适的关键词,首先就要列出尽量多的相关的关键词,可以从几方面得到:

  1)了解所要优化的网站所在的行业,运用你的常识,如果你自己是用户,会用什么词。

  2)问周围的亲戚朋友同学等,他们会用什么关键词来搜索。

  3)去同行业竞争者的网站,看一下前二三十名的网站,他们都在标题标签里放了哪些关键词。

  4)搜索引擎本身也会提供相关信息。在你搜索一个关键词的时候,很多搜索引擎会在底部列出”相关搜索”或写着”搜索了ABC这个词的人,也搜索了DEF”等等,这些都是可以扩展关键词的地方。

  5)关键词研究工具也会列出扩展的关键词。

  6)有不少线上工具会提供你近义词,错拼词等等,这种工具一般以英文为多。

  2、研究这些关键词的竞争程度

  经过步以后,你应该已经有了一大串备选关键词,通常应该至少有几十个,可能上百上千。

  然后就要看这些关键词的竞争程度如何,比如你希望找到竞争比较小,同时搜索次数比较多(热门)的关键词,这样效能就比较高。

  有两个指标可以看关键词的竞争程度。

  一是各个搜索引擎都会在搜索结果右上角列出某个关键词返回的总相关网页数。这个数字大致反映了与这个关键词相关的网页数,而这些网页都是你的竞争对手。

  另外一个可以判断关键词竞争程度的是这个关键词要出现在竞价排名广告情况。

  研究这些关键词被搜索的次数

  关键词的竞争程度是一方面,另外一个很重要的方面是这些关键词是否真的被用户搜索?搜索的次数是多少?当然被搜索的越多越好。

  雅虎的PPC查询工具列出了某个关键词被搜索的具体次数,在百度和搜狐的查询工具里虽然没有列出具体次数,但有列出被搜索次数在零至一百或一百至两百等不同的区段,也大致可以判断某个关键词被真正搜索的情况。

  3、选择关键词

  答案很明显,就是选择效能高的两到三个关键词作为你主页的目标关键词。剩下其他的相关关键词别扔掉,还会有其他用途。

  不过有的时候也可能不选择效能高的关键词,比如说你所在行业的宽泛的关键词,虽然由于竞争厉害所以效能比较低,但是你有时间,有预算,并且有野心想瞄准这个关键词,那也不妨一试。