网站内部优化

作者:鼎极网络发布日期:2019-11-13浏览次数:3

  页面优化

  网站的页面优化,也即网页优化是对网页的程序、内容、版块、布局等多方面的优化调整,使其适合搜索引擎检索,满足搜索引擎排名的指标,从而在搜索引擎检索中获得的排名提升,增强搜索引擎营销的效果使网站的产品相关的关键词能有好的排位。使网站更容易被搜索引擎收录,提高用户体验和转化率进而创造价值。下面主要从网站代码、标签、正文等几个方面来讲述网站的页面优化。

  网站重构

  网站重构可以使网站的维护成本变得,运行得,遵循HTML结构化标准的设计,将网站页面的实际内容与它们呈现的格式相分离。简单来说,就是将所有的字体、样式等表现形式都写成DIV+CSS的方式,CSS放在单独文件里,Javascript也放在单独文件,HTML里面只有文字内容。凡是可以使用外部文件调用的,就使用外部文件调用,可以不出现的,尽量不出现,在正文中,全部以文字为主,不要出现CSS代码。

  这样做的好处是,HTML文件的代码被精简,文件变小,搜索引擎在索引网站页面时,可以地索引和识别网站的内容信息,并能准确抓取页面正文的内容。

  Meta标签优化

  对于Meta标签,主要有title、description、keywords三个地方,其余的meta标签不加也没事。就重要性而言,title在页面优化中占据很重要的位置。

  title标题标签告诉用户和搜索引擎一个特定网页的主题是什么。<title>标签通常放在HTML文档的<head>标签内。理想情况下,应该为网站的每一个网页创建的title页面标题。

  关于title的写作,title标签应该准确描述网页的内容,使用简短的,但具描述性的标题标签——短的标题同样可以包含丰富的信息。如果标题太长,搜索引擎只会在搜索结果里显示其部分内容。尽量不要堆积太多关键词,如果是长标题,可以包含关键词1-2次,而且关键词不用靠的太近。

  description描述标签提供了关于这个网页的总括性描述,网页的标题可能是由一些单词和短语组成的,而网页的描述元标签则常常是由一两个语句或段落组成的。如果网页摘要里的某个词语恰好出现在用户的查询里,那么这个词语将被高亮显 示,如果描述标签写的好,可以提升页面的点击率。

  关于description的写作,description标签准确概括该网页的内容,每一个网页应该创建各不相同的描述标签,避免所有的网页或很多网页使用千篇一律的description标签。

  keywords关键词标签,对于页面优化来说,重要性已经大不如前,甚至有种说法是,keywords标签已经没用了,不过,就算搜索引擎已经不将keywords考虑进,写一下keywords标签可能还会有些作用,不过keywords里面不要堆砌太多关键字,否则可能适得其反,写上4、5个核心关键字即可。

  Heading标签优化

  Heading标签(H标签)通常用来为用户呈现网页的结构。HTML语言里一共有六种大小的H标签,从重要的<H1>到<H6>,权重依次降低。常用的包括H1、H2标签,H1代表着大标题,H2是小标题。按照这个意思,重要的关键词设置在H1标签中,和关键词相关的词组再放到H2标签中,依次往后推。

  由于H标签通常会使某些文字比普通的文字大,对于用户来说,这样可以便于他们更直观地看出这些文字的重要性,多种渐变大小的H标签可以为网站的内容创建分层结构,从而使用户更容易地浏览网站。

  对于网页内容页面的优化来讲,应该适度的使用H标签,从一般页面的写作来讲,文章的标题,就应该出现在H1标签中,小标题就出现在H2标签上。

  Alt优化

  图片的优化对于网站页面来说也非常重要,所有的图片都拥有一个Alt属性,对于图片的优化主要是针对这个属性的优化,优化图片的alt属性可以使得图片搜索引擎能地理解图片。

  由于搜索引擎读取图片的困难,所以在一般的写作中,需要对添加的图片,进行ALT标签注释。当然对于图片的理解,周围的文字也起到一定的作用,当图片因为一些原因不能够显示的时候,系统会显示alt属性指定的文字。

  Alt属性的编写,应该使用简短但是描述性很强的alt文本,当图片作为链接使用时,一定要提供alt文本,这会大大有助于搜索引擎地理解它链向的那个页面。

  链接锚文本优化

  锚文本是链接上可以被点击的文字,它通常被放在锚标记A标签中间,锚文本主要作用是描述链接页面的一些情况,锚文本写得越好,用户浏览网站就越容易,搜索引擎也能更容易地理解链接到的页面内容。

  锚文本的正确写法是,使用简短的描述性文字,避免使用与目标页面主题无关的文字,避免用一个长句子或是一篇短文来实现的过长的锚文本,

  关键词优化

  关键词的布局,重要的几个位置是开头,特别是段开头的50-150个字,需要包含一次关键词,然后中间正文中,出现2-3次关键词或者近义词,文章的结尾,也包含一次关键词就可以了。

  在关键词的布局中,还有一个概念是,关键词密度。关键词密度(Keyword Density)也叫关键词频率(Keyword Frequency),它是用来量度关键词在网页上出现的总次数与其他文字的比例,一般用百分比表示。相对于页面总字数而言,关键词出现的频率越高,那么关键词密度也就越大。简单地举个例子,如果某个网页共有100个字符,而关键词本身是两个字符并在其中出现5次,则可以说关键词密度为10%。通常认为,页面的关键词密度应该保持在2%到8%之间。

  许多搜索引擎都将关键字密度作为其排名算法考虑因素之一,每个搜索引擎都有一套关于关键字密度的不同的数学公式。合理的关键字密度可使你获得较高的排名位置,密度过大,起到相反的效果。

  关键字密度有时候会影响到关键词的排名,不建议采取一些极端的方法来提高关键字密度。合理的目标关键字密度可以通过关注一些长尾关键字来进行优化。长尾关键词(Long Tail Keyword)是指网站上非目标关键词但也可以带来搜索流量的关键词。长尾关键词的特征是比较长,往往是2-3个词组成,甚至是短语。通过长尾关键词挖掘工具可以找到不少长尾关键词,将这些词组织到文章里,就可以做到既不提高关键词密度,又能提升关键词在页面的权重。

  在正文里,要围绕关键词自然地写作,千万不要生硬地将需要优化的关键词直接插到文章中。文章中,尽量使用关键词的近义词、同义词。

  内容优化

  一、坚持更新文章,丰富网站内容,抢占更多关键词

  坚持更新的重要性体现在两个方面,以门户网站为例,门户网站推广排名好的秘诀正是新鲜、高质量的内容更新。不断 添加的新鲜内容,使得门户站有大量页面被搜索引擎收录,有机会抢占更多关键词;内容的高质量,又使得这些内容不断在 站外被引用,提升了网站的权重。企业站在这点上应向门户站看齐,为网站注入更多新鲜、高质量的内容,坚持更新以积累 权重,抢占排名。

  网络营销企业站的常规栏目企业新闻、产品介绍、企业简介等只触及与公司有关的内容,涉及的关键词非常有限。建议 企业网站可视其特点建立独立的资讯栏目。

  只面向少数人群提供产品或服务的企业:比如工业机械的生产商、律师事务所等,这类企业站可考虑建立百科、问答、 专家讲堂等资讯栏目,在保持网站推广更新的同时还要注意文章的质量,权威性的文章更有机会在站外被引用。

  二、建设企业新闻栏目,导入首页权重

  不能独立建设资讯栏目的企业站,建议可将更新的重点放在企业新闻这一块。相比上策,中策的更新量要少得多,站点 收录量少的多,关键词排名的效果相应也要差上一大截。

  三、有SEO意识的内容团队:能够围绕关键词,长期稳定的为网站推广企业站提供高质量、原创的内容;

  强有力的技术支持:能够按照优化团队的要求,适时的为企业站建设新的内容平台。

  新闻内容有意识的围绕关键词来组织:这需要撰写新闻内容的网络营销企业人员先接受SEO内容建设的培训,在写作时 有意识的考虑到关键词布局。

  文章优化技巧

  1.关键词密度。在 搜索该关键词时返回的搜索结果排名中,这样的排名算法很快就被众多站长所利用,这个很好理解。 早期的时候,搜索引擎认为关键词在文章中出现的词频越高,在某一文章中出现大量与之无关的关键词,该文章页面与这个 关键词的相关性就越大。于是,这是题外话。从而“骗取”该关键词的排名。关键词堆砌的黑帽网站优化手法就此诞生,关 键词密度就是某一关键词在通篇文章中出现的次数百分比,该文章页面也将获得的排名。

  关键词密度的正确理解:首页文章内容围绕关键词进行阐述撰写,目标关键字在文章中自然分布,不堆砌,不刻意,不 影响阅读,关键词密度建议值为2%≦密度≦8%(数值仅供参考)。

  2.文章头尾出现关键词。

  通常情况下,特别是用关键词作为开头,文章的开头是搜索引擎蜘蛛先读取的内容,所以这一部分相对来说权重略微 高一些。文章末尾出现目标关键词也是公认的一种提高文章相关度的方法。在正文前50到100字内出现关键词,如此能有效 的优化文章与之的相关性。此外,可能是出于绝大部分传统文章都会在结尾部分对整篇文章进行总结的缘故,即使是刻意在 文章开头出现关键词也要秉着自然出现的原则。

  3.关键词形式变换。

  文章的时候可以适当的融入 关键词的变化形式也不失为一种优化文章关键词的方法。网站优化文章时出现关键词并不是 所有关键词都非要以目标关键词的形式出现,通常还会为了使语句更为通顺而采用其他的关键词形式。写通常关键词变化的 形式包括同义词、近义词、对同一件事物不同说法的词等等。

  4.关键词拆分。

  尽量使被拆分的词 中间间隔的文字数减少。也可以视作是关键词形势变换的一种。这个方法适用于关键词组,就拿关键 词“优化文章”来说,除了以该形式出现之外,当然,关键词以拆分的形式出现时还是要尽可能的被拆分关键词的临近 度,还可以拆分成“网站优化某一篇文章”的形式出现。

  结构优化

  网站结构优化的作用

  1、利于用户体验,网站结构合理优化后,代码简单,访问速度很快;有效导航的设置,让用户快寻觅到目标页面,这样的网站结构足以征服大多数用户。

  2、利于网页收录,网站结构合理优化后整个网站的层次实现规范化,低层次的网站页面对搜索引擎友好,收录效果也。

  3、网站权重传递,网站结构合理优化后网站的内链系统衔接更为恰当,伴随着收录的增加,网站权重可以实现空前平衡和稳步增长,进而提升网站流量。

  我们在做网站结构相关SEO工作时,都应该考虑以下问题:

  1,Baiduspider能不能找到所有网页

  2,Baiduspider是否知道哪个网页是重要的

  3,Baiduspider能否顺利提取网页内容

  4,Baiduspider能否在网页中提炼有用信息

  网站结构分为:物理结构、逻辑结构

  物理结构:扁平式物理结构和树形物理结构。合理的利用的这两种结构有利于权重的传递

  扁平式物理结构:所有网页都存放在网站根目录下,友好,但是只适合小型的企业站

  如下:

  http://www.(XXX).com/index.html

  http://www.(XXX).com/wenzhang1.html

  http://www.(XXX).com/wenzhang2.html

  http://www.(XXX).com/wenzhang3.html

  树形物理结构:对规模大一些的网站,往往需要二到三层甚至更多层级子目录才能网页的正常存储。

  如下:

  http://www.(XXX).com/index.html

  http://www.(XXX).com/lanmu1/

  http://www.(XXX).com/lanmu1/wenzhang1.html

  网站的逻辑结构也叫做链接结构,主要是指由网页内部链接所形成的逻辑结构。逻辑结构和物理结构的区别在于,逻辑结构由网站页面的相互链接关系决定,而物理结构则由网站页面的物理存放位置决定。

  在网站的逻辑结构中,通常采用“链接深度”来描述页面之间的逻辑关系。“链接深度”指从源页面到达目标页面所经过的路径数量,比如某网站的网页A中,存在一个指向目标页面B的链接,则从页面A到页面B的链接深度就是1。

  与物理结构类似,网站的逻辑结构同样可以分为扁平式和树形两种:

  扁平式逻辑结构:扁平式逻辑结构的网站,实际上就是网站中任意两个页面之间都可以相互链接,也就是说,网站中任意一个页面都包含其他所有页面的链接,网页之间的链接深度都是1。

  现状的网络上,很少有单纯采用扁平式逻辑结构作为整站结构的网站。

  什么样的网站结构好

  一个好的网站结构有利于网站收录,那么什么样的网站结构利于SEO呢?

  一、目录与目录之间要有互联。每个目录的内容页面要以锚文本来互联。

  二、如果网站上新的内容好开一个新的二级目录。注意目录内容的有序分类是很重要的。

  三、对于单目录(都在根目录下)的网站,也要考虑目录的内容分类。比如,内容管理系统CMS,每个内容都细心的分类。这里每个内容页面可以互联起来,因为结构一致,内容也比较相近。

  四、不同目录的内容页面,如果说其目录的结构差很多,比如bbs结构和blog结构,那么他们之间的内容尽量不要互联,而是让他们独立分开。

  五、不同目录的内容页面如果内容差很多,也让他们独立隔开,不要过多的互串。

  做seo大家都知道网站结构分为网站的树形结构和扁平树形结构,那么哪个网站结构呢?

  那么我们要分开来看,是更利于seo还是更方便管理?

  1、从seo的角度来看 我们都知道一个网站的内页层次月浅越容易获得首页传递的权重,扁平的树形结构相对于标准的树形结构层次更浅一些,所以内页更容易获得首页的权重,这样内页会更有利于排名。

  2、从方便管理来看 我们都知道一些大型网站页面可能有几十万个,那么做成扁平的树形结构显然不利于网站页面的管理,而去建立清晰的目录结构更适合大型网站。 从以上两点来看,如果我们要做大型网站并且要做的长久的话建议使用标准的树形结构,如果是小站想更快速的从搜索引擎获得流量的话,那么我们建议树形结构可以更扁平一些,这样也更利于蜘蛛对网站的抓取)。

  3、尽量使用CSS+DIV来做网站,这个代码更简洁明了。也利于蜘蛛的抓取。

  网站结构优化的注意事项!

  一、导航优化

  清晰的导航系统是网站设计的重要目标,对网站信息架构、用户体验影响重大。

  1、站在用户角度,网站导航系统需要解决两个问题。

  (1)我在哪里?用户可能从任何一个内页进入网站,有时候从首页进入,点击多个连接后,用户也已经忘了是怎么来到当前页面的。导航系统就要清楚地告诉用户处在网站总体结构的哪一个部分。

  (2)下一步要去哪里?有时候用户知道自己想做什么,页面的导航设计要告诉用户点击哪里才能完成他的目标。

  2、站在SEO的角度,网站导航系统应该注意以下几点。

  (1)导航文字 尽量使用普通的HTML文字导航,不要使用图片作为导航链接,更不要使用JavaScript生成导航系统,也不要用Flash做导航。CSS可以设计出很好的视觉效果。普通的文字链接对搜索引擎来说是阻力小的爬行抓取通道。

  (2)点击距离及扁平化 良好导航的目标之一是使所有页面与首页点击距离越近越好。

  (3)锚文本包含关键词 导航系统中的链接通常是分类页面获得内部链接的主要来源,数量巨大,其锚文本对目标页面相关性有相当大的影响,因此分类名称应尽量使用目标关键词。

  (4)面包屑导航 面包屑导航对用户和搜索引擎来说,是判断页面在网站整个结构中的位置的好方法。

  (5)避免页脚堆积,近年来,搜索引擎比较反感页脚堆积富含关键词的分类页面链接的倾向。

  二、目录的优化

  网站目录层级不要超过三层是对搜索引擎友好的。

  三、网站URL优化

  网站URL中不要包含中文以及除了&? =符号之外的特殊符号,URL越短越好,URL标准化处理(301重定向技术实现),静态化URL优于动态URL,URL用全拼或者英文好,也方便记忆。

  四、网站地图

  网站中放上网站地图,以免有抓取不到的页面,地图有利于蜘蛛爬取到各个页面。谷歌喜欢的是xml地图,百度喜欢的是html地图。

  网站结构设计和布局的实施

  良好的网站结构不仅有利于蜘蛛的抓取和索引网站页面文件,而且对于关键字排名来说有很大的影响。

  1、网站代码和文件:尽量使用div+css代码,尽可能的不使用蜘蛛无法识别的图片和js代码,其次样式文件通过调用,减少页面文件的大小。

  2、建立良好的网站导航结构:搜索引擎蜘蛛是从左至右从上至下依次进行抓取的,导航链接放在网站底部便于蜘蛛抓取,确定好网站首页导航的关键字,并根据网站权重设置好关键字的位置。使用文字导航,一级栏目不要过多,栏目层次不超过3层。

  3、网站结构层次:层次越深内页权重越低,权重越低越不利于收录和排名。首页权重高,栏目页次之,内容页再次之。

  4、目录页不要和首页去抢词,不同页面关键词不一样,每个页面关键词部署不超过3个,且关键字之间尽量相关。网站内容丰富,控制好关键字的位置和密度。

  5、网站链接:使用面包屑路径:且每个链接都包含关键字。其次每个页面都有链回主页面和栏目页的链接,每个页面之间好有一到两个深入链接,所有锚文本尽量采用地址。

  6、锚文本:做站内锚文本时,锚文本链接在文章内,比独立出现效果好,其次要注意锚文本的多样性;做站外锚文本时,保持外链锚文本要保持稳定增长,其次做外链要注意主题相关性和ip地址丰富。

  网页结构优化之页面重要区域分布规律

  搜索引擎对页面中每个区域的重视程度是不一样的,同样的内容出现在页面中不同的区域,所起的作用也会存在很大的差别,这就涉及页面重要区域的分布规律问题。

  例如,关键词“网站优化”出现在页面的顶部或者低部,所起的作用就是完全不一样的。这里我们将分别从页面而已及HTML源代码两个角度分析页面重要区域的分布规律。

  一、页面而已

  从用户体验的角度出发,普通用户在浏览页面时是自上而下、自左而右地进行的。因此,页面中各区域的重要性关系是:左上>右上>左>右>左下>右下。

  二、HTML源代码

  搜索引擎分析网页时,在HTML源代码中是自上而下地进行的。因此搜索引擎更加重视接近页面顶部的代码。

  正常情况下,HTML源代码自上而下对应页面中“左上-右上-左-右-左下-右下”的内容。这里与上面所讲的页面重要区域分布规律“左上>右上>左>右>左下>右下”是相吻合的。


关键词:

  网页质量是一个网页满足用户需求能力的衡量,是搜索引擎确定结果排序的重要依据。在网页资源内容与用户需求有相关性的基础上,内容是否完整、页面是否美观、对用户是否友好、来源是否权威专业等因素,共同决定着网页质量的高低。

  对于搜索引擎来说,给用户呈现的网页质量直接影响了终的搜索效果和用户的需求满足;而对于广大的站长来说,整体网页质量的提高有助于在搜索引擎中获得良好的排序和展现,从而吸引更多用户,获得更多流量。

  百度搜索综合用户对不同网页的实际感受,制定了一套评判网页质量的标准,基于这个标准,在百度搜索的收录、排序、展现环境进行调整,给高质量的网页更多的收录、展现机会,同时对一些影响用户体验、欺骗搜索引擎的恶劣低质网页进行打压。

  目前互联网上的网页,仅有7%可以达到高质量标准,百度作为大的中文搜索引擎,希望从互联网生态角度出发,跟站长们一起努力建立良好的互联网生态圈,地为网民服务,也让内容优质的网站得到的发展。

  此外,搜索引擎之前相对封闭,一直以来,站长需要通过不断的摸索发现搜索引擎对网页的判断标准,指导站点内容的建设。此次推出《网页质量白皮书》,目的是开放百度在网页质量方面的判断标准,给站长提供参考,希望有更多、质的内容产生,满足搜索引擎用户的需求,同时为站长带来流量,实现共赢。

  衡量网页质量的维度

  百度搜索引擎在衡量网页质量时,会从以下三个维度综合考虑给出一个质量打分。下面会一一介绍这些影响网页质量判断的维度特征:

  • 内容质量

  • 浏览体验

  • 可访问性

  一个访问流畅,内容质量高且浏览体验好的网页具有较高的质量;反之,任何一个维度出现问题,都会影响网页的整体质量。下面我们具体介绍下这三个维度。

  衡量网页质量的维度——内容质量

  网页主体内容是网页的价值所在,是满足用户需求的前提基础。百度搜索引擎评价网页内容质量主要看其主体内容的好坏,以及主体内容是否可以让用户满意。 不同类型网页的主体内容不同,百度搜索引擎判断不同网页的内容价值时,需要关注的点也有区别,如:

  • 首页:导航链接和内容是否清晰、有效。

  • 文章页:能否提供清晰完整的内容,图文并茂。

  • 商品页:是否提供了完整真实的商品信息和有效的购买入口。

  • 问答页:是否提供了有参考价值的答案。

  • 下载页:是否提供下载入口,是否有权限限制,资源是否有效。

  • 文档页:是否可供用户阅读,是否有权限限制。

  • 搜索结果页:搜索出来的结果是否与标题相关。

  百度搜索引擎考量网页内容质量的维度非常多,为重要的是:成本;内容完整;信息真实有效以及安全。下面我们通过举例来感受一下百度搜索引擎是如何对网页的内容质量进行分类的,请站长对比自己站点的页面,站在搜索引擎和用户的角度为自己打分:

  1、内容质量好:

  百度搜索引擎认为内容质量好的网页,花费了较多时间和精力编辑,倾注了编者的经验和专业知识;内容清晰、完整且丰富;资源有效且优质;信息真实有效;安全无毒;不含任何作弊行为和意图,对用户有较强的正收益。对这部分网页,百度搜索引擎会提高其展现在用户面前的机率。例如:

  • 专业医疗机构发布的内容丰富的医疗专题页面;

  • 工程师发布的完整解决某个技术问题的专业文章;

  • 专业视频网站上,播放清晰流畅的正版电影或影视全集页面;

  • 知名B2C网站上,一个完整有效的商品购买页;

  • 权威新闻站原创或经过编辑整理的热点新闻报道;

  • 经过网友认真编辑,内容丰富的词条;

  • 问答网站内,回答的内容可以完美解决提问者的问题。

  实例参考:

示例内容质量说明
case 3.1.1-1专业医疗网站发布的丰富医疗专题页面
case 3.1.1-2工程师发布的完整解决某个技术问题的专业文章
case 3.1.1-3专业视频网站上,播放清晰流畅的正版影视全集页面
case 3.1.1-4京东的一个完整有效的商品购买页
case 3.1.1-5权威新闻站原创的热点新闻的报道
case 3.1.1-6经过网友认真编辑,内容丰富的百科词条
case3.1.1-7百度知道上,完美解决用户问题的问答页

  2、内容质量中:

  内容质量中等的网页往往能满足用户需求,但未花费较多时间和精力进行制作编辑,不能体现出编者的经验和专业知识;内容完整但并不丰富;资源有效但质量欠佳;信息虽真实有效但属采集得来;安全无毒;不含作弊行为和意图。在互联网中,中等质量网页其实是一个比较大的数量集合,种类面貌也繁杂多样,百度搜索引擎在评价这类网页时往往还要考虑其它非常多因素。在这里,我们仅部分举例来让各位感受一下:

  • 论坛类网站里一个普通的帖子;

  • 一个普通的问答网页;

  • 没有进行任何编辑,直接转载其它网站的新闻;

  • 无版权信息的普通电影播放页

  • 采集知名小说网站的盗版小说页。

  实例参考:

示例内容质量说明
case 3.1.2-1网易直接转载了中国新闻网的一篇新闻。
case 3.1.2-2文库上网友上传的“国庆放假安排”新闻
case 3.1.2-3采集起点小说网的盗版小说站
case 3.1.2-4百度贴吧里一个普通的帖子

  3、内容质量差:

  百度搜索引擎认为主体内容信息量较少,或无有效信息、信息失效过期的都属于内容质量差网页,对用户没有什么实质性的帮助,应该减少其展现的机会。同时,如果一个网站内该类网页的占比过大,也会影响百度搜索引擎对站点的评级,尤其是UGC网站、电商网站、黄页网站要尤其重视对过期、失效网页的管理。例如:

  • 已下架的商品页,或已过期的团购页;

  • 已过有效期的招聘、交易页面;

  • 资源已失效,如视频已删除、软件下载后无法使用等。

  4、没有内容质量可言:

  没有内容质量可言的网页指那些制作成本很低,粗制滥造;从别处采集来的内容未经起码的编辑整理即放置线上;挂木马等病毒;含有作弊行为或意图;完全不能满足用户需求,甚至含有欺骗内容的网页。例如:

  • 内容空短,有很少量的内容,却不能支撑页面的主要意图;

  • 问答页有问无答,或回答完全不能解决问题;

  • 站内搜索结果页,但没有给出相关信息

  除上述网页外,欺骗用户和搜索引擎的网页在无内容质量可言集合里占很高比例。百度搜索引擎对作弊网页的定义是:不以满足用户需求为目的,通过不正当手段欺骗用户和搜索引擎从而获利的网页。目前互联网上这部分网页还属少数,但作弊网页的价值是负向的,对用户的伤害非常大,对这类网页,搜索引擎持坚决打击态度。

  衡量网页质量的维度——浏览体验

  不同质量的网页带给用户的浏览体验会有很大差距,一个优质的网页给用户的浏览体验应该是正向的。用户希望看到干净、易阅读的网页,排版混乱、广告过多会影响用户对网页主体内容的获取。在百度搜索引擎网页质量体系中,用户对网页主体内容的获取成本与浏览体验呈反比,即获取成本越高,浏览体验越低。面对内容质量相近的网页,浏览体验佳者更容易获得的排位,而对于浏览体验差的网页,百度搜索引擎会视情况降低其展现的机率甚至拒绝收录。

  影响用户浏览体验好坏的因素很多,目前百度搜索引擎主要从内容排版、广告影响两方面对网页进行考量:

  内容排版:用户进入网页眼看到的就是内容排版,排版决定了用户对网页的印象,也决定了用户对内容获取的成本。

  广告影响:百度搜索引擎理解网站的生存发展需要资金支持,对网页上放置正当广告持支持态度。网页应该以满足用户需求为主旨,佳状态即“主体内容与广告一起满足用户需求,内容为主,广告为辅”,而不应让广告成为网页主体。

  下面我们通过举例来感受一下百度搜索引擎是如何对网页的浏览体验进行分类的,站长可以据此对比检验自己站点的浏览体验如何:

  1、浏览体验好:

  页面布局合理,用户获取主体内容成本低,一般具有以下特征:

  • 排版合理,版式美观,易于阅读和浏览;

  • 用户需要的内容占据网页重要位置;

  • 能够通过页面标签或页面布局十分清楚地区分出哪些是广告;

  • 广告不抢占主体内容位置,不阻碍用户对主要内容的获取;

  实例参考:

示例浏览体验说明
case 3.2.1-1招聘、房产等网站首页也有很多广告,但都是招聘相关的,浏览体验是ok的。
case 3.2.1-2文章页,页面布局合理,无广告,排版好,结构合理
case 3.2.1-3游戏首页,排版美观,布局合理,无广告,浏览体验优

  2、浏览体验差:

  页面布局和广告放置影响了用户对主体内容的获取,提高了用户获取信息的成本,令用户反感。包括但不仅限于以下情况:

  • 正文内容不换行或不分段,用户阅读困难;

  • 字体和背景颜色相近,内容辨别困难;

  • 页面布局不合理,网页首屏看不到任何有价值的主体内容;

  • 广告遮挡主体内容;或者在通用分辨率下,首屏都是广告,看不到主体内容;

  • 弹窗广告过多;

  • 影响阅读的浮动广告过多

  • 点击链接时,出现预期之外的弹窗;

  • 广告与内容混淆,不易区分;

  衡量网页质量的维度——可访问性

  用户希望快速地从搜索引擎获取到需要的信息,百度搜索引擎尽可能为用户提供能一次性直接获取所有信息的网页结果。百度搜索引擎认为不能直接获取到主体内容的网页对用户是不友好的,会视情况调整其展现机率。

  百度搜索引擎会从正常打开、权限限制、有效性三方面判断网页的可访问性,对于可以正常访问的网页,可以参与正常排序;对于有权限限制的网页,再通过其它维度对其进行观察;对于失效网页,会降权其展现机制甚至从数据库中删除。

  1、可正常访问的网页

  无权限限制,能直接访问所有主体内容的网页。

  2、有权限限制的网页

  此类网页分为两种:打开权限和资源获取权限

  1)打开权限:指打开网页都需要登录权限,没有权限完全无法看到具体内容,普通用户无法获取或获取成本很高,百度搜索引擎会降低其展现机率。不包括以登录为主要功能的网页。

  2)资源获取权限:指获取网页主要内容,如文档、软件、视频等,需要权限或者需要安装插件才能获得完整内容。此时会分三种情况:

  • 提供优质、正版内容的网站,由于内容建设成本很高,尽管查看全文或下载时需要权限或安装插件,但属于用户预期之内,百度搜索引擎也不认为权限行为对用户造成伤害,给予与正常可访问页面相同的对待。

  • 对于一些非优质、非正版的资源,来自于用户转载甚至机器采集,本身成本较低,内容也不独特,用户获取资源还有权限限制——需要用户注册登录或者付费查看,百度搜索引擎会根据具体情况决定是否调整其展现。

  • 还有一些视频、下载资源页,也许自身资源质量并不差,但需要安装非常冷门的插件才能正常访问,比如要求安装“xx大片播放器”,百度搜索引擎会怀疑其有恶意倾向。

  实例参考:

示例可访问性说明
case 3.2-1CNKI上的一篇论文,收费才能下载,但有版权,浏览体验好
case 3.2-2优酷上一部新电影,需要付费才能观看,浏览体验好。
case 3.2-3内容是copy来,但是需要登录才能看更多
case 3.2-4入党申请书,本身就是转载的,网上到处都是,但这个页面仍然要求收费才能下载。

  3、失效网页

  往往指死链和主体资源失效的网页。百度搜索引擎认为这部分网页无法提供有价值信息,如果站点中此类网页过多,也会影响百度搜索引擎对其的收录和评级。建议站长对此类网页进行相应设置,并及时登录百度站长平台,使用死链提交工具告知百度搜索引擎。

  失效网页包括但不仅限于:

  • 404、403、503等网页;

  • 程序代码报错网页;

  • 打开后提示内容被删除,或因内容已不存在跳转到首页的网页;

  • 被删除内容的论坛帖子,被删除的视频页面(多出现在UGC站点)

  互联网网页资源现状

  CNNIC2014年年初发布的《中国互联网络发展状况统计报告》中称:截至2013年12月,中国网页数据为1500亿,相比2012年同期增长了22.2%。2013年中国单个网站的平均网页数和单个网页的平均字节数均维持增长,显示出中国互联网上的内容更为丰富:平均网站的网页数达到4.69万个,较去年同期增长2.3%。

  为了搜索质量、提高用户使用满意度,百度搜索引擎每周都会进行网页质量抽样评估。然而从近一年的评估数据中我们发现,优质网页的数量非常少,且几乎没有增长;普通网页的占比在下降,相应的,质差网页的比例却有明显上涨。截至2014年5月,统计数据显示,在百度网页搜索发现的海量网页中,优质网页仅占7.4%,质差网页高达21%,其余普通网页为71.6%。

  百度网页搜索通过一系列筛选、识别、分析、赋权等工作,努力将更多优质网页呈现在用户面前,每天约打击上万质量差网站,涉及网页达百万量级,尽可能减少质量差网页给用户带来的干扰。从下图2014年5月的网页展现分析数据显示,目前展现在用户面前的网页质量分布中,优质网页占比为40%,质量差网页降为11%——虽然这个变化已经非常明显,但百度网页搜索还是希望能和广大站长一起努力,将质量差占比降到。  




互联网全部网页


在百度搜索得到展现的网页

优质网页


7.40%


41%

普通网页