网站内链优化

作者:鼎极网络发布日期:2019-11-13浏览次数:5

  内链优化

  1、 内链分配:内链的分配是在我们整合关键词的时候就要定好的,把主要关键词、目标关键词、长尾关键词、以及文章里面将要出现的相关的关键词都要统计出来,统计数量,然后按照网站关键词的主次来相应的做好链接分配。

  2、 内链布置:内链布置的多少根据栏目页面和内容页面的发展方向来布置,把宣传的重点分清楚,然后根据关键词的数量来分配链接,这样才能体现出来我们网站内部的链接数目和链接的层次关系。

  3、 内链相关:网站如果想逐步的扩展网页面和增加页面的收录,应该考虑和页面相关的信息的原创和编写,这样和网页内容相关的链接可以互相辅助,从而带动主要链接的权重。

  内链,顾名思义就是在同一网站域名下的内容页面之间的互相链接(自己网站的内容链接到自己网站的内部页面,也称之为站内链接)。合理的网站内链接构造,能提高搜索引擎的收录与网站权重。相对外部链接,内部链接也很重要。

  

1.png

  

2.png

  网站的结构

  树形结构与扁平结构的结合

  主页链接向所有的栏目主页

  主页一般不直接链接向内容页,除非是你非常想推的几个特殊的页

  所有栏目主页都连向其他栏目主页

  栏目主页都连回网站主页

  栏目主页同时连向属于自己本栏目的内容页

  栏目主页一般不连向属于其他栏目的内容页

  所有内容页都连向网站主页

  所有内容页都连向自己的上一级栏目主页

  内容页可以连向同一个栏目的其他内容页

  内容页一般不连向其他栏目的内容页

  内容页在某些情况下,可以用适当的关键词连向其他栏目的内容页

  一、介绍

  1、同一页面下相同关键词不要出现不同的链接。

  2、同一页面下相同链接不要出现不同关键词。

  3、同一页面需求关键词链接可根据页面文字以及质量形成比例。

  4、同一页面下关键词链接不要超过5个,同时包括核心关键词以及性信息内容、文章标题链接。

  5、网站下核心关键词占有首页一级链接在80%,信息索引页可以占有20%。

  6、网站多个核心关键词以时间段进行网站优化内部链接。

  7、专题栏目下以栏目主要关键词为链接关键词。

  8、页面出现核心关键词以首页为链接,栏目关键词以栏目地址链接,长尾关键词以相关性高路径链接。

  9、网站页面链接与整体内部链接数量多少及比例需要根据网站在搜索引擎中的权重实际情况进行。这点比较难掌握,如果没掌握好的话网站很容易降权。

  二、作用

  控制成本

  你直接就可以在自己的站上进行部署,不像外部链接的不可控性比较大,需要长期的积累才有办法实现稳定的SEO效果。

  

3.png

  有助于提高搜索引擎对网站的爬行索引效率,有利于网站的收录。一个页面要被收录,首先要能够被搜索引擎的蜘蛛爬行到,蜘蛛的爬行轨迹是顺着一个链接到另一个链接,想让搜索引擎蜘蛛地爬行,一般都需要通过反向链接来引导,但是内页的爬行就需要良好的内部链接了,如果不注意形成死链断链,蜘蛛就无从爬起,也就谈不上良好收录了。

  推动排名

  良好的网站内部链接策略能推动网站的排名。在搜索引擎面前,一个链接就代表一张投票,外部链接就是网站之间的互相投票,而内部链接则代表了网站内的各页面互相投票。通过大量而适度的内部链接来支持某一个具体页面,有助于该内容页主题的集中,促使搜索引擎识别出哪些页面在你的网站中是重要的,进而推动该页面的排名。因此在搜索引擎优化的过程中,网站当中哪些网页参与了主要关键词的排名竞争,我们一般就会采取重点突出主要关键词的内部链接,从而使该主题中的核心关键词在搜索引擎中有排名优势。

  提升流量

  

5.png

  内部链接可以提高用户体验度,增加PV,提升访问量。表现为相关文章,热门文章,新文章等的内部链接很容易提高用户的访问体验,部署的内部链接越多,页面被点击的机会就越大,PV的增加越显而易见。这些相关文章的内部链接不能滥用,应该尽量链接到相似主题的文章,否则就谈不上提升用户的体验度了。

  三、提升权重

  1、做好网站导航

  认为首先做好网站导航很重要,可以帮助访客很快找到所关注的部分,好的导航一定要简洁易懂,不要用图片,因为这样有时可能会误导访客,大一些大点的站,除做好主导航以外还可以做些副导航及面包屑导航,可以的提高用户体验提升网络推广的效果,提高网站权重。

  2、增加内链深度

  站长们在做网站推广时为了快速看到效果,经常把好多外链相互链接起来,用链轮的方式去提升权重,同样内链也需要相互链接,访客浏览完一个页面时也要有链接进入下一个页面,避免客户进入死胡同,这也就是大家经常会看到网站内页的底部一般都会有相关文章、下一篇、上一篇这样按钮的原因了,这样可以增加链接深度,加强内页之间的权重传递,从而可以从整体去提高内链建设。

  3、锚文本使用

  锚文本提升网站权重作用毋庸置疑,但大家在做关键词锚文本时也要有个度,一般在网站的页面次出现关键词时做上锚文本就可以了,稍后出现的不用打就行了,这样做出来的关键词锚文本就可以提升权重了。提醒大家,一般来说关键词锚文本出现的次数1-3次就可以了。还有一点经常被大家忽略的就是底部关键词到首页,这种方法大家都用过,就是在页面增加一个首页指定关键词,当然效果没有锚文本那么直接,可总比没有好些,做站有时比的就是细心程度。

  4、网站地图

  想要让蜘蛛在你的站停留更多的时间就要让站变的更有吸引力,这时就需要建一份网站地图,好是htm和xml都有的那种,因为百度蜘蛛不可能一层层爬过你的站,如果你的网站内容没有足够的吸引力,蜘蛛也没有足够的耐心去挨着爬,所以有了地图蜘蛛就可以在网站多停留些时间,提高网站的收录量,这样做推广才会有效,好的方法事半功倍,如果没有好办法就踏踏实实的按常规办法做。

  四、优化标准

  首先,一个好的内部链接网站往往体现在搜索引擎的收录量上。一个网站的收录量如果稳定并且持续增加,则意味着至少这个网站的内部链接处理得较为到位。

  其次,如果网站有好的整体结构,整个网站的PR传递应该是很均匀的,首页高,栏目页次之,内容页再次。如果你有意识地通过内部链接策略推动某些重要页面,那么是可以通过网页的链接影响PR的,当这些页面的PR值和重要性升高的时候,也就意味着你对内部链接的优化是成功的。

  后就是权重值升高,访客的跳出率降低,用户体验度增高。

  五、优化技巧

  内链优化的方法和原则有很多种,下面介绍一些对大多数网站都适用的方法。

  (1)给网站做Logo加上链接,检查网站的Logo是否带有指向首页的链接。

  (2)如果链接是图片,则检查图片有没有配上正确的alt标签。

  (3)充分利用导航、底部区域、版权信息等位置增加内链。

  (4)网站导航链接是搜索引擎蜘蛛向下爬行的重要线路,也是网站频道之间互通的桥梁,建议使用文字链接。避免使用嵌入Javascript文件的方式实现网站导航。如果想使用图片作为网站导航链接,则需增加alt,另外在图片下搭配一个文字链接作为辅助。

  (5)在文章内容中增加内链。文章内部的关键词是个大面积种植内链的地方,但是不要给一个关键词重复加上链接,一次就好,两次勉强,配合strong、h和em等标签来使用,切忌过多。好使用关键字插件,在整个网站之中进行频道链接的循环建设,并且利用大量长尾链接回首页。

  (6)链接到相似题目的文章可以帮助读者发现他们感兴趣的内容。同样,这也可以增加文章的内容链接。也可以在一篇文章的下面手动添加相关文章。

  (7)在FAQ页(常见问答页面)中,列出能被文章回答的常见问题。在内容中使用读者搜索问题时喜欢使用的关键词,这样可以提高搜索排名,同时也可在内容中使用链接指向文章。

  (8)每个文章都用2~3个TAG,用tag来增加内链让页面互通,并且要把TAG设为静态的!

  (9)少使用或者尽量不使用javascript文件链接,虽然javascript文件在页面中很容易被调用,但对搜索引擎并不友好。

  (10)首页上加热门tag和热门搜索关键字,提高用户体验的同时构建了良好的内链。

  (11)可以将一些主要频道的RSS订阅放到首页以加快收录。

  (12)频道页面要有近更新文章、该频道热门文章以及随机调用文章。

  (13)做一个热门页面,将网站所有重要的页面和搜索引擎流量较大的几个页面放进去,并好让其出现在首页,保持热门页面的权重。

  (14)减少页面层次链接。搜索引擎蜘蛛抓取网站页面时,对网站的层次深入并没有要求和限制,但合理的层次页面,更有利于蜘蛛抓取,对搜索引擎优化更加友好。

  (15)链接应该出现在尽量靠近的位置。搜索蜘蛛抓取页面时都是按从上往下的顺序抓取网站内容,内容越重要,与网站关键词越接近的页面越应该排在网站靠前的位置,这样更方便蜘蛛抓取。除了这些方法之外,应根据网站自身的特点设计具体的操作方法,比如对于新浪来说,其新闻页有SEO优势,那么在新闻的页面中添加链接就是一个不错的选择。

  (16)内链的巧妙指向。一般在我的网站里,每篇文章句话都会出现中电这个词,有时候是很多次出现,为什么要这么做呢,因为网站首页调用的都是文章得段,这样才能保持首页的关键词密度。而且在多次出现关键词的时候,你会发现其指向就并不都是首页了,部分是流向了栏目页面,具体原因上面已经分析过了。

  (17)在网站的通栏版权的地方,一定要做上关键词链接,这一点非常重要,还要做上网站地图,这样会更加利于蜘蛛爬行!

  六、注意事项

  1、尊重用户的体验,注意链接的相关性,内部链接不要太过与泛滥。相关性高的链接有助于提高搜索引擎收录,并且有助于提升用户体验,增加用户的黏性,进而提升网站的浏览量。如果一篇文章出现了50次SEO这个关键词,你总不能每次都给加上内部链接吧?这样只会让读者反感。正文当中相同的一个关键词出现很多次,只需要做一到三次链接就可以。

  2、内部链接一定要URL的性。特别是动态网站静态化处理过的,只能保留一个链接。链接到具体的页面都只能有一个链接,不能链接次数多了,很容易导致搜索引擎无法判断那个是正确的链接页面,进而将之归入重复页面,从而无法获得任何权重。

  3、内部链接要注意防止死链和断链。内部链接的速度同样是衡量网站可靠性的一个重要参数,一个好的空间或一台好的服务器很重要。

  4、 每个页面的内部链接数量要有控制。如果页面中的内部链接数量超过限制,搜索引擎就可能会忽略该页面,或者忽略该页面中超出限制的那部分链接所指向的目标页面。一般来说,一个页面的内部链接数要限制在100个以内。


关键词:

  搜索引擎抓取系统概述()

  编者按:站长朋友们,今后定期都将在这里跟大家分享一些有关搜索引擎工作原理及网站运营相关的内容,今天先简单介绍一下关于搜索引擎抓取系统中有关抓取系统基本框架、抓取中涉及的网络协议、抓取的基本过程三部分。

  互联网信息爆发式增长,如何有效的获取并利用这些信息是搜索引擎工作中的首要环节。数据抓取系统作为整个搜索系统中的上游,主要负责互联网信息的搜集、保存、更新环节,它像蜘蛛一样在网络间爬来爬去,因此通常会被叫做“spider”。例如我们常用的几家通用搜索引擎蜘蛛被叫做:BaiduspdierGooglebotSogou Web Spider等。

  Spider抓取系统是搜索引擎数据来源的重要,如果把web理解为一个有向图,那么spider的工作过程可以认为是对这个有向图的遍历。从一些重要的种子 URL开始,通过页面上的超链接关系,不断的发现新URL并抓取,尽大可能抓取到更多的有价值网页。对于类似百度这样的大型spider系统,因为每时 每刻都存在网页被修改、删除或出现新的超链接的可能,因此,还要对spider过去抓取过的页面保持更新,维护一个URL库和页面库。

  1spider抓取系统的基本框架

  如下为spider抓取系统的基本框架图,其中包括链接存储系统、链接选取系统、dns解析服务系统、抓取调度系统、网页分析系统、链接提取系统、链接分析系统、网页存储系统。

1.png

  2spider抓取过程中涉及的网络协议

  搜索引擎与资源提供者之间存在相互依赖的关系,其中搜索引擎需要站长为其提供资源,否则搜索引擎就无法满足用户检索需求;而站长需要通过搜索引擎将自己的 内容推广出去获取更多的受众。spider抓取系统直接涉及互联网资源提供者的利益,为了使搜素引擎与站长能够达到双赢,在抓取过程中双方必须遵守一定的 规范,以便于双方的数据处理及对接。这种过程中遵守的规范也就是日常中我们所说的一些网络协议。以下简单列举:

  http协议:超文本传输协议,是互联网上应用为广泛的一种网络协议,客户端和服务器端请求和应答的标准。客户端一般情况是指终端用户,服务器端即指网 站。终端用户通过浏览器、蜘蛛等向服务器指定端口发送http请求。发送http请求会返回对应的httpheader信息,可以看到包括是否成功、服务 器类型、网页近更新时间等内容。

  https协议:实际是加密版http,一种更加安全的数据传输协议。

  UA属性:UAuser-agent,是http协议中的一个属性,代表了终端的身份,向服务器端表明我是谁来干嘛,进而服务器端可以根据不同的身份来做出不同的反馈结果。

  robots协议:robots.txt是搜索引擎访问一个网站时要访问的个文件,用以来确定哪些是被允许抓取的哪些是被禁止抓取的。 robots.txt必须放在网站根目录下,且文件名要小写。详细的robots.txt写法可参考 http://www.robotstxt.org 。百度严格按照robots协议执行,另外,同样支持网页内容中添加的名为robotsmeta标 签,indexfollownofollow等指令。

  3spider抓取的基本过程

  spider的基本抓取过程可以理解为如下的流程图:

2.png

  4.spider抓取过程中的策略

  spider在抓取过程中面对着复杂的网络环境,为了使系统可以抓取到尽可能多的有价值资源并保持系统及实际环境中页面的一致性同时不给网站体验造成压力,会设计多种复杂的抓取策略。以下简单介绍一下抓取过程中涉及到的主要策略类型:

  1、抓取友好性:抓取压力调配降低对网站的访问压力

  2、常用抓取返回码示意

  3、多种url重定向的识别

  4、抓取优先级调配

  5、重复url的过滤

  6、暗网数据的获取

  7、抓取反作弊

  8、提高抓取效率,高效利用带宽

  1、抓取友好性

  互联网资源庞大的数量级,这就要求抓取系统尽可能的高效利用带宽,在有限的硬件和带宽资源下尽可能多的抓取到有价值资源。这就造成了另一个问题,耗费被抓网站的带宽造成访问压力,如果程度过大将直接影响被抓网站的正常用户访问行为。因此,在抓取过程中就要进行一定的抓取压力控制,达到既不影响网站的正常用户访问又能尽量多的抓取到有价值资源的目的。

  通常情况下,基本的是基于ip的压力控制。这是因为如果基于域名,可能存在一 个域名对多个ip(很多大网站)或多个域名对应同一个ip(小网站共享ip)的问题。实际中,往往根据ip及域名的多种条件进行压力调配控制。同时,站长平台也推出了压力反馈工具,站长可以人工调配对自己网站的抓取压力,这时百度spider将优先按照站长的要求进行抓取压力控制。

  对同一个站点的抓取速度控制一般分为两类:其一,一段时间内的抓取频率;其二,一段时间内的抓取流量。同一站点不同的时间抓取速度也会不同,例如夜深人静月黑风高时候抓取的可能就会快一些,也视具体站点类型而定,主要思想是错开正常用户访问高峰,不断的调整。对于不同站点,也需要不同的抓取速度。

  2、常用抓取返回码示意

  简单介绍几种百度支持的返回码:

  1) 常见的404代表“NOT FOUND”,认为网页已经失效,通常将在库中删除,同时短期内如果spider再次发现这条url也不会抓取;

  2) 503代表“Service Unavailable”,认为网页临时不可访问,通常网站临时关闭,带宽有限等会产生这种情况。对于网页返回503状态码,百度spider不会把这条url直接删除,同时短期内将会反复访问几次,如果网页已恢复,则正常抓取;如果继续返回503,那么这条url仍会被认为是失效链接,从库中删除。

  3) 403代表“Forbidden”,认为网页目前禁止访问。如果是新urlspider暂时不抓取,短期内同样会反复访问几次;如果是已收录url,不会直接删除,短期内同样反复访问几次。如果网页正常访问,则正常抓取;如果仍然禁止访问,那么这条url也会被认为是失效链接,从库中删除。

  4)301 代表是“Moved Permanently”,认为网页重定向至新url。当遇到站点迁移、域名更换、站点改版的情况时,我们使用301返回码,同时使用站长平台网站改版工具,以减少改版对网站流量造成的损失。

  3、多种url重定向的识别

  互联网中一部分网页因为各种各样的原因存在url重定向状态,为了对这部分资源正常抓取,就要求spiderurl重定向进行识别判断,同时防止作弊行为。重定向可分为三类:http 30x重定向、meta refresh重定向和js重定向。另外,百度也支持Canonical标签,在效果上可以认为也是一种间接的重定向。

  4、抓取优先级调配

  由于互联网资源规模的巨大以及迅速的变化,对于搜索引擎来说全部抓取到并合理的更新保持一致性几乎是不可能的事情,因此这就要求抓取系统设计一套合理的抓取优先级调配策略。主要包括:深度优先遍历策略、宽度优先遍历策略、pr优先策略、反链策略、社会化分享指导策略等等。每个策略各有优劣,在实际情况中往往是多种策略结合使用以达到优的抓取效果。

  5、重复url的过滤

  spider在抓取过程中需要判断一个页面是否已经抓取过了,如果还没有抓取再进行抓取网页的行为并放在已抓取网址集合中。判断是否已经抓取其中涉及到核心的是快速查找并对比,同时涉及到url归一化识别,例如一个url中包含大量无效参数而实际是同一个页面,这将视为同一个url来对待。

  6、暗网数据的获取

  互联网中存在着大量的搜索引擎暂时无法抓取到的数据,被称为暗网数据。一方面,很多网站的大量数据是存在于网络数据库中,spider难以采用抓取网页的方式获得完整内容;另一方面,由于网络环境、网站本身不符合规范、孤岛等等问题,也会造成搜索引擎无法抓取。目前来说,对于暗网数据的获取主要思路仍然是通过开放平台采用数据提交的方式来解决,例如百度站长平台”“百度开放平台等等。

  7、抓取反作弊

  spider在抓取过程中往往会遇到所谓抓取黑洞或者面临大量低质量页面的困扰,这就要求抓取系统中同样需要设计一套完善的抓取反作弊系统。例如分析url特征、分析页面大小及内容、分析站点规模对应抓取规模等等。