如何给文章伪原创

作者:鼎极网络发布日期:2019-11-12浏览次数:11

  如何给文章伪原创

  原创文章

  写作技巧

  软文写作现今已经成为站长必须掌握的技能之一,一篇的软文可以获得更多的效益。

  写好文章首先就要是自己有过亲身体验,这样的文章写出来才算的上是“干货”,有内容才容易引发他人的共鸣,写自己知道的、经历过的、平时工作过程中的一些发现、心得和经验。同时也要站在消费者的角度出发,去发现,理解他们所想的,所需要的,才能真正的吸引住客户。

  多看他人文章

  自己的经历总有被写完的,当黔驴技穷时不妨换个角度,多看他人的文章,分析文章中提出的一些观点或者方法,以及文章中提出的一些思路,不能只顾自己写,同时应当多看,在吸收经验之余给自己写作找到灵感的源泉。看他人的文章时也可以借鉴他人的文笔、写作思路,纳百家之长补己之短。

  多看行业新闻

  欲知天下事就必须多听多看,现代社会是一个资讯发达的社会,互联网又是社会发展的热点,每天都有日新月异的变化或者各种让人瞩目的事件,这一切都是写软文、写心得的好来源,通过关注行业内的焦点新闻、事件,写出自己的感受和评论。

  软文目的决定标题写法:拥有一些软文营销期间,才能发现软文内容的奇迹,尤其标题的写法是完全不同的,永远不要低估了网络用户的心理,传播目的是什么?对于不同目的的软文,其标题的写法也是完全不同的。

  软文的段要写好:终软文是需要永远寻找答案的,软文只是为了让用户继续游览段落,精准用户是什么?因为它是产生消费的欲望,软文从头到尾看完,有一种颠倒感觉,不过却又好像看到了想看的内容。

  软文要简洁、简洁再简洁!让网友只看一眼就能看到自己关心的、想要的内容。在这个信息爆炸的社会,简洁明了才能吸引到网友。

  软文要写的有吸引力,能把你的受众深深地打动或者是感动,让他们知道这篇软文是在帮助他们,而不是在做营销。

  软文的重要性

  (1)可以降低企业的广告成本

  往往一般的网络广告的成本是非常高的,比如百度竞价虽然比较精准,但是同行点击占据一部分广告费用,加大广告费用的耗损,硬性广告一般来说获得较好的流量,但是针对的用户群体不够精准,而且广告的费用很高。一篇或者一系列的软文的价格远远比竞价或者说硬性广告的费用低得多,而且一篇好的软文别人会免费帮助转载,扩大软文的传播范围,一篇好的软文会制造许多话题来引导别人讨论和对别人产生共鸣,让用户主动接受企业的信息。

  (2)可以辅助seo

  如果把软文发布到新闻源或者是权重比较高的网站上面,这样会有机会在上面留下链接来指向目标网站,这样可以提高网址的曝光率又可以提高高质量外链的数量,而且可以引导权重的传递。如果在文章中合理的嵌入相关的关键词,可以增加被别人搜到的机会。

  (3)可以提高和打造产品、品牌知名度

  企业品牌,需要使用软文提高知名度,是需要精心打造一篇好软文的强力打造,好的软文能够让读者不知不觉产生好的印象,让广大读者相信产品的知名度,知名度有了,产品品牌效果也就体现出来了。

  (4)提高网站流量

  一篇优质的好软文,可以为网站带来的流量是惊人的,而且软文所带来的流量的转化率往往都是比较高的,可以间接提高网站产品的销售量。

  这类不在对软文的编写做详细介绍,有兴趣的可以自己去学习;

  伪原创

  1概念

  所谓伪原创就是对一篇文章进行一定程度的修改。也指通过这种方法得到的文章。

  2方法

  修改标题是关键

  新闻软文标题其中有三点要把握好:

  1、标题看上去要有非常熟悉的简单的通俗的字眼;

  2、标题里要包含和读者利益相关的字眼;

  3、标题里要包含客户自己的产品关键字。

  标题

  一:标题要做到个性和有创意

  个性和创意能够激发人们内心的潜在诱惑,而且更加有吸引力,

  二:标题要有思想

  很多软文的标题都很空洞,这个标题往往给人们带来一种云山雾罩的感觉,不知道你想要说什么,表达什么,所以写标题也得有实物,有思想,有内涵,这样你的标题让人看一眼就知道你的文章将要表达什么,才会有进一步阅读的欲望,标题往往能够和热点关键词挂钩效果会!

  三:标题要传神生动

  标题实际上就是你文章的高度概括,是浓缩的精华,所以这个标题一定要生动传神才能够吸引人关注你的文章

  四:标题党不要做

  有时候真实的力量往往有感染力!

  标题的修改方法

  ① 数字替换法:比如标题:养颜排毒效果好-10大食盐美容功效,你可以进行适当的去除几个自己认为不是食盐美容功效的,或者增加一些食盐美容功效,都可以,至少你可以让搜索引擎至少认为你的标题就别树一帜;

  ② 词语替换法:顾名思义就是把词语的相关或者近义词替换一下,这样也可以达到换汤不换药的效果;

  ③ 文字排序法:可以通过打乱顺序让你的标题看起来更加的不一样。但是一定要记得不要误解了原标题的意思,即可。

  首尾段落总结

  一、标题与内容相关

  标题的修改,在于降低搜索引擎中的重复度,而非你修改过后,把原文的意思给面目全非,这样就失去了伪原创的初衷。不管标题如何进行修改,要忠于原文标题的本意;第二要加入更加符合浏览者需求的特色。只有这样,才会达到伪原创的效果。

  二、正文内容的修改

  1 首段总结法:给自己来写首段,就像引言的作用一样,如果你有精力,就看完全文做个总结,放在首段,如果觉得没时间看,那么也很简单:自己编,而且一定要融入自己网站的关键词;

  2 文中插入链接锚文本:想必大家都知道锚文本的作用,可以有助于提高相关的关键词排名,也可以他人采集你的资料的时候,把锚文本链接一并采集去,这样就相当于给你增加一条外链:你采集我,我就利用你,很公平的。 每200-300字之间,可以适当添加2-3个锚文本链接;

  3 尾部总结法:对整篇文章做个总结,其实对于搜索引擎优化,不仅仅是这些内容,但小的技巧上一定要注意,玩搜索引擎就是个细致活,所以不仅要会做,更要会思考,举一反三才能有快速的提高和进步;

  4 新增加图片:大家一定都会知道,一图胜千言的道理。虽然,大部分搜索引擎还不能够读取图片的内容,但是图片中的alt属性可以进行注释,也会给搜索引擎焕然一新的感觉,认为你的内容是新的而收录;

  5 段落替换法:这个方法就是把内容的顺序进行相互的交换,但是,一定要注意不要影响原文的阅读。尤其是一个操作方法,千万不可以使用,否则,你懂的。因此,此方法并不适应所有,逻辑性的文章切忌。

  6.段落复制替换法:相关的内容段落的直接复制粘贴,举例:假如我的第二段本是某篇文章的段,我为了收录的可能性提高,直接在其它页面复制了一段过来作为我的开篇,形成了我现在文章的这种内容格式。对于结尾,也可以进行类似的操作,或者,你自己直接写段总结等。当然,尾部的段落添加还有个更加简单的方式,如我在我的文章后加上版权信息等。

  7.关键词替换添加法:所谓关键词的替换和添加,除了是为了你的内容紧扣自己的关键词外,也是在一定的幅度上提升修改的服务和提供内容质量。具体如何操作,一般的都是在查找后,进行页面全部的替换,比如“seo”你可以用“seo网站优化”“网站优化”进行相关的替换工作。添加,也就是在文章某些内容里面进行相关的关键词添加。

  8.内容去除修改法:去掉一定内容,可以是段落,可是是某个段落里面的几个点,这个看你自己的尺度,就修改幅度而言,至少,全篇文章你修改幅度好保持在30%左右,当然,修改幅度越大,也就越受搜索引擎欢迎。

  3文章的寻找

  要写伪原创,步就是会找文章,比较好的找文章方法主要有:

  如何寻找文章:

  网站的内容来源大家都知道这是非常重要的,都知道好是相关性比较高的文章,那么如何寻找到这些高质量的文章呢?

  1、搜索引擎新闻(百度新闻搜索):按标题搜索时间排序,这样不仅文章相关,而且内容页很新,稍加修改就能收录。

  2、直接在搜索引擎上搜索:选择合适的新闻或者新闻源网站

  3、行业网站:每个行业机会都会有一个比较出名的行业网站,上面的行业资讯也都是有专门的编辑在维护,所以文章的质量是高的。

  4、竞争对手:竞争对手的网站新闻肯定是经过他精心寻找的,而且这种文章里也穿插了核心关键词的,所以这是非常好的资源。只要你把它复制到记事本里,里面的链接全部都被干掉了。接下来就是把那些词替换成你的链接!

  5、在知识问答分享平台找材料(百科等):许多时候,我们的网站文章,都是在陈述现象和解决问题。在百度知道、搜搜问问、新浪爱问这些问答平台,有许多人表达自己的见解,可以把答案搜集下来整理成一篇文章,把别人的想法综合形成自己的新想法,也做出一篇高质量的原创文。

  原创文章的寻找

  1、博客找原创文章;

  2、去英文站找原创文章;

  3、下载电子书;

  4、在报纸、书籍与杂志等找原创文章;

  5、去论文站找原创文章。

  6、未被搜索引擎收录的文章

  4级别

  等级.对文章标题进行修改,对段落或文字进行重排,加入文章的信息,丰富文章内容;

  第二等级.在的基础上加入本站的相关的信息,配以图片等。

  第三等级.收集整理文章

  第四等级.阅读思考总结后自己编写

  5作用

  我们知道,搜索引擎是喜欢原创性的内容,对于重复的内容,它会认为没有收录的价值。如果网站上大量的内容都是转载的,搜索引擎就会觉得整个网站没有多大的价值,从而降低网站权重。网站排名自然也不会很高。

  但是原创内容是比较有难度的,因此我们一般都是对转载的内容进行修改加工,使搜索引擎认为你的文章是原创的,从而会被收录。这样就达到了伪原创的目的。

  6建议

  1.如果你的网站是一个新站,当前网站的权重不高,如何让搜索引擎的蜘蛛首页找到你的网站页面并放入搜索引擎的数据库?其实有一个简单有效、省时省力的方法:充分利用网摘、百度收藏等工具,让百度蜘蛛更快的爬到你的页面上来。

  2.就是使用代码把网站加上自己的版权及内容页面的地址,别人采集的时候自动添加你的网站链接或者文章来源的具体链接地址,这样做收录虽然不会快,但后链接多了,你依然是原创内容。

  3.在自己的网站上发表“原创”文章,等到自己收录以后,再去其它的站点进行发表,同时加上自己的原文地址,这种办法很有效果,一些规模较大、影响较广的网站被采的机率很大,发到这些大的网站上,带来的流量非常可观。

  7技巧方法

  技巧

  文章的段和后一段都好是原创,才不会被搜索引擎认为是抄袭.但请注意,中间内容同样重要,一定要做整理,便于阅读.为了便于关键词排名而又不影响文章本身可读性的情况下,适量增加关键词次数对排名是有利的.(句必须包含相关关键词,,结尾同样. 一般一篇 400-500 字的文章,相关关键词出现3次左右)这样就会加大搜索引擎对你原创的认可度。

  方法

  1. 标题内容意思要和原标题相同,但是不要复制,必须含有关键词。标题中需要包含你的网站浏览者需要看到的因素,比如是做 QQ 站的,那么就应该在标题上凸显非主 流啊,QQ 空间之类的标题。 其实这一点对于很多人来说是废话,但也非常的重要,很多朋友为了真正的使搜索引擎认为自己的文章是原创,而将个标题改的面目全非,这样的结果不可取。

  2 修改标题是关键

  (1)词语替换法(必须保持可读性) 。同样也可以这样修改:“备战中考作文:小技巧让你的文章'亮'起来”这样在不删除文章内容的情况下 就可以让搜索引擎认为至少标题是原创的。 关键词的替换和位置的替换 我们在伪原创的时候肯定要对关键词进行修改,毕竟别人的文章是针对别人网站的主题来提炼的,虽 然有时候两个网站主题相同,也需要对关键词进行修改和替换,高度匹配和高度精准的关键词往往能抓住 更加精准的用户。不但要修改和替换关键词,连位置也要替换这样文章有你的思想,你的网站。

  (2)数字替换法。比如新浪教育的一篇文章,标题是:“备战中考作文:五招让你的文章”亮“起来”,在修改标题的时候, 就完全可以改成:“备战中考作文:三招让你的文章”亮“起来”取而代之的,就是将文章里不起眼或者你 看的不顺眼的两个特点删除即可。

  3.新内容新观点的添加。我们也可以对原文章添加新的内容和观点,这样让一篇文章更完整,观点更明确,主题更完善,伪原 创嘛,多加点内容不是坏事,可以大大的提高文章的可读性。对已经发布过的文章,搜索引擎已经抓取过 来会有记录,但是我们对伪原创做的够好的话,搜索引擎说不定会给的评价呢。 伪原创内容本来是一个不太成立的观点,毕竟经过修改过的文章也算是一篇新文章,只是这个“修改” 的度在哪里才使得“伪”这个观点得以名正言顺的。我建议大家多写文章,原创的要多写,伪原创也多改, 这样提高自己的文字表达能力之外,还能在写作中不断的提高自己。

  4、标签法:在特定的关键字后增加友情注释。 优点:增加用户体验,让客户可以 了解更多并不熟悉的专业名词,从而理解文章含义。 还可以 自然的重复关键字,增加关键字密度。 缺点:如果使用过多,会造成页面信息繁乱,降低用户体验。增加页面体积,降低加载速度。干扰原 有关键词布局和密度。

  5、拆分法:把原有连续的文章,平均的截取成为 2 段 3 段或是更多。 优点:降低 相似度、提高访问者浏览的速度、增加页面访问量 缺点:文章无法连续浏览,原有的一次性浏览变得繁琐,同时对 Title 标题的优化也有一定的不利, 因为会有重复。不过数量较小的情况下不会有什么大碍。

  6、规律性:如何让采集回来的文章尽快让搜索引擎收录呢?透过网站日志,我们可以看到蜘蛛爬行 次数在某个时间点上 都有一个高峰,根据论策的观察,在上升期添加文章,在到达顶峰之后,快照就会被 放出来。这样的高峰在 曲线上不止一个,我们添加文章的时候,好固定在某一个高峰前,这样,规律性 强,蜘蛛也会有规律的来抓取。 如果以上几种方法相互配合使用可以极大地降低页面相似度,提高页面在搜索引擎中的诚信度 按照以上方法,即使你伪原创,搜索引擎也会判定你是原创作品(这个就叫整合高明之处)。

  创新概念

  概述

  伪原创的意义在于对原文基础上的内容拓展和延伸。

  一篇文章随着时间的推移,它也会丧失时代的光彩,失去原来所具有的价值,在这个时候,我们就要对原文进行伪原创,把不适合时代需要的东西剔除掉,把现代的新观念增添上,一篇的创新型伪原创就这样诞生了。就如同一个原先用来装水的陶瓶,到了现代已经没有人使用了,那么你为它里面插上一束花,它就成了一个古色古香的花瓶,重新光彩照人。这就是创新型伪原创。


关键词:

  网页质量是一个网页满足用户需求能力的衡量,是搜索引擎确定结果排序的重要依据。在网页资源内容与用户需求有相关性的基础上,内容是否完整、页面是否美观、对用户是否友好、来源是否权威专业等因素,共同决定着网页质量的高低。

  对于搜索引擎来说,给用户呈现的网页质量直接影响了终的搜索效果和用户的需求满足;而对于广大的站长来说,整体网页质量的提高有助于在搜索引擎中获得良好的排序和展现,从而吸引更多用户,获得更多流量。

  百度搜索综合用户对不同网页的实际感受,制定了一套评判网页质量的标准,基于这个标准,在百度搜索的收录、排序、展现环境进行调整,给高质量的网页更多的收录、展现机会,同时对一些影响用户体验、欺骗搜索引擎的恶劣低质网页进行打压。

  目前互联网上的网页,仅有7%可以达到高质量标准,百度作为大的中文搜索引擎,希望从互联网生态角度出发,跟站长们一起努力建立良好的互联网生态圈,地为网民服务,也让内容优质的网站得到的发展。

  此外,搜索引擎之前相对封闭,一直以来,站长需要通过不断的摸索发现搜索引擎对网页的判断标准,指导站点内容的建设。此次推出《网页质量白皮书》,目的是开放百度在网页质量方面的判断标准,给站长提供参考,希望有更多、质的内容产生,满足搜索引擎用户的需求,同时为站长带来流量,实现共赢。

  衡量网页质量的维度

  百度搜索引擎在衡量网页质量时,会从以下三个维度综合考虑给出一个质量打分。下面会一一介绍这些影响网页质量判断的维度特征:

  • 内容质量

  • 浏览体验

  • 可访问性

  一个访问流畅,内容质量高且浏览体验好的网页具有较高的质量;反之,任何一个维度出现问题,都会影响网页的整体质量。下面我们具体介绍下这三个维度。

  衡量网页质量的维度——内容质量

  网页主体内容是网页的价值所在,是满足用户需求的前提基础。百度搜索引擎评价网页内容质量主要看其主体内容的好坏,以及主体内容是否可以让用户满意。 不同类型网页的主体内容不同,百度搜索引擎判断不同网页的内容价值时,需要关注的点也有区别,如:

  • 首页:导航链接和内容是否清晰、有效。

  • 文章页:能否提供清晰完整的内容,图文并茂。

  • 商品页:是否提供了完整真实的商品信息和有效的购买入口。

  • 问答页:是否提供了有参考价值的答案。

  • 下载页:是否提供下载入口,是否有权限限制,资源是否有效。

  • 文档页:是否可供用户阅读,是否有权限限制。

  • 搜索结果页:搜索出来的结果是否与标题相关。

  百度搜索引擎考量网页内容质量的维度非常多,为重要的是:成本;内容完整;信息真实有效以及安全。下面我们通过举例来感受一下百度搜索引擎是如何对网页的内容质量进行分类的,请站长对比自己站点的页面,站在搜索引擎和用户的角度为自己打分:

  1、内容质量好:

  百度搜索引擎认为内容质量好的网页,花费了较多时间和精力编辑,倾注了编者的经验和专业知识;内容清晰、完整且丰富;资源有效且优质;信息真实有效;安全无毒;不含任何作弊行为和意图,对用户有较强的正收益。对这部分网页,百度搜索引擎会提高其展现在用户面前的机率。例如:

  • 专业医疗机构发布的内容丰富的医疗专题页面;

  • 工程师发布的完整解决某个技术问题的专业文章;

  • 专业视频网站上,播放清晰流畅的正版电影或影视全集页面;

  • 知名B2C网站上,一个完整有效的商品购买页;

  • 权威新闻站原创或经过编辑整理的热点新闻报道;

  • 经过网友认真编辑,内容丰富的词条;

  • 问答网站内,回答的内容可以完美解决提问者的问题。

  实例参考:

示例内容质量说明
case 3.1.1-1专业医疗网站发布的丰富医疗专题页面
case 3.1.1-2工程师发布的完整解决某个技术问题的专业文章
case 3.1.1-3专业视频网站上,播放清晰流畅的正版影视全集页面
case 3.1.1-4京东的一个完整有效的商品购买页
case 3.1.1-5权威新闻站原创的热点新闻的报道
case 3.1.1-6经过网友认真编辑,内容丰富的百科词条
case3.1.1-7百度知道上,完美解决用户问题的问答页

  2、内容质量中:

  内容质量中等的网页往往能满足用户需求,但未花费较多时间和精力进行制作编辑,不能体现出编者的经验和专业知识;内容完整但并不丰富;资源有效但质量欠佳;信息虽真实有效但属采集得来;安全无毒;不含作弊行为和意图。在互联网中,中等质量网页其实是一个比较大的数量集合,种类面貌也繁杂多样,百度搜索引擎在评价这类网页时往往还要考虑其它非常多因素。在这里,我们仅部分举例来让各位感受一下:

  • 论坛类网站里一个普通的帖子;

  • 一个普通的问答网页;

  • 没有进行任何编辑,直接转载其它网站的新闻;

  • 无版权信息的普通电影播放页

  • 采集知名小说网站的盗版小说页。

  实例参考:

示例内容质量说明
case 3.1.2-1网易直接转载了中国新闻网的一篇新闻。
case 3.1.2-2文库上网友上传的“国庆放假安排”新闻
case 3.1.2-3采集起点小说网的盗版小说站
case 3.1.2-4百度贴吧里一个普通的帖子

  3、内容质量差:

  百度搜索引擎认为主体内容信息量较少,或无有效信息、信息失效过期的都属于内容质量差网页,对用户没有什么实质性的帮助,应该减少其展现的机会。同时,如果一个网站内该类网页的占比过大,也会影响百度搜索引擎对站点的评级,尤其是UGC网站、电商网站、黄页网站要尤其重视对过期、失效网页的管理。例如:

  • 已下架的商品页,或已过期的团购页;

  • 已过有效期的招聘、交易页面;

  • 资源已失效,如视频已删除、软件下载后无法使用等。

  4、没有内容质量可言:

  没有内容质量可言的网页指那些制作成本很低,粗制滥造;从别处采集来的内容未经起码的编辑整理即放置线上;挂木马等病毒;含有作弊行为或意图;完全不能满足用户需求,甚至含有欺骗内容的网页。例如:

  • 内容空短,有很少量的内容,却不能支撑页面的主要意图;

  • 问答页有问无答,或回答完全不能解决问题;

  • 站内搜索结果页,但没有给出相关信息

  除上述网页外,欺骗用户和搜索引擎的网页在无内容质量可言集合里占很高比例。百度搜索引擎对作弊网页的定义是:不以满足用户需求为目的,通过不正当手段欺骗用户和搜索引擎从而获利的网页。目前互联网上这部分网页还属少数,但作弊网页的价值是负向的,对用户的伤害非常大,对这类网页,搜索引擎持坚决打击态度。

  衡量网页质量的维度——浏览体验

  不同质量的网页带给用户的浏览体验会有很大差距,一个优质的网页给用户的浏览体验应该是正向的。用户希望看到干净、易阅读的网页,排版混乱、广告过多会影响用户对网页主体内容的获取。在百度搜索引擎网页质量体系中,用户对网页主体内容的获取成本与浏览体验呈反比,即获取成本越高,浏览体验越低。面对内容质量相近的网页,浏览体验佳者更容易获得的排位,而对于浏览体验差的网页,百度搜索引擎会视情况降低其展现的机率甚至拒绝收录。

  影响用户浏览体验好坏的因素很多,目前百度搜索引擎主要从内容排版、广告影响两方面对网页进行考量:

  内容排版:用户进入网页眼看到的就是内容排版,排版决定了用户对网页的印象,也决定了用户对内容获取的成本。

  广告影响:百度搜索引擎理解网站的生存发展需要资金支持,对网页上放置正当广告持支持态度。网页应该以满足用户需求为主旨,佳状态即“主体内容与广告一起满足用户需求,内容为主,广告为辅”,而不应让广告成为网页主体。

  下面我们通过举例来感受一下百度搜索引擎是如何对网页的浏览体验进行分类的,站长可以据此对比检验自己站点的浏览体验如何:

  1、浏览体验好:

  页面布局合理,用户获取主体内容成本低,一般具有以下特征:

  • 排版合理,版式美观,易于阅读和浏览;

  • 用户需要的内容占据网页重要位置;

  • 能够通过页面标签或页面布局十分清楚地区分出哪些是广告;

  • 广告不抢占主体内容位置,不阻碍用户对主要内容的获取;

  实例参考:

示例浏览体验说明
case 3.2.1-1招聘、房产等网站首页也有很多广告,但都是招聘相关的,浏览体验是ok的。
case 3.2.1-2文章页,页面布局合理,无广告,排版好,结构合理
case 3.2.1-3游戏首页,排版美观,布局合理,无广告,浏览体验优

  2、浏览体验差:

  页面布局和广告放置影响了用户对主体内容的获取,提高了用户获取信息的成本,令用户反感。包括但不仅限于以下情况:

  • 正文内容不换行或不分段,用户阅读困难;

  • 字体和背景颜色相近,内容辨别困难;

  • 页面布局不合理,网页首屏看不到任何有价值的主体内容;

  • 广告遮挡主体内容;或者在通用分辨率下,首屏都是广告,看不到主体内容;

  • 弹窗广告过多;

  • 影响阅读的浮动广告过多

  • 点击链接时,出现预期之外的弹窗;

  • 广告与内容混淆,不易区分;

  衡量网页质量的维度——可访问性

  用户希望快速地从搜索引擎获取到需要的信息,百度搜索引擎尽可能为用户提供能一次性直接获取所有信息的网页结果。百度搜索引擎认为不能直接获取到主体内容的网页对用户是不友好的,会视情况调整其展现机率。

  百度搜索引擎会从正常打开、权限限制、有效性三方面判断网页的可访问性,对于可以正常访问的网页,可以参与正常排序;对于有权限限制的网页,再通过其它维度对其进行观察;对于失效网页,会降权其展现机制甚至从数据库中删除。

  1、可正常访问的网页

  无权限限制,能直接访问所有主体内容的网页。

  2、有权限限制的网页

  此类网页分为两种:打开权限和资源获取权限

  1)打开权限:指打开网页都需要登录权限,没有权限完全无法看到具体内容,普通用户无法获取或获取成本很高,百度搜索引擎会降低其展现机率。不包括以登录为主要功能的网页。

  2)资源获取权限:指获取网页主要内容,如文档、软件、视频等,需要权限或者需要安装插件才能获得完整内容。此时会分三种情况:

  • 提供优质、正版内容的网站,由于内容建设成本很高,尽管查看全文或下载时需要权限或安装插件,但属于用户预期之内,百度搜索引擎也不认为权限行为对用户造成伤害,给予与正常可访问页面相同的对待。

  • 对于一些非优质、非正版的资源,来自于用户转载甚至机器采集,本身成本较低,内容也不独特,用户获取资源还有权限限制——需要用户注册登录或者付费查看,百度搜索引擎会根据具体情况决定是否调整其展现。

  • 还有一些视频、下载资源页,也许自身资源质量并不差,但需要安装非常冷门的插件才能正常访问,比如要求安装“xx大片播放器”,百度搜索引擎会怀疑其有恶意倾向。

  实例参考:

示例可访问性说明
case 3.2-1CNKI上的一篇论文,收费才能下载,但有版权,浏览体验好
case 3.2-2优酷上一部新电影,需要付费才能观看,浏览体验好。
case 3.2-3内容是copy来,但是需要登录才能看更多
case 3.2-4入党申请书,本身就是转载的,网上到处都是,但这个页面仍然要求收费才能下载。

  3、失效网页

  往往指死链和主体资源失效的网页。百度搜索引擎认为这部分网页无法提供有价值信息,如果站点中此类网页过多,也会影响百度搜索引擎对其的收录和评级。建议站长对此类网页进行相应设置,并及时登录百度站长平台,使用死链提交工具告知百度搜索引擎。

  失效网页包括但不仅限于:

  • 404、403、503等网页;

  • 程序代码报错网页;

  • 打开后提示内容被删除,或因内容已不存在跳转到首页的网页;

  • 被删除内容的论坛帖子,被删除的视频页面(多出现在UGC站点)

  互联网网页资源现状

  CNNIC2014年年初发布的《中国互联网络发展状况统计报告》中称:截至2013年12月,中国网页数据为1500亿,相比2012年同期增长了22.2%。2013年中国单个网站的平均网页数和单个网页的平均字节数均维持增长,显示出中国互联网上的内容更为丰富:平均网站的网页数达到4.69万个,较去年同期增长2.3%。

  为了搜索质量、提高用户使用满意度,百度搜索引擎每周都会进行网页质量抽样评估。然而从近一年的评估数据中我们发现,优质网页的数量非常少,且几乎没有增长;普通网页的占比在下降,相应的,质差网页的比例却有明显上涨。截至2014年5月,统计数据显示,在百度网页搜索发现的海量网页中,优质网页仅占7.4%,质差网页高达21%,其余普通网页为71.6%。

  百度网页搜索通过一系列筛选、识别、分析、赋权等工作,努力将更多优质网页呈现在用户面前,每天约打击上万质量差网站,涉及网页达百万量级,尽可能减少质量差网页给用户带来的干扰。从下图2014年5月的网页展现分析数据显示,目前展现在用户面前的网页质量分布中,优质网页占比为40%,质量差网页降为11%——虽然这个变化已经非常明显,但百度网页搜索还是希望能和广大站长一起努力,将质量差占比降到。  




互联网全部网页


在百度搜索得到展现的网页

优质网页


7.40%


41%

普通网页