360搜索网页质量白皮书

网页质量评估维度

网站是多个网页共同组成的集合。细化到单个网页的质量时,360搜索在一般会按以下几个维度进行综合衡量:

下面,我们向大家具体介绍这些维度:

内容质量

在评价网页的内容质量时,360搜索首先会考虑这个网页内容的优劣,以及对用户需求是否可以被满足。

3.1 不同类型网页的质量关注维度

网页的形态不尽相同,针对不同类型的页面,360搜索在质量上也会有不同的关注维度。我们在此举一些常见的例子,供大家参考:

3.2 网页内容质量现状与收录的权衡

根据2017年7月发布的第40次 《中国互联网络发展状况统计报告》:截止2017年月,中国网站的总数已达 506 万个,半年增长率为 4.8%。中国网民规模已达到 7.51亿 。

目前,全网网页数量已接近万亿级别。网页内容的质量情况大体分布如下:


数据来自:360站长平台

通过数据我们可以知道:尽管网站、网页数量目前已经达到了一个惊人的数量级,但优质内容仍然较为稀缺。互联网中大部分内容都属于质量一般的内容,还有相当一部分内容是属于内容质量差的。因此,基于网页资源质量的实际情况,从用户需求和内容索引择优的原则出发,并非所有网页都会被360搜索收录。

3.3 内容质量好的网页

一个内容质量好的网页,往往是网站投入了一定精力来制作的。具备原创属性。资源有效、权威,能充分满足用户的需求,能彰显出网页及网站的价值。个别内容甚至是全网独家拥有的稀缺资源。

对于此类网页,360搜索会在一定程度上给予优先收录和排序的机会。我们列举了其中一小部分网页作为例子,供大家来感受一下:

示 例说 明
case1政府网站一个权威且完整有效的通知。
case2新闻网站的原创内容,倾注了精力运营的新闻报道或专题。
case3医疗网站发布的内容丰富且权威的页面。针对感冒,提供了问答、文章、症状、诊断和鉴别等内容,可满足用户的需求。
case4经过网友用心编辑,内容丰富的 UGC 内容。
case5房产网站的一个丰富且内容有效的列表页。
case6一个 IT 技术类博客文章,内容完整且能解决专业技术性问题。
case7购物网站一个包含商品信息、评价的完整页面。
case8汽车网站提供的车系聚合信息页,包含了汽车价格,配置参数,经销商,评价等全面且多样的信息。

3.4 内容质量一般的网页

相较于内容质量好的网页,这种类型的网页往往可能不是网站自身原创的,也能在一定程度上满足用户的需求,但本身网页中的内容可替代性较强。对于此类网页,360搜索会综合其资源可替代性、需求满足程度、用户体验等维度考虑其是否收录及排序高低。

3.5 内容质量差的网页

这种类型的网页,往往主体内容不完整,缺失有效信息,无法从实质性上解决用户的需求。请站长们尤其需要注意:如果在一个网站中此类网页占比很大,不仅影响用户的体验,也会影响到360搜索对这个网站或网页的评价。

提供一些 badcase 例子,供站长们参考:

示 例说 明
case1 网页主体内容缺失。
case2 交易、团购、活动结束,商品下架,招聘失效等,不能满足用户当前时效需求。
case3 问答类网页存在有问无答、回答无用、回答推广等特征。
case4 差标签页、差搜索结果页,列表页的标题和内容相关性差。
case5 视频页标题文不对题,还带有推广的性质。
case6 网页中的文字、链接、图片、视频或必要的下载链接失效。
case7 论坛水贴。
case8 通过新闻网站、博客等渠道发布的医疗推广内容,以及差医疗站点。
case9 网页或文章的标题与内容相关性差,或者毫无关系。

3.6 作弊网页

此类网页往往有作弊行为,内容粗制滥造,完全不能为用户提供任何帮助,甚至还夹带病毒,没有任何价值。360搜索会依据实际情况,做降低排序和直接拒绝收录的处理!

在此,我们列举一部分例子,请各位站长知悉:

示 例说 明
case1在正常文章的句子或段落之前穿插其他无关联的关键词或锚文本。
case2在网页或标题中刻意的大量重复关键词或锚文本,进行恶劣优化,提高关键词密度,从而欺骗搜索引擎。
case3 网页打开跳转到其他带有明显推广盈利性质的页面,如博彩、色情等,或跳转到其他明显作弊特征的页面。
case4把转载的文章进行再加工,欺骗搜索引擎,让其认为这是一篇原创的文章。
case5页面有虚假电话、虚假下载、钓鱼网站等危害用户安全的行为。
case6网站内容采集于其他网站,通常有规模大、范围广、板式差、不完整等特征,并可能兼有其他黑帽 SEO 或作弊行为,达到被搜索引擎收录的目的。
case7网站将目录或频道页租售出去,或自行有意而为之。在全站或其中几个目录下,发布大量与网站主题完全无关的内容,包括蹭热点事件、编造八卦、发广告软文、甚至发布低俗色情及非法的内容,以此来达到吸引用户点击的目的。
case8在首页或子页面刻意设置垃圾外链,形成恶劣链接关系,达到欺骗搜索引擎或恶意推广的目的。部分网站甚至利用这一手段,形成了链接买卖和链接黑市交易的行为。
case9刻意生成大量二级或多级子域名,制造作弊垃圾内容,获取搜索引擎的广泛收录达到推广目的。
case10利用模板粗制滥造,生成大量相同但质量很低网站,达到欺骗搜索引擎排序目的。