360搜索网页质量白皮书

网页质量评估维度

网页资源可访问性

5.1 具有打开及获取权限的网页

一些网站会通过权限,来限制用户访问页面。限制的类型往往有:要求用户安装插件或软件,以及要求用户付费。

我们并不主张这种提高内容获取门槛的行为。对于一些非原创,非优质,来自于转载并且可替代性很强的内容,用户在访问时还被权限限制的,360搜索会根据实际情况决定其收录及排序。

但一些提供高质量、原创、正版内容的网站,在内容建设上投入了很大精力和成本。用户在获取页面或资源时,会被要求安装软件和插件、甚至付费。此类情况多出现在一些具有自制节目或购买了版权的视频站,以及一些提供专业文献检索的网站中。对于此类页面,360搜索不会将其视为对用户不友好的行为。

注册和登录页面,其本身目的就是要求用户进行注册和登录,因此这种类型的页面不会被归为“具有打开及获取权限的网页”。

以下是一些举例,供站长朋友们参考:

示 例等级程度说 明
case1可接受某视频网站上的一部电影,普通用户只能看 5 分钟,完整观看需要购买VIP。网站在获得电影时需要支付很高的成本,这类情况360搜索会认为是可接受的。
case2不建议内容并非来自于网站自身的原创,互联网上存在大量可替代的资源,但仍然要求付费才能下载。
case3不建议页面的内容不完整,并且内容替代性很强,但仍然需要权限才能阅读。
case4不建议视频播放和下载时,被要求安装已经无法使用或非常冷门的软件。

5.2 死链及失效页面

网站在运营的过程中,往往会出现死链和失效页面。我们在这里为大家罗列几种常见的类型:

类 型说 明示 例
协议死链指通过 http 协议状态码,明确表示网页已经无法访问的页面类型。常见的协议死链状态码包括:404、403、503、504等状态。case1
跳转死链跳转死链,是指一个页面内容失效之后,以 301、302 跳转的形式,跳转到特定的死链特征页面上。例如这个跳转到了:https://store.taobao.com/shop/noshop.htmcase2
内容死链内容死链的产生,主要是由于网站自身内容变化引起。网页可以正常打开,http 协议状态码为 200。常见的类型包括:帖子被删除、内容已转移、空间被关闭、信息已过期、交易已关闭等。case3
视频死链视频页面中的视频主体不能播放,提示已经删除、已经下线等。case4

死链及失效页面对用户没有任何价值。网站中如果这一类型页面数量占比很大,会影响到整个网站的收录与排序,请站长们务必重视!站长们可通过360站长平台,及时提交死链进行删除。

站长们在设置页面死链的类型时,请严格按照规范进行设置。建议大家将死链优先设置为“协议死链”的状态(即表格中第一种类型)。360搜索蜘蛛也会在重新抓取后识别出这些死链,进而推送删除。