浏览数量: 1000 作者: 本站编辑 发布时间: 2024-01-18 来源: 本站
a. 备用网页:在网站中一般是amp页面,或者在canonical标签中指向了其他的url的页面,是备用网页,这些页面一般不需要验证。
b. 自动重定向:一般是做了301跳转的,目前网站系统中除了手动设置的301外,还有一些系统默认301,比如:产品文章使用系统url后,改了产品或文章的名称,则url会改变,原先的url会自动跳到新的url上;还有就是后台设置了关键词不大于某个值时不展示,这时候关键词聚合的url也会自动跳转到首页。
c. 已被 robots.txt 屏蔽:robots文件中指定disallow开头的url就是被屏蔽的url,网站中可以访问robots规则:http://|https://域名/robots.txt, 默认会将/phoenix/admin开头的url进行屏蔽,因为这些都是动态url,对seo并不友好,不需要收录。
d. 未找到 (404):url打开直接报404找不到,这种情况一般是因为客户删除了某些页面,或者是客户从老系统转过来的,但是url没有做保留或者保留遗漏,这种最好做301,或者将报404的url进行保留到某个页面、产品、文章上。
e. 软404:页面内容意义不大,但是返回码是200;这种情况一般都是页面基本没有实质性内容,需要丰富页面内容。
f. 已发现 - 尚未编入索引:该页面已被 Google 抓取但未编入索引。将来可能会或可能不会被索引;无需重新提交此 URL 进行抓取。
g. 已抓取 - 尚未编入索引:该网页已被 Google 找到,但尚未抓取。通常,Google 想要抓取 URL,但预计这会使网站超载;因此 Google 重新安排了抓取时间。这就是报告中最后一次抓取日期为空的原因。
“已发现”和“已抓取”这两种情况都是网站内容相关的情况,需要丰富网页内容,并且保证网站内容不重复,这样google才会将内容进行抓取或索引。