您可能对 404 错误代码并不陌生,它表

示您查找的网页未找到。但您是否知道,如果在错误的上下文中使用此错误消息,则会导致所谓的软 404 错误,从而影响您的 SEO 效果?
营销人员有时会忽略网站的这些技术细节,而希望网站开发人员来处理。这可能会损害网站在搜索结果中的表现,因此 SEO 专家需要与网站开发人员紧密合作。
本文将重点介绍一种特定的抓取错误类型,如果这种错误得

什么是软 404 错误?

真正的 404 错误信息是指网站服务器返回HTTP 404 标准响应代码,表示无法找到用户请求的 网页 ( URL )。这会告知浏览器和搜索引擎该页面不存在。 大多数人不明白的是,页面内容——“页面未找到”消息——与服务器返回的HTTP 响应完全无关 。页面显示 404 文件未找到消息,并不意味着该页面被自动定义为 404 页面。 用谷歌 电报数据 自己的话来说:“这就像一只长颈鹿戴着写着‘狗’的名牌。名牌上写着它是狗,并不意味着它真的是狗。同样,一个页面显示 404,并不意味着它返回 404 状态代码。 ”当不存在的页面(已被删除/移除的页面)向任何尝试访问它的用户显示“页面未找到”消息,但未能返回 HTTP 404 状态代码时,就会发生软 404 错误。当不存在的页面将用户重定向到不相关的页面(例如主页)而不是返回 HTTP 404 状态代码时,也会发生这种情况。这里要记住的重要一点是, 网页的内容与服务器返回的 HTTP 响应完全无关。这种区别对于 SEO 很重要,因为它决定了谷歌如何对待该页面。抓取和索引是 Google 机器人在将您的网站页面列在搜索引擎结果页之前要执行的一个过程。当返回真正的 404 错误消息时,Google 机器人不会花时间抓取或索引该页面。当返回软 404 错误时,该页面仍会被抓取和索引。

软 404 错误的问题

如果您的网站针对不存在的页面返回除 404(或 410 )之外的 HTTP 状态代码,则会对网站在自然搜索中的表现产生负面影响。这意味着,如果您的网站出现大量软 404 错误,可能会造成严重后果。通过不提供 404 状态代码,您的网站实际上是在告诉搜索引擎,他们尝试访问的 URL 上有一个真实的页面。结果,您已删除的 URL(不含任何内容)将被抓取并编入索引,从而将宝贵的抓取预算浪费在多余的页面上。Google将抓取预算
定义为“ Googlebot 能够并且想要抓取的 URL 数量”。抓取预算分为抓取率抓取需求:

  • 抓取率 ——旨在帮助 Google 避免过于频繁或过快地抓取您的网页,以免损害您的服务器
  • 抓取需求– Google 抓取您网页的意愿。这取决于您的网页受欢迎程度以及 Google 索引中内容的陈旧程度

Google 不想在同一个网站上浪费无尽的时间抓取内容,因此在转向其他网站之前,为其网页抓取分配一个“预算”是合理的。
坚持抓取预算的理念,如果一个网站的 机器学习程序可以帮助医疗机构 软 404 错误比例很高,那么这些页面就会被抓取。抓取这些不存在的页面的过程必然会浪费分配给该网站的不必要的抓取预算。由于 Googlebot 花费大量时间抓取软 404 错误,您的唯一 URL 可能无法被快速发现或抓取频率降低,从而降低了您网站上重要内容的可见性。
最终,如果您的网站软 404 错误比例很高,您不仅在无意义的页面上浪费了抓取预算,而且还降低了重要页面的可见性。因此,当软 404 错误得到解决后,网站在自然搜索结果中的表现往往会提高,这不足为奇。
为了解释如何评估软 404 问题的严重程度,让我们看一个在 Google Search Console 中显示大量软 404 错误的网站示例。在下面的示例中,我 俄罗斯号码列表 们看到相关网站报告了 147 个软 404 错误。这很可能会敲响警钟,但我们首先需要结合上下文来考虑这个数字。为此

,我们需要检查网站上有多少个网页已提交给 Google 进行抓取和编入索引。为此,我们会查看相关网站的 XML 站点地图 – 它是网站有多少个网页的关键

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部