什么是404?


404状态码代表‘Not Found’ 。spider更新时会认为该页面已失效 。此时呢将在索引库中删除 。短期内spider再次发现该url不再会抓取 。因此 。出来了两类问题:第一 。网页临时性打不开;第二 。页面永远无法打开 。针对第一类问题 。我建议不要立刻返回404,而是使用503.503等同于告诉spider该页面临时访问不了 。过段时间再来光临 。关于503,spider会认为该网页临时无法访问 。短期内会再光临 。如果网页已经恢复 。即刻正常抓取;如果继续返回503,短期内还会再光临几次 。但如果该页面长时间返回503,该url仍会被认作失效链接 。从索引库中删除 。针对第二类问题 。永远无法打开的页面 。404,不用考虑 。各种web2类页面删除后同样需要返回404告知搜索引擎该页面已失效 。
回归之前那个网站 。删除内容后该页面没有任何价值 。最恰当的处理是:
1、直接做死链处理并返回404;
2、在百度站长平台死链提交工具中提交死链sitemap.
最后呢 。提醒一下各位站长朋友 。当您的网站存在被发布大量垃圾信息时 。请:
1、及时删除相关垃圾页面 。并做404处理;
【什么是404?】2、制作符合要求的死链sitemap;
3、登录百度站长平台 。进入死链提交工具提交死链sitemap.

    推荐阅读