- 百度对返回码的处理逻辑:
- 404: “NOT FOUND”,百度认为网页已失效,从搜索结果中删除,并且短期内不再抓取
- 503: “Service Unavailable”,百度认为网页临时不可访问,短期内会反复访问,如果长期返回503,则从搜索结果中删除
- 403: “Forbidden”,百度认为网页禁止访问,短期内会反复访问,如果长期返回403,则从搜索结果中删除
- 301: “Moved Permanently”,百度认为网页跳转至新url,当遇到站点迁移、域名更换、站点改版的情况时,推荐使用301返回码
- 建议的返回码:
- 如果站点临时关闭,当网页不能打开时,不要立即返回404,建议使用503状态
- 如果百度spider对您的站点抓取压力过大,请尽量不要使用404,同样建议返回503
- 对暂时不希望百度收录的内容返回403,等经过审核或处理后,再返回正常状态的返回码
- 站点迁移,或域名更换时,使用301返回