抓取异常的原因有哪些
百度站长工具
2021-02-24
一、网站异常
1、dns异常
当Baiduspider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。
2、连接超时
抓取请求连接超时,可能原因服务器过载,网络不稳定
3、抓取超时
抓取请求连接建立后,下载页面速度过慢,导致超时,可能原因服务器过载,带宽不足
4、连接错误
无法连接或者连接建立后对方服务器拒绝
二、链接异常
1、访问被拒绝
爬虫发起抓取,httpcode返回码是403
2、找不到页面
爬虫发起抓取,httpcode返回码是404
3、服务器错误
爬虫发起抓取,httpcode返回码是5XX
4、其他错误
爬虫发起抓取,httpcode返回码是4XX,不包括403和404
本文来源于互联网由网友投稿或第三方发布,内容仅代表作者本人的观点,与本站无关。本站仅提供网络技术服务,对文章的原创性及内容真实性不做任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如因作品内容、知识产权和其他问题需与本网联系的,请与站长联系进行删除。
上一篇:
什么是抓取诊断
下一篇:
抓取异常对网站有哪些影响