![Python网络爬虫从入门到精通](https://wfqqreader-1252317822.image.myqcloud.com/cover/915/44509915/b_44509915.jpg)
上QQ阅读APP看书,第一时间看更新
3.4 异常处理
在实现网络请求时,可能会出现很多异常错误,urllib模块中的urllib.error子模块包含了URLError与HTTPError两个比较重要的异常类。
【例3.10】 处理URLError异常。(实例位置:资源包\Code\03\10)
URLError类中提供了一个reason属性,可以通过这个属性了解错误的原因。例如,这里向一个根本不存在网络地址发送请求,然后调用reason属性查看错误原因。示例代码如下:
![](https://epubservercos.yuewen.com/8BF9E9/23721540501937606/epubprivate/OEBPS/Images/Figure-P52_52516.jpg?sign=1739253832-cWjKIGtN6Onup7bES73lETpsn8eGV1kR-0-282b65ec76df3f8a3dc5e10f2cff37fd)
程序运行结果如下:
Not Found
HTTPError类是URLError类的子类,主要用于处理HTTP请求所出现的异常,该类有以下3个属性。
code:返回HTTP状态码。
reason:返回错误原因。
headers:返回请求头。
【例3.11】 使用HTTPError类捕获异常。(实例位置:资源包\Code\03\11)
使用HTTPError类捕获异常的示例代码如下:
![](https://epubservercos.yuewen.com/8BF9E9/23721540501937606/epubprivate/OEBPS/Images/Figure-P52_52517.jpg?sign=1739253832-dh2PVge0ghveAynmm0683XgHeE7cgTrQ-0-a0675fc05c40cdb2dc8bdf8472fbdc33)
程序运行结果如下:
![](https://epubservercos.yuewen.com/8BF9E9/23721540501937606/epubprivate/OEBPS/Images/Figure-P53_52519.jpg?sign=1739253832-hRlErCxFvH5Dg4pF1zQq7zwhEoF8McLM-0-02cbc6818d699a9f9cc6bcc72e5fe864)
【例3.12】 双重异常的捕获。(实例位置:资源包\Code\03\12)
由于HTTPError是URLError的子类,有时HTTPError类会有捕获不到的异常,所以可以先捕获子类HTTPError的异常,然后再去捕获父类URLError的异常,这样可以起到双重保险的作用。示例代码如下:
![](https://epubservercos.yuewen.com/8BF9E9/23721540501937606/epubprivate/OEBPS/Images/Figure-P53_52520.jpg?sign=1739253832-spLQwTZZqrveCKNVnizvbNQSrL4lQCy8-0-a98c757f628cf85ff49ac742259d3f68)
程序运行结果如下:
URLError异常信息为: timed out
说明
从以上的运行结果中可以看出,此次超时(timeout)异常是由第二道防线URLError所捕获的。