首页 ›存档› 技术 › 查看内容

Python爬虫利器一之Requests库的用法

2018-3-30 13:00 |来自: 互联网 372 0

摘要: 注：Python 版本依然基于 2.7 前言之前我们用了 urllib 库，这个作为入门的工具还是不错的，对了解一些爬虫的基本理念，掌握爬虫爬取的流程有所帮助。入门之后，我们就需要学习一些更加高级的内容和工具来方便我们 ...

注：Python 版本依然基于 2.7

之前我们用了 urllib 库，这个作为入门的工具还是不错的，对了解一些爬虫的基本理念，掌握爬虫爬取的流程有所帮助。入门之后，我们就需要学习一些更加高级的内容和工具来方便我们的爬取。那么这一节来简单介绍一下 requests 库的基本用法。

以下内容大多来自于官方文档，本文进行了一些修改和总结。要了解更多可以参考

官方文档

利用 pip 安装

$ pip install requests

或者利用 easy_install

$ easy_install requests

通过以上两种方法均可以完成安装。

首先我们引入一个小例子来感受一下

import requests
r = requests.get('http://cuiqingcai.com')
print type(r)
print r.status_code
print r.encoding
#print r.text
print r.cookies

以上代码我们请求了本站点的网址，然后打印出了返回结果的类型，状态码，编码方式，Cookies等内容。

运行结果如下

声明：文章版权归原作者所有部分文章转自互联网如有侵权请联系 [邮箱地址] 删除

上一篇：Python爬虫抓取收集考试大纲下一篇：Python 序列中的时间类型数据处理丨数析学院