首页 存档 技术 查看内容

Python爬虫利器一之Requests库的用法

2018-3-30 13:00 |来自: 互联网 355 0

摘要: 注:Python 版本依然基于 2.7 前言 之前我们用了 urllib 库,这个作为入门的工具还是不错的,对了解一些爬虫的基本理念,掌握爬虫爬取的流程有所帮助。入门之后,我们就需要学习一些更加高级的内容和工具来方便我们 ...

注:Python 版本依然基于 2.7


前言

之前我们用了 urllib 库,这个作为入门的工具还是不错的,对了解一些爬虫的基本理念,掌握爬虫爬取的流程有所帮助。入门之后,我们就需要学习一些更加高级的内容和工具来方便我们的爬取。那么这一节来简单介绍一下 requests 库的基本用法。


官方文档

以下内容大多来自于官方文档,本文进行了一些修改和总结。要了解更多可以参考

官方文档

http://docs.python-requests.org/en/master/


安装

利用 pip 安装

$ pip install requests

或者利用 easy_install

$ easy_install requests

通过以上两种方法均可以完成安装。


引入

首先我们引入一个小例子来感受一下

import requests
r = requests.get('http://cuiqingcai.com')
print type(r)
print r.status_code
print r.encoding
#print r.text
print r.cookies

以上代码我们请求了本站点的网址,然后打印出了返回结果的类型,状态码,编码方式,Cookies等内容。

运行结果如下

声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系 [邮箱地址] 删除

路过

雷人

握手

鲜花

鸡蛋

相关分类

返回顶部