Python Requests模块快速入门

requests是python的一个HTTP客户端库,跟urllib,urllib2类似。它比 urllib 更加方便,可以节约我们大量的工作,它比 urllib 更加 Pythoner。

安装 Requests

通过pip安装

$ pip install requests

或者,下载代码后安装:

$ wget https://github.com/requests/requests/tarball/master  $ mv master requests.tgz  $ tar xzf requests.tgz  $ cd requests-requests-3dc84cd  $ python setup.py install

发送请求

使用Requests发送网络请求非常简单。

>>> import requests #导入Requests模块  >>> result = requests.get('http://www.pythontab.com') # 生成Response 对象  >>> result.status_code  # 返回码   200  >>> result.headers['content-type']  # 返回头部信息  'text/html; charset=utf8'  >>> result.encoding  # 编码信息  'utf-8'  >>> result.content  #内容部分

为URL传递参数

你也许经常想为URL的查询字符串(query string)传递某种数据。如果你是手工构建URL,那么数据会以键/值 对的形式置于URL中,跟在一个问号的后面。例如,www.pythontab.com?version=python3 。 Requests允许你使用 params 关键字参数,以一个字典来提供这些参数。举例来说,如果你想传递 version=python3 和 keywords=pythontab 到 www.pythontab.com ,那么你可以使用如下代码:

>>> data = {'version': 'python3', 'keywords': 'pythontab'}  >>> result = requests.get("http://www.pythontab.com", params=data)  >>> print result.status_code  200

原始响应内容

在罕见的情况下你可能想获取来自服务器的原始套接字响应,那么你可以访问 r.raw 。 如果你确实想这么干,那请你确保在初始请求中设置了 stream=True 。具体的你可以这么做:

>>> result = requests.get('http://www.pythontab.com', stream=True)  >>> result.raw  <requests.packages.urllib3.response.HTTPResponse object at 0x101194810>  >>> result.raw.read(10)  'x1fx8bx08x00x00x00x00x00x00x03'

定制请求头

如果你想为请求添加HTTP头部,只要简单地传递一个 dict 给 headers 参数就可以了。

例如,在前一个示例中我们没有指定content-type:

>>> import requests  >>> url = 'http://www.pythontab.com'  >>> data = {'version': 'python3', 'keywords': 'pythontab'}  >>> headers = {'content-type': 'application/json'}  >>> result = requests.post(url, data=json.dumps(data), headers=headers)

错误与异常

遇到网络问题(如:DNS查询失败、拒绝连接等)时,Requests会抛出一个ConnectionError 异常。

遇到罕见的无效HTTP响应时,Requests则会抛出一个 HTTPError 异常。

若请求超时,则抛出一个 Timeout 异常。

若请求超过了设定的最大重定向次数,则会抛出一个 TooManyRedirects 异常。

所有Requests显式抛出的异常都继承自 requests.exceptions.RequestException 。

其他常用方法

result.content #获取二进制响应内容

result.json()  #JSON响应内容

result.headers #响应头内容

result.cookies #cookie内容

result.history #请求历史

  • 初学者学习python2还是python3?
  • python获取本机IP、mac地址、计算机名
  • 详解python2 和 python3的区别
  • python基础之删除文件及删除目录的方法
  • 用python求第1000个质数的值
  • python常用函数年初大总结
  • Python3 - 时间处理与定时任务
  • Python开发的CMS系统,Silva CMS 3 发布
  • python基础之使用os.system来执行系统命令
  • 判断python字典中key是否存在的两种方法
  • 初学者学习python2还是python3?
  • python基础之删除文件及删除目录的方法
  • python获取本机IP、mac地址、计算机名
  • python获取系统时间(时间函数详解)
  • 详解python2 和 python3的区别
  • 用python求第1000个质数的值
  • Python3 - 时间处理与定时任务
  • 命令行看糗百
  • Python算法之---冒泡,选择,插入排序算法
  • python 中求和函数 sum详解
  • range方法在Python2和Python3中的不同
  • python3 数组(列表)初始化
  • 记一次crontab中date命令错用导致的问题
  • MySQL用LIKE特殊字符搜索
  • CentOS 7 下修改主机名
  • Python3正则表达式之:(?(id/name)y...
  • TIOBE编程语言排行榜2019年 Python稳居前三
  • 解压命令unzip常用方法汇总
  • 解析redis备份文件rdb的两种方法及对比
  • 百度视觉语义化平台2.0:交互升级和...
  • 5G时代的视觉语义化技术:软硬结合...
  • 百度AutoDL重磅升级至3.0:设计、迁...