JAVA爬虫1 - HttpClient的使用
一、简介
HttpClient 是 Apache Jakarta Common 下的子项目,用来提供高效的、最新的、功能丰富的支持 HTTP协议的客户端编程工具包,并且它支持HTTP协议最新的版本和建议。HttpClient已经应用在很多的 项目中,比如Apache Jakarta上很著名的另外两个开源项目Cactus和HTMLUnit都使用了HttpClient。
下载地址: http://hc.apache.org/downloads.cgi
二、使用方法
使用 HttpClient 发送请求、接收响应很简单,一般需要如下几步即可。
1. 创建 HttpClient 对象。
2. 创建请求方法的实例,并指定请求URL。如果需要发送GET请求,创建HttpGet对象;如果需要发
送POST请求,创建HttpPost对象。
3. 如果需要发送请求参数,可调用 HttpGet、HttpPost 共同的 setParams(HetpParams params) 方
法来添加请求参数;对于 HttpPost 对象而言,也可调用 setEntity(HttpEntity entity) 方法来设置请求参数。
4. 调用 HttpClient 对象的 execute(HttpUriRequest request) 发送请求,该方法返回一个
HttpResponse 。
5. 调用 HttpResponse 的 getAllHeaders()、getHeaders(String name) 等方法可获取服务器的响
应头;调用 HttpResponse 的 getEntity() 方法可获取 HttpEntity 对象,该对象包装了服务器的响应内容。程序可通过该对象获取服务器的响应内容。
6. 释放连接。
<