概述
求高手援助
我已经通过httpClient抓取百度网页的html标签,现在将存储为mht格式 按以下方法 。存储htm格式文件没问题,但是存储mht就不行,该如何解决
江湖救急啊。
//构造HttpClient的实例
HttpClient client = new HttpClient();
// 创建GET方法的实例
GetMethod getMethod = new GetMethod(" http://www.baidu.com ");
// 使用系统提供 的默认的恢复策略
getMethod.getParams().setParameter(HttpMethodParams.RETRY_HANDLER,new DefaultHttpMethodRetryHandler());
try {
// 执行getMethod
int statusCode = client.executeMethod(getMethod);
if (statusCode != HttpStatus.SC_OK) {
System.err.println( " Method failed: "
+ getMethod.getStatusLine());
}
// 读取内容
byte [] responseBody = getMethod.getResponseBody();
// 处理内容 打印html标签
//System.out.println( new String(responseBody));
//将页面信息输出htm文件
// FileOutputStream fos=new FileOutputStream("c:/Users/wenjiao/Desktop/1.htm");
// fos.write(responseBody);
// fos.flush();
最后
以上就是魁梧老师为你收集整理的httpClient抓取网页并存储mht格式的文件的全部内容,希望文章能够帮你解决httpClient抓取网页并存储mht格式的文件所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复