我是靠谱客的博主 魁梧老师,最近开发中收集的这篇文章主要介绍httpClient抓取网页并存储mht格式的文件,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

求高手援助

    我已经通过httpClient抓取百度网页的html标签,现在将存储为mht格式 按以下方法 。存储htm格式文件没问题,但是存储mht就不行,该如何解决

江湖救急啊。
       //构造HttpClient的实例
      HttpClient client = new HttpClient();     
            // 创建GET方法的实例
             GetMethod getMethod  =   new  GetMethod(" http://www.baidu.com ");
            
            // 使用系统提供 的默认的恢复策略
             getMethod.getParams().setParameter(HttpMethodParams.RETRY_HANDLER,new  DefaultHttpMethodRetryHandler());
                                                    
            try  {
              // 执行getMethod
              int  statusCode  =  client.executeMethod(getMethod);
              if  (statusCode  !=  HttpStatus.SC_OK) {
                  System.err.println( " Method failed:  "
                                           +  getMethod.getStatusLine());
             }
               // 读取内容
               byte [] responseBody  =  getMethod.getResponseBody();
               // 处理内容  打印html标签
               //System.out.println( new  String(responseBody));
              
               //将页面信息输出htm文件
//               FileOutputStream fos=new FileOutputStream("c:/Users/wenjiao/Desktop/1.htm"); 
//               fos.write(responseBody);
//               fos.flush();

最后

以上就是魁梧老师为你收集整理的httpClient抓取网页并存储mht格式的文件的全部内容,希望文章能够帮你解决httpClient抓取网页并存储mht格式的文件所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(41)

评论列表共有 0 条评论

立即
投稿
返回
顶部