我是靠谱客的博主 魁梧老师,这篇文章主要介绍httpClient抓取网页并存储mht格式的文件,现在分享给大家,希望可以做个参考。

求高手援助

    我已经通过httpClient抓取百度网页的html标签,现在将存储为mht格式 按以下方法 。存储htm格式文件没问题,但是存储mht就不行,该如何解决

江湖救急啊。
       //构造HttpClient的实例
      HttpClient client = new HttpClient();     
            // 创建GET方法的实例
             GetMethod getMethod  =   new  GetMethod(" http://www.baidu.com ");
            
            // 使用系统提供 的默认的恢复策略
             getMethod.getParams().setParameter(HttpMethodParams.RETRY_HANDLER,new  DefaultHttpMethodRetryHandler());
                                                    
            try  {
              // 执行getMethod
              int  statusCode  =  client.executeMethod(getMethod);
              if  (statusCode  !=  HttpStatus.SC_OK) {
                  System.err.println( " Method failed:  "
                                           +  getMethod.getStatusLine());
             }
               // 读取内容
               byte [] responseBody  =  getMethod.getResponseBody();
               // 处理内容  打印html标签
               //System.out.println( new  String(responseBody));
              
               //将页面信息输出htm文件
//               FileOutputStream fos=new FileOutputStream("c:/Users/wenjiao/Desktop/1.htm"); 
//               fos.write(responseBody);
//               fos.flush();

最后

以上就是魁梧老师最近收集整理的关于httpClient抓取网页并存储mht格式的文件的全部内容,更多相关httpClient抓取网页并存储mht格式内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(85)

评论列表共有 0 条评论

立即
投稿
返回
顶部