我是靠谱客的博主 负责黄蜂,最近开发中收集的这篇文章主要介绍抓取HTML页面表格中的某一列数据,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

     今天需要抓取的内容在HTML页面中存在,但是需要的只是表格中的某一列数据,而且在页面中存在多个table。这里采用采用逐层抓取的方法。正则表达式用的6的就不用往下看了。需要获取的的table的某一行数据如下所示:

这里需要抓取的是时间下面的“1179”。关键的地方就是先找到需要的table,再获取table的所有行,然后在每一行找到需要的列。实现如下所示:

private static void datasoup2(String url) throws Exception {

			    Document doc = Jsoup.connect(url).get();			
			    Elements elements1 = doc.select("tbody").get(8).select("tr");						    
			    for (int i = 0; i < elements1.size(); i++) {		    	
			    	String td = elements1.get(i).select("td").get(7).text();		    	
			    	System.out.println(td);
			    }
		}




最后

以上就是负责黄蜂为你收集整理的抓取HTML页面表格中的某一列数据的全部内容,希望文章能够帮你解决抓取HTML页面表格中的某一列数据所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(33)

评论列表共有 0 条评论

立即
投稿
返回
顶部