我是靠谱客的博主 负责黄蜂,这篇文章主要介绍抓取HTML页面表格中的某一列数据,现在分享给大家,希望可以做个参考。

     今天需要抓取的内容在HTML页面中存在,但是需要的只是表格中的某一列数据,而且在页面中存在多个table。这里采用采用逐层抓取的方法。正则表达式用的6的就不用往下看了。需要获取的的table的某一行数据如下所示:

这里需要抓取的是时间下面的“1179”。关键的地方就是先找到需要的table,再获取table的所有行,然后在每一行找到需要的列。实现如下所示:

private static void datasoup2(String url) throws Exception {

			    Document doc = Jsoup.connect(url).get();			
			    Elements elements1 = doc.select("tbody").get(8).select("tr");						    
			    for (int i = 0; i < elements1.size(); i++) {		    	
			    	String td = elements1.get(i).select("td").get(7).text();		    	
			    	System.out.println(td);
			    }
		}




最后

以上就是负责黄蜂最近收集整理的关于抓取HTML页面表格中的某一列数据的全部内容,更多相关抓取HTML页面表格中内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(109)

评论列表共有 0 条评论

立即
投稿
返回
顶部