概述
今天需要抓取的内容在HTML页面中存在,但是需要的只是表格中的某一列数据,而且在页面中存在多个table。这里采用采用逐层抓取的方法。正则表达式用的6的就不用往下看了。需要获取的的table的某一行数据如下所示:
这里需要抓取的是时间下面的“1179”。关键的地方就是先找到需要的table,再获取table的所有行,然后在每一行找到需要的列。实现如下所示:
private static void datasoup2(String url) throws Exception {
Document doc = Jsoup.connect(url).get();
Elements elements1 = doc.select("tbody").get(8).select("tr");
for (int i = 0; i < elements1.size(); i++) {
String td = elements1.get(i).select("td").get(7).text();
System.out.println(td);
}
}
最后
以上就是负责黄蜂为你收集整理的抓取HTML页面表格中的某一列数据的全部内容,希望文章能够帮你解决抓取HTML页面表格中的某一列数据所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复