概述
昨天把JavaEye的头条获取过来,思路是这样的:
- 通过id获取div的源代码
- 通过正则表达式获取列表,以实现配置的通用性,只需改变正则表达式就可以获取不同的数据
- 通过正则表达式的分组获取头条的标题、title、链接
javaEye头条的源代码如下:
因为通过div的id属性获取还是非常方便的。配置程序获取的结果速度也很快。div分析结果如下:
但是再要获取“Java编程和企业应用热点”下面的栏目时有点问题。这些模块都是根据<DIV Class>属性来排版的,没有ID属性,使用WebBrowser控件不能直接定位了,并且class属性不是唯一的,有多个。譬如“Java编程和企业应用热点”和“动态语言编程热点”的class都是<DIV class="forum left">,怎么获取呢?只有通过正则表达式了吧(欢迎高手讨论怎么获取?),获取后再通过正则表达式解析出来就可以了吧。
最后
以上就是忧伤泥猴桃为你收集整理的DIV标签中列表的获取方法的全部内容,希望文章能够帮你解决DIV标签中列表的获取方法所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复