python使用HTMLParser和BeautifulSoup解析网页
HTMLParser是python自带的网页解析库,使用也很简单,主要需要继承基类HTMLParser,然后重载handle_starttag、handle_data、handle_endtag三个函数即可。下面给出一个抽取网页链接的示例#!/usr/bin/env python#coding=utf-8from HTMLParser import HTMLParsercla