描述如何从网页提取结构化数据的语言:Parsley
郑昀@玩聚SR 20091127 Scrapy里面用到了Parsley。Parsley是一个挺有意思的小东西,它综合运用了CSS、XPath、正则表达式和JSON,是描述如何从网页里提取结构化数据的简单语言。估计做爬虫(Crawler/Spider)的人都会定义一套类似的模板。只不过Parsley还帮你把具体实现做了,用各种开发语言。 基本事实 Parselets就是用Parsley语言写成...