Node.js可能是最适合写简易小爬虫的语言,速度极快、代码极少
“凡是能用JS 写出来的,最终都会用JS 写”,这是一个非常著名的定律,用在爬虫这里再合适不过了。一说到爬虫很多人都会想到python,的确,python语法简洁,还有scrapy这一类强大的工具可以使用。但是如果只是想写一个小爬虫,爬取论坛里的几张帖子,帖子里面的几个楼层,然后合成一篇文章。这点小数据量使用scrapy就有点杀鸡用牛刀了,而且还得设置一堆东西,非常麻烦,不够灵活。而Java...