机智天空

文章
3
资源
0
加入时间
2年10月21天

访问网页

翻网页,找资源,统计或下载,就是爬虫了。逛论坛,找帖子,这是手动爬虫。写段程序完成自动化操作,就是自动化爬虫。所以,爬虫第一步,访问网页。平时我们看见的网页花里胡哨的,但是后面都是些代码而已,不过是些内容,样式,显示方式。不管它是什么,反正链接对了,资源就在里面,至于怎么辨别,怎么获取 ,以后才知道。先把网页内容拿下来再说。from urllib import requesturl = "ht...

Ubuntu 10.04下手动安装JDK

转载地址:http://www.linuxidc.com/Linux/2012-10/73174.htm1、从官网(http://www.Oracle.com/technetwork/java/javase/downloads/jdk6u35-downloads-1836443.html)下载安装文件(如:jdk-6u33-linux-x64.bin)。复制该文件到/usr/lib/j