高贵小天鹅

文章
5
资源
0
加入时间
2年10月21天

爬虫入门系列(五):正则表达式完全指南(上)

正则表达式处理文本有如疾风扫秋叶,绝大部分编程语言都内置支持正则表达式,它应用在诸如表单验证、文本提取、替换等场景。爬虫系统更是离不开正则表达式,用好正则表达式往往能收到事半功倍的效果。介绍正则表达式前,先来看一个问题,下面这段文本来自豆瓣的某个网页链接,我对内容进行了缩减。问:如何提取文本中所有邮箱地址呢?html = """ .qrcode-app

重构 vs2010

重构主要是使程序清晰 简洁.那么就是从软件架构 代码分层 类 函数 变量 几个角度进行重构结合vs重命名 快捷键f2 可以把类层次以下的元素起一个有意义的名称提取方法 把语句变成方法 提高方法的重用 减少重复代码封装字段 把一个字段封装成属性提取接口 把方法变成接口移除参数 移除方法的参数重排参数 重排方法的参数觉得这些没什么用vs的这些重构主要是...

TCP Header、UDP Header、IP Header

TCP首部16位端口号:源端口和目的端口各占16位,2的16次方等于65536,看端口的命令:netstat。 序列号:字段长32位,表示发送数据的位置,每发送一次数据,就累加一次该数据字节数的大小。序列号不会从0或1开始,而是在建立连接时生成的随机数作为其初始值,通过SYN包传给接收端。然后再将每次转发过去的字节数累加到初始值上表示数据的位置。此外,在建立连接和断开连接时发送的SYN包和...