我是靠谱客的博主 斯文黑裤,最近开发中收集的这篇文章主要介绍python爬虫——正则获取手机号,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

用正则匹配网页手机号

1. 安装re模块、requests库、beautifulsoup4库

cmd → pip install re → 回车
cmd → pip install requests → 回车
cmd → pip install beautifulsoup4 → 回车

2.调用库

import requests
import re
from bs4 import BeautifulSoup

3. 调用网址

 r = requests.get("http://www.haomahao.com/")

4. 编写正则表达式

parttern = "1[35789]d{9}"

5.完整代码

import requests
import re
from bs4 import BeautifulSoup
def down():
r = requests.get("http://www.haomahao.com/") #调用网页
r.encoding = r.apparent_encoding #更改网页编码,防止出现乱码
#print(r.text)
bs = BeautifulSoup(r.text,"html.parser")
str1 = bs.getText() #将BeautifulSoup提出出来的写完text
parttern = "1[35789]d{9}" #编写手机号的正则表达式
list = re.findall(parttern,str1)
#print(list) #调试正则是否正确
f = open("手机号.txt",mode="w",encoding="utf-8") #写入文件
f.write("n".join(list))
f.close()
if __name__ == "__main__":
down()

最后

以上就是斯文黑裤为你收集整理的python爬虫——正则获取手机号的全部内容,希望文章能够帮你解决python爬虫——正则获取手机号所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(56)

评论列表共有 0 条评论

立即
投稿
返回
顶部