年轻秋天

文章
8
资源
0
加入时间
2年10月27天

正则表达式re 匹配pagesource 在爬虫aminer中的应用一、是什么?二、使用步骤

aminer中爬取数据正则表达式的写法文章目录一、是什么?二、使用步骤一、是什么?// 以该条为例子url_list = re.findall('"url":\"(.*?)\"', browser_2.page_source, re.S)//第一个参数表示符合这个格式的,其中.表任意字符,*表示任意数目,?表示非贪婪规则。如果你不加(),那么你返回的是整个字符串,加了(),你返回的是()里的东西。//第二个参数是你正则re寻找的源文件//re.S 表示的是