python 用正则表达式 提取单个中文或者多个中文组合重点:假如你想输出 '这年头猪都会上树' 也是可以的,上面的match_obj其实都是list类型,通过''.join(match_obj)即可。
话不多说,了解下中文编码,我们中国的汉字编码是从/u4e00-/u9fa5,即/u4e00 到 /u9fa5匹配单个中文,即每个中文都输出用的pattern是 r'[\u4e00-\u9fa5]' , 其中r为转义字符., 举个例子:'12sdw这@F@#年$H$头^&*^%^猪都V#$sad会2b45b5*(上h45y45树3TNYT$%ver' 可以匹配出['这', '年',...