正则表达式匹配中文时发现的问题
大家使用正则表达式匹配中文时,常用 [\u4e00-\u9fa5] ,但有时使用 [\u4e00-\u9fa5] 匹配汉字时,发现有的汉字匹配不到,如:㸌如㔩叶使用Python3测试:r = '[^\u4e00-\u9fa5]' #非汉字for i in words: word = re.sub(r, '', i) #替换掉非汉字 if len(word) == 1:...