灵巧小甜瓜

文章
6
资源
0
加入时间
3年0月28天

python :中英文文本预处理(包含去标点分词词干提取)

python :中英文文本预处理(包含去标点/分词/词干提取)       在做文本分析之前,一般我们都需要进行文本的预处理。这一步其实和做数据时的数据清洗非常的相像。在对文本进行清洗的时候,我们需要分成中文和英文两种语言来进行,因为语言的不同,我们需要进行的操作也不同:英文:大小写的处理,标点符号的处理,文本的分词,去除停用词,