数据预处理一:文本分词并且去停用词代码
数据结构:搜狗数据集(最外层文件夹)类别(第二层文件夹,比如说 军事)10.txt(军事类别下面的一个文本文件)import osimport jieba# 保存文件的函数def savefile(savepath, content): fp = open(savepath, 'w', encoding='ANSI',errors='ignore') fp.write...