忧虑小猫咪

文章
8
资源
0
加入时间
3年0月9天

bayes中文文本分类(NLP版)

“”"bayes中文文本分类(NLP版)1、准备数据读取数据内容,标签2、中文的分词:中文信息处理时所需的步骤(Jieba、Jiagu、pkuseg)3、文本向量化:将读取后的数据转换成文本的向量(数字)TFIDF词袋模型4、模型的训练和保存:sklearn的工具包实现,joblib5、模型的加载使用:joblib“”"import osimport jiebafrom sklearn.feature_extraction.text import TfidfVectorize