bayes中文文本分类(NLP版)
“”"bayes中文文本分类(NLP版)1、准备数据读取数据内容,标签2、中文的分词:中文信息处理时所需的步骤(Jieba、Jiagu、pkuseg)3、文本向量化:将读取后的数据转换成文本的向量(数字)TFIDF词袋模型4、模型的训练和保存:sklearn的工具包实现,joblib5、模型的加载使用:joblib“”"import osimport jiebafrom sklearn.feature_extraction.text import TfidfVectorize