klearn 文本分类_sklearn 基本的文本分类
目的其实,说白了就是人想知道这个文档是做什么的。首先给每篇文章一个标签、构建文档的特征,然后通过机器学习算法来学习特征和标签之间的映射关系,最后对未知的文本进行标签的预测。在海量信息的互联网时代,文本分类尤其重要。sklearn作为即可学术研究,也可构建产品原型,甚至发布商用产品的机器学习包,里面封装了一些常用的文本操作的算法。这里慢慢的记录一下。训练数据以后有机会我爬取一些中文的文本,但现在我们...