NLP实战:使用机器/深度学习做文本分类
当你掌握了机器学习和深度学习一些基本知识后,实现一些相关代码是非常必要的。本文提供了一个实战任务和代码实现:在给定的20类新闻文本数据集下,分别使用朴素贝叶斯、K近邻、神经网络进行文本分类,使用5次交叉验证,并对分类结果进行分析讨论。如果你能跟着实现文章中的代码,相信你的代码能力一定能有很大提高。(有些模块使用sklearn可以更简洁地解决,但是我尽量不使用sklearn, 因为那样对代码能力帮助较小)下面的介绍包含文字叙述和部分代码,完整代码先从这里下载一、数据集:数据集包含了 20个 新闻群