机器学习实战第四章
基于概率论的分类方法:朴素贝叶斯说明:本章节所有代码使用版本为Python3优点:在数据较少的情况下仍然有效,可以处理多类别问题缺点:对于输入数据的准备方式较为敏感适用数据类型:标称型 概率论是许多机器学习算法的基础。本文首先从一个最简单的概率分类器开始,然后给出一些假设来学习朴素贝叶斯分类器,之所以称为 “朴素” ,是因为整个形式化过程只做最原始、最简单的假设。我们充分利用Python的文本处理能力将文档切分成词向量,然后利用词向量对文档进行分类,还将构建一个分类器,观察其在真实的垃圾