《机器学习系统设计》之应用scikit-learn做文本分类(上)前言:1. 统计词语2. 文本处理3. 计算TF-IDF代码清单:4. 总结
前言: 本系列是在作者学习《机器学习系统设计》([美] WilliRichert)过程中的思考与实践,全书通过Python从数据处理,到特征工程,再到模型选择,把机器学习解决问题的过程一一呈现。书中设计的源代码和数据集已上传到我的资源:http://download.csdn.net/detail/solomon1558/8971649 第3章通过词袋模型+K均值聚类实现