大胆蜡烛

文章
4
资源
0
加入时间
2年10月21天

python调用jieba(结巴)分词 加入自定义词典和去停用词功能

转自https://www.cnblogs.com/zhangtianyuan/p/6875080.html    把语料从数据库提取出来以后就要进行分词啦,我是在linux环境下做的,先把jieba安装好,然后找到内容是build jieba PKG-INFO setup.py test的那个文件夹(我这边是jieba-0.38),把自己的自定义词典(选用,目的是为了分出原始词库中没有的词以