python分词代码_python jieba 分词进阶
https://www.cnblogs.com/jiayongji/p/7119072.html文本准备到网上随便一搜"三体全集",就很容易下载到三体三部曲的全集文本(txt文档大概有2~3Mb),这里重命名为santi.txt,并存放到当前目录下。读取三体全集文本#coding:utf-8importsys#设置环境为utf-8编码格式,防止处理中文出错reload(sys)sys.setdef...