炙热纸鹤

文章
3
资源
0
加入时间
2年10月21天

jieba分词自定义词库无效果

首先我自定义了一个词库,内容为:乾清宫 5太和殿 3黄琉璃瓦 3午门 1我是一个 5凯的试接 1我的分词内容为故宫的著名景点包括乾清宫、太和殿和黄琉璃瓦等我是一个好孩子我是一个好孩子我是一个好孩子故宫的著名景点包括乾清宫、太和殿和黄琉璃瓦等凯的试接 故宫的著名景点包括乾清宫、太和殿和黄琉璃瓦等故宫的著名景点包括乾清宫、太和殿和黄琉璃瓦等故宫的著名景点包括乾清宫、太和...

日语分词工具MeCab的安装和使用

由于工作的需要,需要使用到分词工具,结果调研之后发现有专门的日语分词工具可以很好地对日语进行分词,于是记录下来安装和简单的使用测试过程。首先使用的系统是Mac OSX,python版本是python3.1. 有直接源码可以安装的,但是为了方便还是使用HomeBrew来进行安装。下面使用HomeBrew进行安装。$ brew install mecab$ brew install me