概述
特征
不依赖于词典,语料的通用设计
基于条件随机场(CRF)模型,解析精度高
词典检索的算法/数据结构使用双数组 Double-Array.
库函数可重入再入
各种脚本语言接口绑定(perl/ruby/python/java/C#)
比较
解析模型
bi-gram 马尔科夫模型
可变长 马尔科夫模型
bi-gram 马尔科夫模型
最长一致
cost 估计
从语料库学习
从语料库学习
人手
没有 cost 的概念
学习模型
CRF (区别式模型)
HMM (生成式模型)
词典检索算法
Double Array
Double Array
Patricia Tree
Hash?
求解算法
Viterbi
Viterbi
Viterbi
决定的?
连接表的实现
2元 Table
自动机
2元 Table?
没有连接表?
词性层级
无限制多级词性
无限制多级词性
固定2级
没有词性概念?
未登陆词处理
字符种类 (动作定义可变更)
字符种类 (不可变更)
字符种类 (不可变更)
带约束的解析
可能
2.4.0 以后可能
不可能
不可能
N-best解
可能
不可能
<最后
以上就是现实季节为你收集整理的java建立检索项语料库_日文分词器 Mecab 文档的全部内容,希望文章能够帮你解决java建立检索项语料库_日文分词器 Mecab 文档所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复