我是靠谱客的博主 现实季节,最近开发中收集的这篇文章主要介绍java建立检索项语料库_日文分词器 Mecab 文档,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

特征

不依赖于词典,语料的通用设计

基于条件随机场(CRF)模型,解析精度高

词典检索的算法/数据结构使用双数组 Double-Array.

库函数可重入再入

各种脚本语言接口绑定(perl/ruby/python/java/C#)

比较

解析模型

bi-gram 马尔科夫模型

可变长 马尔科夫模型

bi-gram 马尔科夫模型

最长一致

cost 估计

从语料库学习

从语料库学习

人手

没有 cost 的概念

学习模型

CRF (区别式模型)

HMM (生成式模型)

词典检索算法

Double Array

Double Array

Patricia Tree

Hash?

求解算法

Viterbi

Viterbi

Viterbi

决定的?

连接表的实现

2元 Table

自动机

2元 Table?

没有连接表?

词性层级

无限制多级词性

无限制多级词性

固定2级

没有词性概念?

未登陆词处理

字符种类 (动作定义可变更)

字符种类 (不可变更)

字符种类 (不可变更)

带约束的解析

可能

2.4.0 以后可能

不可能

不可能

N-best解

可能

不可能

<

最后

以上就是现实季节为你收集整理的java建立检索项语料库_日文分词器 Mecab 文档的全部内容,希望文章能够帮你解决java建立检索项语料库_日文分词器 Mecab 文档所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(40)

评论列表共有 0 条评论

立即
投稿
返回
顶部