义气镜子

文章
7
资源
1
加入时间
2年10月17天

ElasticSearch29:初识搜索引擎_分词器的内部组成到底是什么以及内置分词器的介绍

1.分词器的内部组成什么是分词器:切分词语,normalization(提升recall召回率)给你一段句子,然后将这段句子拆分成一个一个的单词,同时对每个的单词进行normalization(时态转换,单复数转换等),分词器recall召回率:搜索的时候,增加能够搜索到的结果的数量分为三个部分character filter,过滤,在一段文本分词之前,先进行预处理,如过滤html标签123转换未