自然语言处理基于java实现(3) 之 信息检索
一. 题目如下 1、在小文档集合(199801.txt)中建立一个索引文件:每一行是一条term,每个term后面跟着一个索引记录表,包括:文档频率、文档序号(对文档序号进行排序);整个索引对term进行排序。 考虑:Term如何定义? 2、基于上述小文档集(199801.txt) ,建立一个位置索引文件。199801.txt文档集截图: 索引文件结果效果如下图: 索引文件表结构: