TF-IDF词频逆文档频率算法
一.简介 1.RF-IDF【term frequency-inverse document frequency】是一种用于检索与探究的常用加权技术。 2.TF-IDF是一种统计方法,用于评估一个词对于一个文件集或一个语料库中的其中一个文件的重要程度。 3.词的重要性随着它在文件中出现的次数的增加而增加,但同时也会随着它在语料库中出现的频率的升高而降低。二.词频 指的是某...