如何生成自定义的逆向文件频率(IDF)文本语料库(二)
一、什么是IDF文本语料库在jieba的TF-IDF模型里面,当调用获取关键词的函数 jieba.analyse.extract_tags() 的时候,该函数会调用默认的IDF语料库。IDF语料库就是jieba官方在大量文本的基础上,通过计算得到的一个idf字典,其key为分词之后的每个词,其value为 每个词的IDF数值。二、计算自定义的IDF文本语料库程序流程如下...