使用spark的TF-IDF算法计算单词的重要性 使用spark的TF-IDF算法计算单词的重要性
使用spark的TF-IDF算法计算单词的重要性本文简单学习一下spark的TF-IDF算法的使用要计算每个单词的重要性,首先需要将单词分割,然后转换成数值型特征In [1]:from pyspark.ml.feature import HashingTF, IDF, TokenizersentenceData = s