暴躁唇彩

文章
2
资源
0
加入时间
3年1月10天

Spark-基于scala实现文章特征提取(TF-IDF)

一.基本原理:    TF-IDF(term frequency–inverse document frequency):TF表示 词频,IDF表示 反文档频率.TF-IDF主要内容就是:如果一个词语在本篇文章出现的频率(TF)高,并且在其他文章出现少(即反文档频率IDF高),那么就可以认为这个词语是本篇文章的关键词,因为它具有很好的区分和代表能力.二.SparkML库:TF:HashingTF ...

Lombok 安装及入门

前言:    逛开源社区的时候无意发现的,用了一段时间,觉得还可以,特此推荐一下。    lombok 提供了简单的注解的形式来帮助我们简化消除一些必须有但显得很臃肿的 java 代码。特别是相对于 POJO,光说不做不是我的风格,先来看看吧。lombok 的官方网址:http://projectlombok.org/  lombok 其实到这里我就介绍完了,开个玩笑,其实