spark计算用户访问学科子网页的top3
项目说明:附件为要计算数据的demo。点击打开链接利用spark的缓存机制,读取需要筛选的数据,自定义一个分区器,将不同的学科数据分别放到一个分区器中,并且根据指定的学科,取出点击量前三的数据,并写入文件。具体程序如下:1、项目主程序:package cn.allengao.Location import java.net.URL ...