高大星星

文章
5
资源
0
加入时间
2年10月17天

基于pagerank算法的运用Hbase的搜索引擎(2)——获得关键字篇

提取每个页面的关键字,主要思路,因为p列族下的t列数据不是很准确这里可以使用每个页面入链接标签中的内容作为每个页面的主题内容即为关键字,即 把拔取下来的数据html中的< a> xxxx< /a> 的xxx作为搜索的关键字。代码如下:import java.io.IOException;import java.util.Arrays;import java.u...

kali更新时出现无法安全地用该源进行更新,所以默认禁用该源。

kali更新时无法安全地用该源进行更新,所以默认禁用该源。先附上各种源 (其实系统本身就自带了更新源,去掉其注释也是可以的,现在官方源的下载速度也还ok,下面的三选一亦可) #清华大学 [更新源]deb http://mirrors.tuna.tsinghua.edu.cn/kali kali-rolling main contrib non-free deb-s...

FilenameUtils常用的方法

/** * getExtension * 获取文件的后缀名 */ public static void testGetExtension() { String extension = FilenameUtils.getExtension("D:"+File.separator+"data.txt"); System.out.println(extension); } ...