我是靠谱客的博主 等待心锁,最近开发中收集的这篇文章主要介绍(12)Lucene、Nutch、ElasticSearch 关系,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

➢ 1998 年 9 月 4 日,Google 公司在美国硅谷成立。正如大家所知,它是一家做搜索引
擎起家的公司。
同时期,一位名叫 Doug Cutting 的美国工程师,也迷上了搜索引擎,他基于 Java 语
言开发了一个用于文本搜索的函数库(姑且理解为软件的功能组件),叫做 Lucene。
Lucene是第一个提供全文文本搜索的函数库, 提供了一个简单而强大的应用程序接口
是一个高性能、可伸缩的信息搜索库。作为一个成熟免费的开源项目,Lucene 在 Java
信息检索程序库中得到了广泛的欢迎。开发者不仅能利用它构建 具体的全文检索应用,
同时还能将其集成到各种系统软件中,它提供的很多 API 函数都能运用到各种实际应
用程序中。
Nutch 则是 Doug 在 Lucene 基础上将开源思想继续深化的成果, 是一个真正的应用
程序 ,它是建立在 Lucene 核心之上的 Web 搜索的实现,其目的旨在减少人们使用过
程中的复杂度,并在花费很少的情况下配置世界一流的 Web 搜索引擎,实现开箱即用
的特性。 站内索引和搜索推广到全球网络的搜索上,就像 Google 和雅虎一样。
ElasticSearch ,简称为 ES , ES 是一个开源的高扩展的分布式全文检索引擎,它可以近
乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处理 PB 级别
的数据。ES 也使用 Java 开发并使用 Lucene 作为其核心来实现所有索引和搜索的功能,
但是它的目的是通过简单的 RESTful API 来隐藏 Lucene 的复杂性,从而让全文搜索变
得简单。
思考:咱们之前讲的处理分词,构建倒排索引,等等,都是这个叫 Lucene 的做的。那么能
不能说这个 Lucene 就是搜索引擎呢?
还不能。Lucene 只是一个提供全文搜索功能类库的核心工具包,而真正使用它还需要
一个完善的服务框架搭建起来的应用。
好比 Lucene 是类似于发动机,而搜索引擎软件(ES,Solr)就是汽车。
目前市面上流行的搜索引擎软件,主流的就两款,ElasticSearch 和 Solr,这两款都是基
于 Lucene 的搭建的,可以独立部署启动的搜索引擎服务软件。由于内核相同,所以两者除
了服务器安装、部署、管理、集群以外,对于数据的操作,修改、添加、保存、查询等等都
十分类似。就好像都是支持 sql 语言的两种数据库软件。只要学会其中一个另一个很容易上
手。
从实际企业使用情况来看,ElasticSearch 的市场份额逐步在取代 Solr,国内百度、京东、
新浪都是基于 ElasticSearch 实现的搜索功能。国外就更多了,像维基百科、GitHub、Stack
Overflow 等等也都是基于 ES 的。

最后

以上就是等待心锁为你收集整理的(12)Lucene、Nutch、ElasticSearch 关系的全部内容,希望文章能够帮你解决(12)Lucene、Nutch、ElasticSearch 关系所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(52)

评论列表共有 0 条评论

立即
投稿
返回
顶部