我是靠谱客的博主 平常手链,最近开发中收集的这篇文章主要介绍ES入门系列 — 2 Elasticsearch介绍,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

简单写一个ES系列,希望对NewSql、检索有兴趣的同学可以快速入手,争取在7月份完成该系列文章

 

ES入门系列

  • ES入门系列 — 1 windows系统安装Elasticsearch
  • ES入门系列 — 2 Elasticsearch介绍
  • ES入门系列 — 3 走进elasticsearch
  • ES入门系列 — 4 索引

搜索已经无时无刻在互联网存在,很典型的就是Google、百度之类的综合搜索,几乎作为每个普通网民还是IT从事人员,几乎每天都在和综合搜索打交道,通过搜索你可以触及你想要的信息,这是一种可以是业内最普遍的信息主动链接的方式。相比于复杂的综合搜索,还有一类就是垂直搜索(当前垂直搜索也是很复杂的)

相比综合搜索,垂直搜索从信息内容上更加专一,比如上图淘宝网的搜索,那么搜索的就是商品信息。很明显,你在上面肯定搜不到楼主的这篇博客的(或许有一天淘宝有这样诉求呢。。。当前不可能的),那么很多中小公司的垂直搜索用的就是Elasticseach实现的了(当然淘宝这样的公司在搜索引擎上是会有自己的产品支持),比如很多博客系统,你搜索时候输入文章里面的一个特定短语,可以搜到包含这个短语或近似的相关博客,之类还有UGC、PGC、电商、门户、物流、内容分发类等等系统

 


Elasticsearch 的用途是什么?

Elasticsearch 在速度和可扩展性方面都表现出色,而且还能够索引多种类型的内容,这意味着其可用于多种用例:

  • 应用程序搜索
  • 网站搜索
  • 企业搜索
  • 日志处理和分析
  • 基础设施指标和容器监测
  • 应用程序性能监测
  • 地理空间数据分析和可视化
  • 安全分析
  • 业务分析

 


Elasticsearch 的工作原理是什么?

原始数据会从多个来源(包括日志、系统指标和网络应用程序)输入到 Elasticsearch 中。数据采集指在 Elasticsearch 中进行索引之前解析、标准化并充实这些原始数据的过程。这些数据在 Elasticsearch 中索引完成之后,用户便可针对他们的数据运行复杂的查询,并使用聚合来检索自身数据的复杂汇总。在 Kibana 中,用户可以基于自己的数据创建强大的可视化,分享仪表板,并对 Elastic Stack 进行管理。

 


Elasticsearch 索引是什么?

Elasticsearch 索引指相互关联的文档集合。Elasticsearch 会以 JSON 文档的形式存储数据。每个文档都会在一组(字段或属性的名称)和它们对应的值(字符串、数字、布尔值、日期、数值组、地理位置或其他类型的数据)之间建立联系。

Elasticsearch 使用的是一种名为倒排索引的数据结构,这一结构的设计可以允许十分快速地进行全文本搜索。倒排索引会列出在所有文档中出现的每个特有词汇,并且可以找到包含每个词汇的全部文档。

在索引过程中,Elasticsearch 会存储文档并构建倒排索引,这样用户便可以近实时地对文档数据进行搜索。索引过程是在索引 API 中启动的,通过此 API 您既可向特定索引中添加 JSON 文档,也可更改特定索引中的 JSON 文档。

 


为何使用 Elasticsearch?

Elasticsearch 很快。 由于 Elasticsearch 是在 Lucene 基础上构建而成的,所以在全文本搜索方面表现十分出色。Elasticsearch 同时还是一个近实时的搜索平台,这意味着从文档索引操作到文档变为可搜索状态之间的延时很短,一般只有一秒。因此,Elasticsearch 非常适用于对时间有严苛要求的用例,例如安全分析和基础设施监测。

Elasticsearch 具有分布式的本质特征。 Elasticsearch 中存储的文档分布在不同的容器中,这些容器称为分片,可以进行复制以提供数据冗余副本,以防发生硬件故障。Elasticsearch 的分布式特性使得它可以扩展至数百台(甚至数千台)服务器,并处理 PB 量级的数据。

Elasticsearch 包含一系列广泛的功能。 除了速度、可扩展性和弹性等优势以外,Elasticsearch 还有大量强大的内置功能(例如数据汇总和索引生命周期管理),可以方便用户更加高效地存储和搜索数据。

Elastic Stack 简化了数据采集、可视化和报告过程。 通过与 Beats 和 Logstash 进行集成,用户能够在向 Elasticsearch 中索引数据之前轻松地处理数据。同时,Kibana 不仅可针对 Elasticsearch 数据提供实时可视化,同时还提供 UI 以便用户快速访问应用程序性能监测 (APM)、日志和基础设施指标等数据。

 


OK,对Elasticsearch的介绍就到这里,对elasticsearch有个简单的认识就可以了,这东西是做搜索用的,分布式(可扩展),很快(不到1秒)、数据采集等等

 

欢迎关注,欢迎订阅,楼主努力更新中

 

最后

以上就是平常手链为你收集整理的ES入门系列 — 2 Elasticsearch介绍的全部内容,希望文章能够帮你解决ES入门系列 — 2 Elasticsearch介绍所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(71)

评论列表共有 0 条评论

立即
投稿
返回
顶部