当前位置: 首页 > article >正文

Elasticsearch名词解释

文章目录

      • 1.什么是Elasticsearch?
      • 2.什么是elastic stack(ELK)?
      • 3.什么是Lucene?
      • 4.什么是文档(document)?
      • 5.什么是词条(term)?
      • 6.什么是正向索引?
      • 7.什么是倒排索引?
      • 8.ES中的索引(index)
      • 9.映射(Mapping)
      • 10.DSL
      • 11.elastcisearch与mysql的关系(读写分离)
      • 12.Elasticsearch目录介绍
      • 13.ES默认的两个端口
      • 14.如何解决ES跨域问题
      • 15.Kibana默认端口和启动文件
      • 16.Kibana汉化
      • 17.什么是IK分词器?
      • 18.IK分词器的两种分词算法
      • 19.IK分词器扩展词条,停用词条
      • 20.ES的默认分词器

基于Elasticsearch-7.15.1,需要安装jdk8 或者jdk11支持

1.什么是Elasticsearch?

一个开源的分布式搜索引擎,通过Restful方式进行交互的近实时搜索平台框架,可以用来实现搜索、日志统计、分析、系统监控等功能,

2.什么是elastic stack(ELK)?

是以elasticsearch为核心的技术栈,包括(beats,(L)Logstash)数据抓取,((K)kibana)数据可视化,((E)elasticsearch)存储、计算、搜索数据

3.什么是Lucene?

java语言的搜索引擎类库,提供了搜索引擎的核心API,elasticsearch就是基于Lucene开发的

4.什么是文档(document)?

每一条数据就是文档,相当于mysql中的一条记录,但是ES中的文档是json格式的,文档中的字段成为Field,相当于mysql中的列Column

5.什么是词条(term)?

对文档中的内容进行分词,得到的词语就是词条

6.什么是正向索引?

基于文档id创建索引,查询词条的时候先找到文档,后判断文档是否包含词条

7.什么是倒排索引?

对文档的内容进行分词,对词条创建索引,查询时根据词条查询文档id,而后获得文档

8.ES中的索引(index)

相同类型的文档(json格式)集合,相当于mysql中的表(相同数据的集合)

9.映射(Mapping)

ES索引中文档的约束

10.DSL

DSL是elasticsearch提供的json风格的请求语句,就是操作ES,实现增删改查,相当于mysql中的sql语句

11.elastcisearch与mysql的关系(读写分离)

数据库负责事务类型的操作,可以确保数据的原子性、一致性、隔离性、持久性

擅长海量数据的搜索、分析、计算(针对业务量大、搜索需求比较复杂)

12.Elasticsearch目录介绍

bin/elasticsearch.bat:启动文件

config/log4j2:日志配置文件

config/jvm.options:虚拟机相关的配置

config/elasticsearch.yml:ES的配置文件!默认端口!跨域!

lib:相关jar包

logs:日志目录

modules:功能模块目录

data:数据目录

plugins:插件目录

13.ES默认的两个端口

9200:客户端使用

9300:集群内部通信

14.如何解决ES跨域问题

找到config/elasticsearch.yml文件

http.cors.enabled: true

http.cors.allow-origin: “*”# 也可以指定具体的允许来源

15.Kibana默认端口和启动文件

5601

bin/kibana.bat

默认会指向9200从而操作ES

16.Kibana汉化

x-pack/plugins/translations/translations/zh-CN.json

修改:config/kibana.yml --> i18n.locale: “zh-CN”

17.什么是IK分词器?

把一个一个中文划分成一个一个的关键字,如果使用中文,建议使用IK分词器,下载ik分词器之后,在ES的plugins目录解压放入ik目录,重启即可

在bin目录下打开命令行,执行elasticsearch-plugin list可以查看加载进来的插件

18.IK分词器的两种分词算法

ik_smart:最少切分,粗粒度

ik_max_word:最细粒度切分

19.IK分词器扩展词条,停用词条

当词典没有自己需要的词的时候就可以自己添加词语,例如"白嫖"

进入IK分词器的config/IKAnalyzer.cfg.xml文件更改配置

my.dic

mystop.dic

my.dic、mystop.dic就是自己在config目录下新建的词条文件

20.ES的默认分词器

standard分词器:默认的分词规则对中文处理并不友好


http://www.kler.cn/a/465071.html

相关文章:

  • 基于物联网疫苗冷链物流监测系统设计
  • 「Mac畅玩鸿蒙与硬件49」UI互动应用篇26 - 数字填色游戏
  • FPGA、STM32、ESP32、RP2040等5大板卡,结合AI,更突出模拟+数字+控制+算法
  • 以往博客的复习补充——part1
  • FPGA基本语法与使用
  • Leetcode打卡:我的日程安排表III
  • 基于深度学习的视觉检测小项目(三) 通过设计一个简单的用户界面设计了解pyside的基本套路
  • C# 设计模式(结构型模式):适配器模式
  • Redis 入门与实战指南
  • 自动化测试之Pytest框架(万字详解)
  • 迈向云原生网络的初期
  • web期末作业网页设计实例代码 (建议收藏) HTML+CSS+JS (网页源码)
  • Rdis速通
  • 本地部署Whisper Web结合内网穿透实现远程访问本地语音转文本模型
  • 大模型在自动驾驶领域的应用和存在的问题
  • vuepress 项目支持ie运行
  • Flutter入门,Flutter基础知识总结。
  • 跨语言数据格式标准化在 HarmonyOS 开发中的实践
  • 详细教程:SQL2008数据库备份与还原全流程!
  • 【SQL server】教材数据库(7)
  • JAVA-制作小游戏期末实训
  • Python PySide + SQLite3 开发的 《️ POS点销管理系统》可用初型
  • Postman[8] 断言
  • edeg插件/扩展推荐:助力生活工作
  • 【视频笔记】基于PyTorch从零构建多模态(视觉)大模型 by Umar Jamil【持续更新】
  • CM3/CM4时钟系统