当前位置: 首页 > article >正文

Es全文检索

全文检索

将非结构化数据中的一部分信息提取出来,重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目的。这部分从非结构化数据中提取出的然后重新组织的信息,我们称之索引。

例如:字典。字典的拼音表和部首检字表就相当于字典的索引,对每一个字的解释是非结构化的,如果字典没有音节表和部首检字表,在茫茫辞海中找一个字只能顺序扫描。然而字的某些信息可以提取出来进行结构化处理,比如读音,就比较结构化,分声母和韵母,于是将读音拿出来按一定的顺序排列,每一项读音都指向此字的详细解释的页数。我们搜索时按结构化的拼音搜到读音,然后按其指向的页数,便可找到我们的非结构化数据——也即对字的解释。

倒排索引结构

倒排索引结构也叫反向索引结构,包括索引和文档两部分,索引即词汇表,它的规模较小,而文档集合较大。


http://www.kler.cn/news/358169.html

相关文章:

  • 量化投资中的数据驱动决策:大数据如何改变金融市场
  • 学习文档(5)
  • oracle数据库名实例名服务名
  • 在wsl2下将Ubuntu从一个盘移动到其他盘
  • Android基于gradle task检查各个module之间资源文件冲突情况
  • 【27续】c++项目练习
  • 11-2.java面向对象练习:类的创建,类属性,实例化对象,方法调用
  • [STM32] 简单介绍 (一)
  • 【HarmonyOS NEXT】权限申请及应用设置页跳转
  • 用Java做智能客服,基于私有知识库
  • 云计算-----单机LNMP结构WordPress网站
  • ESP32设备——监测股票交易价格拨打电话提醒(后附代码)
  • 微前端学习以及分享
  • VMware 16 安装win,Win11推荐下载链接(不要选arm)
  • 让 AI 来使用计算机!Agent S:基于 GUI 的人机交互自动化解决方案
  • Java基础12-特殊文件和日志技术
  • git工具窗口使用命令
  • 2024年深圳福田区第十二届职工技能大比武职业技能竞赛圆满收官
  • LangGraph 源码分析 | BaseTool 模板类
  • Vue 文件类型声明