当前位置: 首页 > article >正文

【自然语言处理】补充:布尔模型

【自然语言处理】补充:布尔模型

布尔检索是指针对查询的检索,布尔查询是指利用AND,OR或者NOT操作符将词项连接起来的查询,例如:信息AND检索、信息OR检索、信息AND检索AND NOT教材

  • Google的高级搜索/布尔查询
    • Google的AND—百度 “ 手机 报价 ”
    • Google的NOT—百度 “ 手机 - 报价 ”
    • Google的OR—百度 “ 手机 | 报价 ”

示例:莎士比亚的哪部剧本包含Brutus及Caesar但是不包含Calpurnia?布尔表达式为Brutus AND Caesar AND NOT Calpurnia。

  • 一般方法:

    • 从头到尾扫描所有剧本,对每部剧本判断它是否包含Brutus和Caesar,同时又不包含Calpurnia
    • 缺点:速度慢(特别是大型文档集);处理NOT Calpurnia并不容易(一旦包含即可停止判断);不太容易支持其它操作(eg,find the word Romans near countrymen);不支持检索结果的排序(即只返回较好的结果)
  • 词项-文档(term-doc)的关联矩阵
    在这里插入图片描述


http://www.kler.cn/news/312804.html

相关文章:

  • VMware Fusion虚拟机Mac版 安装Win10系统教程
  • 如何在Windows上安装Docker
  • centos 7.9安装k8s
  • SpringBoot开发-数据加密
  • 鸿蒙开发(NEXT/API 12)【同步读写流】远场通信服务
  • Kafka3.8.0+Centos7.9的安装参考
  • 如何确保Java程序分发后不被篡改?使用JNI对Java程序进行安全校验
  • Linux C# DAY3
  • 道路裂缝,坑洼,病害数据集-包括无人机视角,摩托车视角,车辆视角覆盖道路
  • 超级Prompt!
  • linux网络编程4
  • 定义可引用的 CI/CD 配置文件中的输入参数
  • 【笔记】自动驾驶预测与决策规划_Part3_路径与轨迹规划
  • 中国IT产业新挑战与机遇共存
  • 【使用Hey对vllm接口压测】模型并发能力
  • ATE自动化测试系统集成:软件与硬件的技术结合
  • 迭代器和生成器的学习笔记
  • JVM 运行时数据区详解(下)
  • Windows通过网线传文件
  • Spring Boot整合MyBatis Plus详解
  • 二级C语言2023-9易错题
  • 反游戏学(Reludology):概念、历史、现状与展望?(豆包AI版)
  • mac 怎么查看CPU核数
  • 通过UV快速计算品牌独立站网络流量
  • 【算法】BFS 系列之 多源 BFS
  • Unity之FPS
  • 谷粒商城のElasticsearch
  • 优先级队列(堆)
  • 行业分析---自动驾驶行业的发展
  • MySQL定长窗口SQL