【Elasticsearch】内置分析器概述
内置分析器参考
Elasticsearch 随附了广泛类型的内置分析器,可以在任何索引中使用,无需进一步配置:
标准分析器
`standard`分析器根据 Unicode 文本分段算法定义的单词边界将文本划分为词条,会移除大部分标点符号,将词条转为小写,并支持移除停用词。
简单分析器
`simple`分析器在遇到非字母字符时将文本划分为词条,会将所有词条转为小写。
空白分析器
`whitespace`分析器在遇到任何空白字符时将文本划分为词条,不会将词条转为小写。
停用词分析器
`stop`分析器类似于`simple`分析器,但还支持移除停用词。
关键字分析器
`keyword`分析器是一个“无操作”分析器,它接受给定的任何文本,并将完全相同的文本作为单个词条输出。
模式分析器
`pattern`分析器使用正则表达式将文本划分为词条,支持小写化和停用词。
语言分析器
Elasticsearch 提供了许多语言特定的分析器,例如`english`或`french`。
指纹分析器
`fingerprint`分析器是一种专业分析器,它创建一个可用于重复检测的指纹。
如果你没有找到适合你需求的分析器,你可以创建一个`custom`自定义分析器,它将结合适当的字符过滤器、分词器和令牌过滤器。