当前位置: 首页 > article >正文

WordShield 一款轻量级且灵活的敏感词过滤库

简介

WordShield 是一款轻量级且灵活的敏感词过滤库,基于 Spring Boot 构建。它提供了简单易用的 API,用于过滤和管理敏感词汇。

特性

敏感词过滤:自动过滤字符串中的敏感词汇。
默认敏感词列表:内置预设的敏感词列表。
可定制敏感词列表:支持从指定路径加载自定义敏感词列表。
动态管理:允许动态添加或移除敏感词。
Spring Boot 集成:自动在应用上下文中注册 SensitiveWordFilter Bean。

快速开始

准备工作

Java 8 或更高版本
Spring Boot 2.x 或更高版本
Maven 或 Gradle

添加依赖

Maven
在 pom.xml 文件中添加以下依赖:

<dependency>
    <groupId>io.github.avidbyte</groupId>
    <artifactId>wordshield</artifactId>
    <version>1.0.0</version>
</dependency>

Gradle
在 build.gradle 文件中添加以下依赖:

dependencies {
    implementation 'io.github.avidbyte:wordshield:1.0.0'
}

使用方法

初始化过滤器
添加依赖后,SensitiveWordFilter Bean 会被自动注册。您可以在服务类中直接使用它:

import io.github.avidbyte.wordshield.SensitiveWordFilter;

@Slf4j
@Service
public class ContentService {

    private final SensitiveWordFilter sensitiveWordFilter;

    public ContentService(SensitiveWordFilter sensitiveWordFilter) {
        this.sensitiveWordFilter = sensitiveWordFilter;
    }

    public String filterContent(String content) {
        SensitiveWordResult sensitiveWordResult = sensitiveWordFilter.checkAndFilter(content, "*");
        log.info("文本: {} 是否是敏感词: {}", content, sensitiveWordResult.isContainsSensitiveWord());
        log.info("文本: {} 敏感词处理结果: {}", content, sensitiveWordResult.getFilteredText());
    }
}

自定义敏感词列表

默认情况下,库会加载预设的敏感词列表。不过,您也可以通过提供文件路径来自定义敏感词列表:

在 application.yml 配置

sensitive:
  word:
    loadDefault: false
    source: file
    filePath: /opt/sensitive_word.txt

loadDefault 为 true, wordshield 会先加载预设的敏感词列表, 如果不希望使用预设的敏感词列表, 就将 loadDefault 设置为 false

其他数据来源: database, api, etc. 可以通过这种方式加载

sensitive:
  word:
    loadDefault: false
    source: database

当前配置 wordshield 不会加载预设的敏感词, 敏感词库完全是空的, 需要使用者自己调用新增敏感词的方法构造敏感词库
通过这四个方法也可以动态地管理敏感词列表

import io.github.avidbyte.wordshield.SensitiveWordFilter;

@Service
public class ContentService {

    private final SensitiveWordFilter sensitiveWordFilter;

    public ContentService(SensitiveWordFilter sensitiveWordFilter) {
        this.sensitiveWordFilter = sensitiveWordFilter;
    }

    public String addSensitiveWords(List<String> words) {
        sensitiveWordFilter.addSensitiveWords(words);
    }

    public String addSensitiveWord(String word) {
        sensitiveWordFilter.addSensitiveWord(word);
    }

    public String removeSensitiveWords(List<String> words) {
        sensitiveWordFilter.removeSensitiveWords(words);
    }

    public String removeSensitiveWord(String word) {
        sensitiveWordFilter.removeSensitiveWord(word);
    }
    
}


http://www.kler.cn/a/288019.html

相关文章:

  • 抓包之使用抓包来验证TCP三次握手
  • 基于微信小程序的智能停车场管理系统设计与实现(LW+源码+讲解)
  • 软件工程和项目管理领域 - CMMI 极简理解
  • Linux(Centos 7.6)命令详解:split
  • 统计有序矩阵中的负数
  • MySQL 与 Redis 的数据一致性问题
  • 【论文阅读】语义通信安全研究综述(2024)
  • Xinstall赋能,H5与App完美融合,打造极致用户体验
  • 关于武汉芯景科技有限公司的多协议收发芯片XJ3160开发指南(兼容MAX3160)
  • react 样式和vue样式的区别
  • Fabric.js TextBox揭秘:splitByGrapheme属性实现文本自然换行
  • Android使用IntentService
  • JavaScript初级——Navigatior
  • 《从C/C++到Java入门指南》- 25.final 关键字
  • 跨地域工作利器:深度解析2024年远程控制软件的新特性
  • 力扣SQL仅数据库(1068~1084)
  • 做数据爬虫工作:是否需要准备单独的IP库和爬虫库?
  • ADAS---基于检测框的单目测距方法
  • 微服务--认识微服务
  • 在线压缩pdf,无需安装就可轻易压缩pdf文件
  • 双线服务器与BGP服务器的区别?
  • 文件上传的学习
  • node版本切换
  • 关于contextmenu-ui组件库
  • Ceph集群维护相关操作
  • 5.注册中心的其他实现-Nacos