当前位置: 首页 > article >正文

springboot集成guava布隆过滤器

1.创建springboot项目,引入maven依赖

		<dependency>
			<groupId>com.google.guava</groupId>
			<artifactId>guava</artifactId>
			<version>23.0</version>
		</dependency>

2.创建guava布隆过滤器

@Component
public class GuavaFilter {
    //初始化一个常量
    public static final int _1W = 10000;
    //初始化guava过滤器的容器容量
    public static final int SIZE = 100 * _1W;
    //误报率
    public static double  fpp = 0.03;  //误报率
    //创建一个guava过滤器
    public static BloomFilter bloomFilter = BloomFilter.create(Funnels.integerFunnel(),SIZE,fpp);


    //向guava过滤器中添加100万个数据
    //验证不在这100万数据之外的10万个数据的误判率
    @PostConstruct
    public void guavaFilter(){
        for(int i=1;i<=SIZE;i++){
            bloomFilter.put(i);
        }
        List<Integer> list = new ArrayList<>();
        for(int i = SIZE+1;i<SIZE+10*_1W;i++){
            if(bloomFilter.mightContain(i)){
                System.out.println(i + "被误识别了");
                list.add(i);
            }
        }
        System.out.println("误识别个数为:" + list.size());
    }
}

3.启动程序,观察结果

误识别的个数为3033个,误识别率3033/1000000≈0.03
在这里插入图片描述

4.对于误判率的思考

代码里配置的误判率为0.03,这里就会有小伙伴问,误判率(hash冲突概率)不应该越低越好吗,那我配置成0.01或者0.00000000001可以吗?
我们debug一下guava布隆过滤器的源码,点进去这个creat方法,断点打到如下图所示的位置
在这里插入图片描述
在这里插入图片描述
我们先看误报率配置0.03的情况
想要误报率控制在0.03,比特数组的位数需要达到7298440并且使用5种hash算法在这里插入图片描述
再看误报率配置0.01的情况
想要误报率控制在0.01,比特数组的位数需要达到9585058并且使用7种hash算法在这里插入图片描述

再看误报率配置0.00000000001的情况
想要误报率控制在0.00000000001,比特数组的位数需要达到52717821并且使用37种hash算法
在这里插入图片描述
当我们把误报率配置成0.00000000001,重新启动下程序
在这里插入图片描述

5.布隆过滤器的数据流向
在这里插入图片描述


http://www.kler.cn/news/290183.html

相关文章:

  • 24/9/3算法笔记 kaggle泰坦尼克
  • goalng http client的MaxIdleConnsPerHost,MaxIdleConns,MaxConnsPerHost参数设置总结
  • 鸿蒙模拟器篇
  • stream流常见方法
  • Spring Cloud Gateway之路由配置
  • 谷粒商城实战笔记-285~290-分布式事务
  • 设计模式 18 备忘录模式
  • LeetCode的高频SQL50题(基础版)学习笔记
  • 惠中科技RDS自清洁膜层:光伏领域的绿色革命
  • Spark MLlib模型训练—回归算法 Survival Regression
  • 【Selenium】Selenium运行时报cannot find Chrome binary错误的解决办吧
  • linux之网络子系统-MAC帧、数据报、段 的头部信息
  • 【C++】如何解决“pointer to incomplete class type is not allowed”。
  • 一篇文章讲清楚什么是Spring AOP
  • 从汇编角度分析C语言中的局部变量是如何产生的
  • pikachu文件包含漏洞靶场通关攻略
  • 运维管理体系及其实践要点:为高效运维保驾护航
  • zabbix通过OMSA监控Dell服务器_zabbix dell http
  • 为什么我会有使用gradle,需要花长时间去下载依赖?使用maven就不会有这种感受?
  • c++ websocket简单讲解
  • 大势智慧携“实景三维+AI”信创产品体系亮相2024中国地理信息产业大会
  • 详解 HTTPS 与 TLS证书链校验
  • 避坑之:深信服AC跨三层取MAC(核心交换机是锐捷S7808C_RGOS 11.0(4)B2P1)
  • 实验室ICPR 2024论文分享┆DS MYOLO:一种基于状态空间模型的驾驶场景可靠目标检测器
  • Edge资源占用优化:调整浏览器设置与关闭自动更新检查
  • 工业主板在轨道交通中的应用特点
  • 【网络】P2P打洞原理
  • 专项练习-数据思维-49题
  • PostgreSQL技术内幕4:PostgreSQL存储引擎内存管理
  • 使用udp进行通信